Как найти моду и медиану выборки
Мода для дискретного и интервального рядов распределения
Мода и медиана во многих случаях оказываются ближе к типичному значению выборки, чем среднее значение. Различают определение моды и медианы для дискретного вариационного ряда и для интервального ряда.
Мода - это значение, имеющее в ряду распределения наибольшую частоту, то есть, встречающееся чаще других. Моду используют, чтобы исследовать спрос населения на различные товары (например, на обувь или одежду), когда необходимо установить размер, на который отмечен наибольший спрос.
Практический расчет моды зависит от того, для какого ряда распределения она расчитывается: для дискретного или интервального. Для дискретного ряда моду не нужно вычислять: достаточно найти значение, имеющее наибольшую частоту. В некоторых случаях с одинаковой высокой частотой в выборке встречаются два или даже больше значений. Например, если объединить в одну выборку данные обо всех проданных мужских и женских жакетах, то очень возможно, что встрется два наиболее распространенных размера - две моды. Одна из них характеризует самый распространенный размер мужского жакета, другая - женского.
Пример 1. В таблице содержатся данные о распределении домашних хозяйств некоторой территории по числу комнат в жилище. Это дискретный ряд распределения.
Все | В том числе | ||
В городах | На селе | ||
Все | 100,0 | 100,0 | 100,0 |
1 комната | 21,0 | 21,5 | 19,8 |
2 комнаты | 44,2 | 46,9 | 37,7 |
3 комнаты и более | 34,8 | 31,6 | 42,5 |
В городских домашних хозяствах в жилище чаще всего 2 комнаты и, таким образом, мода для них Mo=2. В сельских домашних хозяйствах в жилище чаще всего 3 комнаты и больше и, таким образом, мода для них Mo=3. Для всех домашних хозяйств мода Mo=2.
Для интервального ряда распределения мода рассчитывается по формуле
,
где
M0 - мода;
X0 - нижняя граница модального интервала (интервала с наибольшей частотой);
Δ - ширина модального интервала;
fmo - частота модального интервала;
fmo-1 - частота предмодального интервала;
fmo+1 - частота послемодального интервала.
Пример 2. В таблице содержатся данные о заработной плате и числе занятых на предприятии N. Это интервальный ряд распределения. Найти моду заработной платы.
Заработная плата, у.е. | Занятых | Накопленные частоты | ||
чел. | % | абсолютные | относительные | |
18000-22000 | 10 | 10,3 | 10 | 10,3 |
22000-35000 | 28 | 28,9 | 38 | 39,2 |
35000-45000 | 25 | 25,8 | 63 | 65,0 |
45000-60000 | 18 | 18,5 | 81 | 83,5 |
60000-80000 | 13 | 13,4 | 94 | 96,9 |
80000 и более | 3 | 3,1 | 97 | 100,0 |
Найдём моду заработной платы, используя абсолютные показатели:
Найдём моду заработной платы, используя относительные показатели:
Как видим, результаты совпадают.
Медиана для дискретного и интервального рядов распределения
Медиана - это численная величина признака для варианта, находящегося в середине ранжированного ряда распредения. Ранжированный ряд - такой ряд, в котором все варианты упорядочены в порядке возрастания или убывания.
Медиана делит ряд распределения на две одинаковые части: слева о медианы находятся все варианты, которые меньше медианы, а справа - больше неё.
Перед вычислением медианы нужно узнать порядковый номер медианного значения.
Для дискретного ряда порядковый номер медианного значения находят, прибавляя к числу вариантов в ряду единицу, и деля результат на 2:
.
Для выборки с нечётным числом вариантов медианное значение будет значением варианта, находящегося ровно посередине ранижированного ряда, а для выборки с чётным числом варианта - средним арифметическим двух серединных вариантов.
Пример 3. В таблице данные о весе 20 проданных за день арбузов. Найти медиану веса.
Nr. | Вес, кг | Nr. | Вес, кг. |
1 | 0,530 | 11 | 1,840 |
2 | 0,780 | 12 | 1,960 |
3 | 1,110 | 13 | 2,220 |
4 | 1,120 | 14 | 2,270 |
5 | 1,340 | 15 | 2,310 |
6 | 1,420 | 16 | 2,360 |
7 | 1,460 | 17 | 2,380 |
8 | 1,560 | 18 | 2,420 |
9 | 1,670 | 19 | 2,530 |
10 | 1,720 | 20 | 2,580 |
Так как число вариантов 20 - чётное, медиану веса находим как средее арифметическое 10-го и 11-го вариантов:
.
Для интервального ряда распределения медиана рассчитывается по формуле
,
где
Me - медиана;
Δ - ширина медианного интервала (интервала, находящегося посередине);
X0 - нижняя граница медианного интервала;
Σf - сумма членов ряда распределения;
Sf me-1 - накопленная частота домедианного интервала;
fme - частота медианного интервала.
Пример 4. Таблица из примера 2. Найти медиану заработной платы.
Заработная плата, у.е. | Занятых | Накопленные частоты | ||
чел. | % | абсолютные (Sf) | относительные (Sw) |
|
18000-22000 | 10 | 10,3 | 10 | 10,3 |
22000-35000 | 28 | 28,9 | 38 | 39,2 |
35000-45000 | 25 | 25,8 | 63 | 65,0 |
45000-60000 | 18 | 18,5 | 81 | 83,5 |
60000-80000 | 13 | 13,4 | 94 | 96,9 |
80000 и более | 3 | 3,1 | 97 | 100,0 |
Найдём медиану, используя абсолютные показатели:
Найдём медиану, используя относительные показатели:
.
Назад<<< | Листать | Вперёд>>> |