КРИТЕРИЙ МАННА-УИТНИ: ОБЩАЯ ИДЕЯ, ПРИМЕРЫ
Критерий Манна-Уитни - ранговый критерий для сравнения выборок данных и проверки их однородности на значимость различий выбранного признака. Этот признак может быть измерен по интервальной, порядковой шкале или шкале отношений. Применение критерия Манна-Уитни относится к методам непараметрической статистики, которая исследует качественные, а не количественные свойства выборок.
Для вычисления значений критерия Манна-Уитни (называемого также U-критерием) данные выборок предварительно требуется упорядочить по возрастанию интересующего признака, а значения этого признака - пронумеровать, то есть присвоить им ранги.
Популярное средство для статистической обработки данных Excel не обладает функциями, позволяющими работать с критерием Манна-Уитни. Весьма эффективно применять этот метод позволяет пакет программных средств STATISTICA, а также языки программирования Python и R в профессиональных средах разработки.
На этой странице после рассмотрения примеров содержится форма обратной связи для заказа услуги проверки однородности выборок. Доверьте проведение этой работы профессионалу в сфере статистической обработки данных.
Общая идея
Для каждой выборки вычисляется показатель Ui (i=1, 2):
,
где
n1 и n2 - объемы соответствующих выборок,
Ri - сумма индивидуальных рангов в выборке: .
Для проверки гипотезы следует рассчитать значение U для каждой выборки и меньшее значение сравнить с критическим значением U, таблица которых есть в справочниках по статистике, или которое находит программа, выполняющая анализ. Если меньшее значение критерия больше критического значения, то выборки однородны, то есть различия интересующего нас признака незначимы (не существенны). Если меньше, то различия признака существенны и, таким образом, выборки неоднородны.
Примеры
Пример 1. Есть сеть магазинов, расположенных в разных районах. Используя критерий Манна-Уитни, определим, значимы ли различия минимального чека в магазинах района А и в магазинах районов Б и В.
Район | Магазин | Минимальный чек | Rij |
А | 1 | 88,94 | 1 |
А | 2 | 96,74 | 2 |
Б | 8 | 98,19 | 3 |
А | 3 | 99,3 | 4 |
В | 13 | 102,84 | 5 |
Б | 9 | 103,7 | 6 |
В | 14 | 103,93 | 7 |
Б | 10 | 106,96 | 8 |
Б | 11 | 110,05 | 9 |
Б | 12 | 110,39 | 10 |
А | 4 | 110,57 | 11 |
А | 5 | 113,98 | 12 |
А | 6 | 123,58 | 13 |
В | 15 | 126,72 | 14 |
В | 16 | 134,82 | 15 |
В | 17 | 153,6 | 16 |
А | 7 | 216,28 | 17 |
По данным из приведенных таблиц можем вычислить показатели U1 и U2:
,
,
где
и .
Наименьшее значение критерия U1=32 сравним с критическим значением Uα(2);n1;n2=U0,01;7;10=9.
Так как полученное по нашим вычислениям наименьшее значение критерия больше критического, различия минимального чека в магазинах района А и в районах Б и В не значимы (не существенны).
Пример 2. Используя критерий Манна-Уитни, определим, значимы ли различия минимального чека в магазинах района Г и в магазинах районов Б и В.
Район | Магазин | Минимальный чек | Rij |
Г | 18 | 80,18 | 1 |
Г | 19 | 85,25 | 2 |
Г | 20 | 85,93 | 3 |
Г | 21 | 89,36 | 4 |
Г | 22 | 91,56 | 5 |
Г | 23 | 97,28 | 6 |
Б | 8 | 98,19 | 7 |
Г | 24 | 98,59 | 8 |
В | 13 | 102,84 | 9 |
Б | 9 | 103,7 | 10 |
В | 14 | 103,93 | 11 |
Г | 25 | 105,65 | 12 |
Г | 26 | 106,41 | 13 |
Б | 10 | 106,96 | 14 |
Б | 11 | 110,05 | 15 |
Б | 12 | 110,39 | 16 |
В | 15 | 126,72 | 17 |
В | 16 | 134,82 | 18 |
В | 17 | 153,6 | 19 |
По данным из приведенных таблиц можем вычислить показатели U1 и U2:
,
,
где
и .
Наименьшее значение критерия U2=9 сравним с критическим значением Uα(2);n1;n2=U0,01;9;10=13.
Так как полученное по нашим вычислениям наименьшее значение критерия меньше критического, различия минимального чека в магазинах района Г и в районах Б и В значимы (существенны).
Немного о специалисте
Я - автор проекта "Чистая" и прикладная математика" function-x.ru Юрий Зубков. Проведу сравнение выборок из Ваших данных с использованием пакета программных средств STATISTICA или языков программирования Python или R.
Имею опыт в решении задач анализа социально-экономических процессов, которые трудно поддаются математической формализации.
Один рабочий день стоит 3000 рублей. Оплата через Webmoney или на карту Mastercard.