Mann–Whitney U test
Материал из Поле цифровой дидактики
Версия от 12:34, 23 октября 2024; Patarakin (обсуждение | вклад)
Описание | U-критерий Манна — Уитни (англ. Mann–Whitney U test) — статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками. |
---|---|
Область знаний | Статистика |
Авторы | Mann–Whitney–Wilcoxon |
Поясняющее видео | |
Близкие понятия | Эксперимент, Статистический критерий |
Среды и средства для освоения понятия |
Использование критерия
Для применения U-критерия Манна — Уитни нужно произвести следующие операции.
- Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг (при наличии повторяющихся элементов в выборке использовать средний ранг). Общее количество рангов получится равным [math]\displaystyle{ N = n_1 + n_2, }[/math] где [math]\displaystyle{ n_1 }[/math] — количество элементов в первой выборке, а [math]\displaystyle{ n_2 }[/math] — количество элементов во второй выборке.
- Разделить единый ранжированный ряд на два, состоящих соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки [math]\displaystyle{ R_1 }[/math], и отдельно — на долю элементов второй выборки [math]\displaystyle{ R_2 }[/math], затем вычислить:
[math]\displaystyle{ U_1 = n_1 \cdot n_2 + \frac{n_1 \cdot (n_1 + 1)}{2} - R_1 }[/math],
[math]\displaystyle{ U_2 = n_1 \cdot n_2 + \frac{n_2 \cdot (n_2 + 1)}{2} - R_2 }[/math],
если всё вычислено верно, то
[math]\displaystyle{ U_1+U_2=n_1\cdot n_2. }[/math], - Определить значение U-статистики Манна-Уитни по формуле [math]\displaystyle{ U = \min\{U_1, U_2\}. }[/math]
- По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных [math]\displaystyle{ n_1 }[/math] и [math]\displaystyle{ n_2 }[/math]. Если полученное значение [math]\displaystyle{ U }[/math] меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение [math]\displaystyle{ U }[/math] больше табличного, принимается нулевая гипотеза. Достоверность различий тем выше, чем меньше значение [math]\displaystyle{ U }[/math].
- При справедливости нулевой гипотезы критерий имеет математическое ожидание [math]\displaystyle{ M(U) = n_1 n_2 / 2 }[/math] и дисперсию [math]\displaystyle{ D(U) = n_1 n_2 (n_1 + n_2 + 1) / 12 }[/math] и при достаточно большом объёме выборочных данных [math]\displaystyle{ (n_1 \gt 19, n_2 \gt 19) }[/math] распределён практически нормально.