Mann–Whitney U test: различия между версиями
Материал из Поле цифровой дидактики
Patarakin (обсуждение | вклад) Нет описания правки |
Patarakin (обсуждение | вклад) Нет описания правки |
||
| Строка 9: | Строка 9: | ||
# Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг (при наличии повторяющихся элементов в выборке использовать средний ранг). Общее количество рангов получится равным <math>N = n_1 + n_2,</math> где <math>n_1</math> — количество элементов в первой выборке, а <math>n_2</math> — количество элементов во второй выборке. | # Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг (при наличии повторяющихся элементов в выборке использовать средний ранг). Общее количество рангов получится равным <math>N = n_1 + n_2,</math> где <math>n_1</math> — количество элементов в первой выборке, а <math>n_2</math> — количество элементов во второй выборке. | ||
# Разделить единый ранжированный ряд на два, состоящих соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки <math>R_1 </math>, и отдельно — на долю элементов второй выборки <math>R_2 </math>, затем вычислить:<blockquote><math>U_1 = n_1 \cdot n_2 + \frac{n_1 \cdot (n_1 + 1)}{2} - R_1 </math>,<br><math>U_2 = n_1 \cdot n_2 + \frac{n_2 \cdot (n_2 + 1)}{2} - R_2 </math>,<br> если всё вычислено верно, то<br><math>U_1+U_2=n_1\cdot n_2. </math>,</blockquote> | # Разделить единый ранжированный ряд на два, состоящих соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки <math>R_1 </math>, и отдельно — на долю элементов второй выборки <math>R_2 </math>, затем вычислить:<blockquote><math>U_1 = n_1 \cdot n_2 + \frac{n_1 \cdot (n_1 + 1)}{2} - R_1 </math>,<br><math>U_2 = n_1 \cdot n_2 + \frac{n_2 \cdot (n_2 + 1)}{2} - R_2 </math>,<br> если всё вычислено верно, то<br><math>U_1+U_2=n_1\cdot n_2. </math>,</blockquote> | ||
# Определить значение U-статистики Манна-Уитни по формуле <math>U = \min\{U_1, U_2\}.</math> | # Определить значение U-статистики [[Манна-Уитни]] по формуле <math>U = \min\{U_1, U_2\}.</math> | ||
# По таблице для избранного [[Статистическая значимость|уровня статистической значимости]] определить критическое значение критерия для данных <math>n_1</math> и <math>n_2</math>. Если полученное значение <math>U</math> ''меньше'' табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается [[альтернативная гипотеза]]). Если же полученное значение <math>U</math> больше табличного, принимается [[нулевая гипотеза]]. Достоверность различий тем выше, чем меньше значение <math>U</math>. | # По таблице для избранного [[Статистическая значимость|уровня статистической значимости]] определить критическое значение критерия для данных <math>n_1</math> и <math>n_2</math>. Если полученное значение <math>U</math> ''меньше'' табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается [[альтернативная гипотеза]]). Если же полученное значение <math>U</math> больше табличного, принимается [[нулевая гипотеза]]. Достоверность различий тем выше, чем меньше значение <math>U</math>. | ||
# При справедливости [[нулевая гипотеза|нулевой гипотезы]] критерий имеет [[математическое ожидание]] <math>M(U) = n_1 n_2 / 2</math> и [[Дисперсия случайной величины|дисперсию]] <math>D(U) = n_1 n_2 (n_1 + n_2 + 1) / 12</math> и при достаточно большом объёме выборочных данных <math>(n_1 > 19, n_2 > 19)</math> распределён практически нормально. | # При справедливости [[нулевая гипотеза|нулевой гипотезы]] критерий имеет [[математическое ожидание]] <math>M(U) = n_1 n_2 / 2</math> и [[Дисперсия случайной величины|дисперсию]] <math>D(U) = n_1 n_2 (n_1 + n_2 + 1) / 12</math> и при достаточно большом объёме выборочных данных <math>(n_1 > 19, n_2 > 19)</math> распределён практически нормально. | ||
Текущая версия от 11:46, 16 декабря 2025
| Описание | U-критерий Манна — Уитни (англ. Mann–Whitney U test) — статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками. |
|---|---|
| Область знаний | Статистика |
| Авторы | Mann–Whitney–Wilcoxon |
| Поясняющее видео | |
| Близкие понятия | Эксперимент, Статистический критерий |
| Среды и средства для освоения понятия |
Использование критерия
Для применения U-критерия Манна — Уитни нужно произвести следующие операции.
- Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг (при наличии повторяющихся элементов в выборке использовать средний ранг). Общее количество рангов получится равным [math]\displaystyle{ N = n_1 + n_2, }[/math] где [math]\displaystyle{ n_1 }[/math] — количество элементов в первой выборке, а [math]\displaystyle{ n_2 }[/math] — количество элементов во второй выборке.
- Разделить единый ранжированный ряд на два, состоящих соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки [math]\displaystyle{ R_1 }[/math], и отдельно — на долю элементов второй выборки [math]\displaystyle{ R_2 }[/math], затем вычислить:
[math]\displaystyle{ U_1 = n_1 \cdot n_2 + \frac{n_1 \cdot (n_1 + 1)}{2} - R_1 }[/math],
[math]\displaystyle{ U_2 = n_1 \cdot n_2 + \frac{n_2 \cdot (n_2 + 1)}{2} - R_2 }[/math],
если всё вычислено верно, то
[math]\displaystyle{ U_1+U_2=n_1\cdot n_2. }[/math], - Определить значение U-статистики Манна-Уитни по формуле [math]\displaystyle{ U = \min\{U_1, U_2\}. }[/math]
- По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных [math]\displaystyle{ n_1 }[/math] и [math]\displaystyle{ n_2 }[/math]. Если полученное значение [math]\displaystyle{ U }[/math] меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение [math]\displaystyle{ U }[/math] больше табличного, принимается нулевая гипотеза. Достоверность различий тем выше, чем меньше значение [math]\displaystyle{ U }[/math].
- При справедливости нулевой гипотезы критерий имеет математическое ожидание [math]\displaystyle{ M(U) = n_1 n_2 / 2 }[/math] и дисперсию [math]\displaystyle{ D(U) = n_1 n_2 (n_1 + n_2 + 1) / 12 }[/math] и при достаточно большом объёме выборочных данных [math]\displaystyle{ (n_1 \gt 19, n_2 \gt 19) }[/math] распределён практически нормально.
