Mann–Whitney U test: различия между версиями

Материал из Поле цифровой дидактики
Новая страница: «{{Понятие |Description=U-критерий Манна — Уитни (англ. Mann–Whitney U test) — статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в знач...»
 
Нет описания правки
 
(не показана 1 промежуточная версия этого же участника)
Строка 3: Строка 3:
|Field_of_knowledge=Статистика
|Field_of_knowledge=Статистика
|Inventor=Mann–Whitney–Wilcoxon
|Inventor=Mann–Whitney–Wilcoxon
|similar_concepts=Эксперимент
|similar_concepts=Эксперимент, статистический критерий
}}
}}
== Использование критерия ==
== Использование критерия ==
Для применения U-критерия Манна — Уитни нужно произвести следующие операции.
Для применения U-критерия Манна — Уитни нужно произвести следующие операции.
# Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг (при наличии повторяющихся элементов в выборке использовать средний ранг). Общее количество рангов получится равным <math>N = n_1 + n_2,</math> где <math>n_1</math> — количество элементов в первой выборке, а <math>n_2</math> — количество элементов во второй выборке.
# Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг (при наличии повторяющихся элементов в выборке использовать средний ранг). Общее количество рангов получится равным <math>N = n_1 + n_2,</math> где <math>n_1</math> — количество элементов в первой выборке, а <math>n_2</math> — количество элементов во второй выборке.
# Разделить единый ранжированный ряд на два, состоящих соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки <math>R_1 </math>, и отдельно — на долю элементов второй выборки  <math>R_2 </math>, затем вычислить:<blockquote><math>U_1 = n_1 \cdot n_2 + \frac{n_1 \cdot (n_1 + 1)}{2} - R_1 </math>,<br><math>U_2 = n_1 \cdot n_2 + \frac{n_2 \cdot (n_2 + 1)}{2} - R_2 </math>,<br> если всё вычислено верно, то<br><math>U_1+U_2=n_1\cdot n_2. </math>,</blockquote>
# Разделить единый ранжированный ряд на два, состоящих соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки <math>R_1 </math>, и отдельно — на долю элементов второй выборки  <math>R_2 </math>, затем вычислить:<blockquote><math>U_1 = n_1 \cdot n_2 + \frac{n_1 \cdot (n_1 + 1)}{2} - R_1 </math>,<br><math>U_2 = n_1 \cdot n_2 + \frac{n_2 \cdot (n_2 + 1)}{2} - R_2 </math>,<br> если всё вычислено верно, то<br><math>U_1+U_2=n_1\cdot n_2. </math>,</blockquote>
# Определить значение U-статистики Манна-Уитни по формуле <math>U = \min\{U_1, U_2\}.</math>
# Определить значение U-статистики [[Манна-Уитни]] по формуле <math>U = \min\{U_1, U_2\}.</math>
# По таблице для избранного [[Статистическая значимость|уровня статистической значимости]] определить критическое значение критерия для данных <math>n_1</math> и <math>n_2</math>. Если полученное значение <math>U</math>    ''меньше'' табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается [[альтернативная гипотеза]]). Если же полученное значение <math>U</math> больше табличного, принимается [[нулевая гипотеза]]. Достоверность различий тем выше, чем меньше значение <math>U</math>.
# По таблице для избранного [[Статистическая значимость|уровня статистической значимости]] определить критическое значение критерия для данных <math>n_1</math> и <math>n_2</math>. Если полученное значение <math>U</math>    ''меньше'' табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается [[альтернативная гипотеза]]). Если же полученное значение <math>U</math> больше табличного, принимается [[нулевая гипотеза]]. Достоверность различий тем выше, чем меньше значение <math>U</math>.
# При справедливости [[нулевая гипотеза|нулевой гипотезы]] критерий имеет [[математическое ожидание]] <math>M(U) = n_1 n_2 / 2</math> и [[Дисперсия случайной величины|дисперсию]] <math>D(U) = n_1 n_2 (n_1 + n_2 + 1) / 12</math> и при достаточно большом объёме выборочных данных <math>(n_1 > 19, n_2 > 19)</math> распределён практически нормально.
# При справедливости [[нулевая гипотеза|нулевой гипотезы]] критерий имеет [[математическое ожидание]] <math>M(U) = n_1 n_2 / 2</math> и [[Дисперсия случайной величины|дисперсию]] <math>D(U) = n_1 n_2 (n_1 + n_2 + 1) / 12</math> и при достаточно большом объёме выборочных данных <math>(n_1 > 19, n_2 > 19)</math> распределён практически нормально.

Текущая версия от 11:46, 16 декабря 2025


Описание U-критерий Манна — Уитни (англ. Mann–Whitney U test) — статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.
Область знаний Статистика
Авторы Mann–Whitney–Wilcoxon
Поясняющее видео
Близкие понятия Эксперимент, Статистический критерий
Среды и средства для освоения понятия

Использование критерия

Для применения U-критерия Манна — Уитни нужно произвести следующие операции.

  1. Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг (при наличии повторяющихся элементов в выборке использовать средний ранг). Общее количество рангов получится равным [math]\displaystyle{ N = n_1 + n_2, }[/math] где [math]\displaystyle{ n_1 }[/math] — количество элементов в первой выборке, а [math]\displaystyle{ n_2 }[/math] — количество элементов во второй выборке.
  2. Разделить единый ранжированный ряд на два, состоящих соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки [math]\displaystyle{ R_1 }[/math], и отдельно — на долю элементов второй выборки [math]\displaystyle{ R_2 }[/math], затем вычислить:

    [math]\displaystyle{ U_1 = n_1 \cdot n_2 + \frac{n_1 \cdot (n_1 + 1)}{2} - R_1 }[/math],
    [math]\displaystyle{ U_2 = n_1 \cdot n_2 + \frac{n_2 \cdot (n_2 + 1)}{2} - R_2 }[/math],
    если всё вычислено верно, то
    [math]\displaystyle{ U_1+U_2=n_1\cdot n_2. }[/math],

  3. Определить значение U-статистики Манна-Уитни по формуле [math]\displaystyle{ U = \min\{U_1, U_2\}. }[/math]
  4. По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных [math]\displaystyle{ n_1 }[/math] и [math]\displaystyle{ n_2 }[/math]. Если полученное значение [math]\displaystyle{ U }[/math] меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение [math]\displaystyle{ U }[/math] больше табличного, принимается нулевая гипотеза. Достоверность различий тем выше, чем меньше значение [math]\displaystyle{ U }[/math].
  5. При справедливости нулевой гипотезы критерий имеет математическое ожидание [math]\displaystyle{ M(U) = n_1 n_2 / 2 }[/math] и дисперсию [math]\displaystyle{ D(U) = n_1 n_2 (n_1 + n_2 + 1) / 12 }[/math] и при достаточно большом объёме выборочных данных [math]\displaystyle{ (n_1 \gt 19, n_2 \gt 19) }[/math] распределён практически нормально.