Коэффициент корреляции манна уитни. Критерий уилкоксона-манна-уитни

Назначение критерия

U - критерий Манна-Уитни предназначен для оценки различий между двумя выборками по уровню какого-либо признака, измеренного начиная со шкалы порядка (не ниже). Он позволяет выявлять различия между малыми выборками, когда n 1 , n 2 3 или n 1 = 2, n 2 5, и является более мощным, чем критерий Розенбаума.

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами упорядоченных значений. При этом 1-м рядом (выборкой группой) называется тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.

Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.

Расчетное (эмпирическое) значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп. , тем более вероятно, что различия достоверны.

Ограничения критерия

    Признак должен быть измерен по ординальной, интервальной или пропорциональной шкале.

    Выборки должны быть независимыми.

    В каждой выборке должно быть не менее 3 наблюдений: n 1 , n 2 3 ; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.

    В каждой выборке должно быть не более 60 наблюдений: n 1 , n 2 60. Однако уже приn 1 , n 2 20 ранжирование становится достаточно трудоемким.

Алгоритм подсчета критерия Манна-Уитни.

    Для расчета критерия необходимо мысленно все значения 1-й выборки и 2-й выборки объединить в одну общую объединенную выборку и упорядочить их.

Все расчеты удобно производить в таблице (таблица 28), состоящей из 4-х столбцов. В эту таблицу заносятся упорядоченные значения объединенной выборки.

При этом:

    значения объединенной выборки упорядочиваются по нарастанию значений;

    значения каждой из выборок записываются в свой столбик: значения 1-й выборки записываются в столбик № 2, значения 2-й выборки записываются в столбик № 3;

    каждое значение записывается на отдельной строчке;

    общее число строк в этой таблице равно N=n 1 +n 2 , гдеn 1 - число испытуемых в 1-й выборке,n 2 - число испытуемых во 2-й выборке

Таблица 28

R 1

R 2

    Значения объединенной выборки ранжируются согласно правилам ранжирования, причем в столбике № 1 записываются ранги R 1 соответствующие значениям 1-й выборки, в столбике № 4 - ранги R 2 , соответствующие значениям 2-й выборки,

    Подсчитывается сумма рангов отдельно по столбику № 1 (для выборки 1) и отдельно по столбику № 4 (для выборки 2). Обязательно проверить, совпадает ли общая сумма рангов с расчетной суммой рангов для объединенной выборки.

    Определить бόльшую из двух ранговых сумм. Обозначим ее как Т х.

    Определить расчетное значение критерия U по формуле:

где n 1 - количество испытуемых в выборке 1,

n 2 - количество испытуемых в выборке 2,

T x - бόльшая из двух ранговых сумм,

n x - количество испытуемых в выборке с бόльшей суммой рангов.

    Правило вывода: Определить критические значения U по таблице критических значений для критерия Манна-Уитни.

Если U эмп. U кр. 0,05 , различия между выборками статистически незначимы.

Если U эмп. U кр. 0,05 , различия между выборками статистически достоверны.

Чем меньше значения U, тем достоверность различий выше.

Контрольные вопросы:

    Назовите условия применения критерия Стьюдента.

    Какие параметры распределений признаков необходимо знать для того, чтобы рассчитать критерий Стьюдента?

    Сформулируйте правило принятия решения по результатам расчетов критерия Стьюдента.

    Почему при расчете критерия Стьюдента необходимо параллельно оценивать и изменчивость признаков в выборках?

    Каким образом можно сравнить две дисперсии?

    В каких случаях в правило вывода критерия Стьюдента необходимо вводить поправку Снедекора?

    Назовите условия применения критерия Розенбуама.

    Сформулируйте правило принятия решения по результатам расчетов критерия Розенбаума.

    Перечислите условия применения критерия Манна-Уитни.

    Что такое общая объединенная выборка при расчете критерия Манна-Уитни.

    Сформулируйте правило принятия решения по результатам расчетов критерия Манна-Уитни.

Самостоятельное практическое задание:

Самостоятельно изучите по учебникам критерии Крускала-Уоллиса и тенденций Джонкира. Составьте конспект по схеме аналогичной той, которая использовалась в лекциях.

Материалы для изучения темы:

а) основная литература:

    Ермолаев О. Ю. Математическая статистика для психологов [Текст]: учебник / О. Ю. Ермолаев. - 5-е изд. - М.: МПСИ: Флинта, 2011. - 336 с. - С. 101-124; 169-172.

    Наследов А.Д. Математические методы психологического исследования: Анализ и интерпретация данных [Текст]: учебное пособие / А. Д. Наследов. - 3-е изд., стереотип. - СПб.: Речь, 2007. - 392 с. - С. 162-167; 173-176; 181-182.

    Сидоренко Е. В. Методы математической обработки в психологии [Текст] / Е. В. Сидоренко. - СПб.: Речь, 2010. - 350 с.: ил. - С. 39-72.

б) дополнительная литература:

    Гласс Дж. Статистические методы в педагогике и психологии [Текст]. / Дж. Гласс, Дж. Стенли- М., 1976. – 494 с. - С. 265-280.

    Кутейников А.Н. Математические методы в психологии [Текст]: учебно-методический комплекс / А. Н. Кутейников. - СПб.: Речь, 2008. - 172 с.: табл. - С. 81-93.

    Суходольский Г.В. Основы математической статистики для психологов [Текст]: учебник / Г. В. Суходольский. - СПб.: Изд-во СПбГУ, 1998. - 464 с. - С. 305-323.

Где T x - наибольшая сумма рангов, n x - наибольшая из объемов выборок n 1 и n 2 .

Назначение сервиса . С помощью данного онлайн-калькулятора производится расчет U критерия Манна-Уитни .

Назначение критерия

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n 1 , n 2 ≥ 3 или n 1 =2, n 2 ≥ 5. В каждой выборке должно быть не более 60 наблюдений.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Положим, что первым рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а вторым рядом - тот, где они предположительно ниже.
Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.
Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп, тем более вероятно, что различия достоверны.

Гипотезы
H 0: Уровень признака в группе 2 не ниже уровня признака в группе 1.
H 1: Уровень признака в группе 2 ниже уровня признака в группе 1.

Алгоритм расчета критерия Манна-Уитни

  1. Объединить все данные в единый ряд, пометив данные, принадлежащие разным выборкам.
  2. Проранжировать значения , приписывая меньшему значению меньший ранг. Всего рангов получится (n 1 + n 2).
  3. Подсчитать сумму рангов отдельно для каждой выборки.
  4. Определить большую из двух ранговых сумм.
  5. Определить значение U по формуле:
    U = n 1 ·n 2 + n x ·(n x + 1)/2 – T x ,
    где n 1 – объем выборки №1; n 2 – объем выборки №2; T x – большая из двух ранговых сумм; n x – объем максимальной выборки: n x = max(n 1 , n 2).
  6. Определить критические значения U кр по таблице . Если U эмп > U кр (0,05). H 0 принимается. Если U эмп ≤ U кр (0,05) H 0 отвергается. Чем меньше значения U, тем достоверность различий выше.

Пример . У предполагаемых участников психологического эксперимента был измерен уровень вербального и невербального интеллекта с помощью методики Д. Векслера. Было обследовано две группы юношей в возрасте от 18 до 24 лет студентов физического факультета и психологического факультета. Показатели вербального интеллекта представлены в таблице. Можно ли утверждать, что одна из групп превосходит другую по уровню вербального интеллекта?

Ф П
135 130
130 129
131 121
128 129
127 119
137 124
126 125
137 129
131 129
137 130
137 131
127 123
133
125

Сравнение результатов показывает, что значения выборки X несколько выше, чем выборки Y, поэтому первой считаем выборку X.
Таким образом, нам требуется определить, можно ли считать имеющуюся разницу между баллами существенной.
Решение .
Проранжируем представленную таблицу. При ранжировании объединяем две выборки в одну. Ранги присваиваются в порядке возрастания значения измеряемой величины, т.е. наименьшему рангу соответствует наименьший балл. Заметим, что в случае совпадения баллов для нескольких учеников ранг такого балла следует считать, как среднее арифметическое тех позиций, которые занимают данные баллы при их расположении в порядке возрастания.
Так как в матрице имеются связанные ранги (одинаковый ранговый номер) 1-го ряда, произведем их переформирование. Переформирование рангов производиться без изменения важности ранга, то есть между ранговыми номерами должны сохраниться соответствующие соотношения (больше, меньше или равно). Также не рекомендуется ставить ранг выше 1 и ниже значения равного количеству параметров (в данном случае n = 26). Переформирование рангов производится в табл.
Номера мест в упорядоченном ряду Расположение факторов по оценке эксперта Новые ранги
1 119 1
2 121 2
3 123 3
4 124 4
5 125 5.5
6 125 5.5
7 126 7
8 127 8.5
9 127 8.5
10 128 10
11 129 12.5
12 129 12.5
13 129 12.5
14 129 12.5
15 130 16
16 130 16
17 130 16
18 131 19
19 131 19
20 131 19
21 133 21
22 135 22
23 137 24.5
24 137 24.5
25 137 24.5
26 137 24.5

Используя предложенный принцип ранжирования, получим таблицу рангов.
X Ранг X Y Ранг Y
125 5.5 119 1
126 7 121 2
127 8.5 123 3
127 8.5 124 4
128 10 125 5.5
130 16 129 12.5
131 19 129 12.5
131 19 129 12.5
133 21 129 12.5
135 22 130 16
137 24.5 130 16
137 24.5 131 19
137 24.5
137 24.5
Сумма 234.5 Сумма 116.5

Этих данных достаточно, чтобы воспользоваться формулой расчёта эмпирического значения критерия:

Гипотеза H 0 о незначительности различий между выборками принимается, если U кр < u эмп. В противном случае H 0 отвергается и различие определяется как существенное.
где U kp - критическая точка, которую находят по таблице Манна-Уитни.
Найдем критическую точку U kp
По таблице находим U kp (0.05) = 45
Так как U kp > u эмп - принимаем альтернативную гипотезу H 1 ; различия в уровнях выборок можно считать существенными.

U-критерий Манна - Уитни (англ. Mann - Whitney U-test ) - статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.

Wilcoxon rank-sum test ). Реже: критерий числа инверсий.

История

Данный метод выявления различий между выборками был предложен в 1945 году Фрэнком Уилкоксоном (F. Wilcoxon H. B. Mann ) и Д. Р. Уитни (D. R. Whitney

Описание критерия

  1. В выборочных данных не должно быть совпадающих значений (все числа - разные) или таких совпадений должно быть очень мало (до 10).

Использование критерия

  1. Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг. Общее количество рангов получится равным: N = n 1 + n 2 , {\displaystyle N=n_{1}+n_{2},} где n 1 {\displaystyle n_{1}} - количество элементов в первой выборке, а n 2 {\displaystyle n_{2}} - количество элементов во второй выборке.
  2. Разделить единый ранжированный ряд на два, состоящие соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки, и отдельно - на долю элементов второй выборки. Определить большую из двух ранговых сумм (T x {\displaystyle T_{x}}), соответствующую выборке с n x {\displaystyle n_{x}} элементами.
  3. Определить значение U-критерия Манна - Уитни по формуле: U = n 1 ⋅ n 2 + n x ⋅ (n x + 1) 2 − T x . {\displaystyle U=n_{1}\cdot n_{2}+{\frac {n_{x}\cdot (n_{x}+1)}{2}}-T_{x}.}
  4. По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных n 1 {\displaystyle n_{1}} и n 2 {\displaystyle n_{2}} . Если полученное значение U {\displaystyle U} меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение U {\displaystyle U} больше табличного, принимается нулевая гипотеза. Достоверность различий тем выше, чем меньше значение U {\displaystyle U} .
  5. При справедливости нулевой гипотезы критерий имеет математическое ожидание M (U) = n 1 ⋅ n 2 2 {\displaystyle M(U)={\frac {n_{1}\cdot n_{2}}{2}}} и дисперсию D (U) = n 1 ⋅ n 2 ⋅ (n 1 + n 2 + 1) 12 {\displaystyle D(U)={\frac {n_{1}\cdot n_{2}\cdot (n_{1}+n_{2}+1)}{12}}} и при достаточно большом объёме выборочных данных (n 1 > 19 , n 2 > 19) {\displaystyle (n_{1}>19,\;n_{2}>19)} распределён практически нормально.

Таблица критических значений

  • Расчет критических значений U-критерия Манна - Уитни для выборок больше 20 (N>20)(недоступная ссылка с 10-02-2017 )

Критерий Манна-Уитни: пример, таблица

Критерий в математической статистике - это строгое правило, в соответствии с которым гипотеза с определённым уровнем значимости принимается или отвергается. Чтобы построить его, необходимо найти определенную функцию. Она должна зависеть от конечных результатов эксперимента, то есть от эмпирически найденных значений. Именно эта функция будет являться инструментом оценки расхождения между выборками.

Статистически значимая величина. Общие сведения

Статистическая значимость – это величина, вероятность случайного возникновения которой очень мала. Незначительны также и более крайние ее показатели. Разницу называют статистически значимой в том случае, если существуют данные, вероятность появления которых незначительна, если утверждать, что эти расхождения не существуют. Но это не значит вовсе, что эта разница обязательно должна быть велика и значима.

Уровень статистической достоверности теста

Под данным термином следует понимать вероятность отклонения нулевой гипотезы в случае её истинности. Это также называется ошибкой первого рода или ложноположительным решением. В большинстве случаев процесс опирается на p-величину ("пи-величина"). Это накопленная вероятность при наблюдении за уровнем статистического критерия. Он, в свою очередь, насчитывается по выборке во время принятия нулевой гипотезы. Предположение будет отвергнуто, если эта p-величина будет меньше заявленного аналитиком уровня. От этого показателя зависит напрямую значимость тестовой величины: чем она меньше, тем, соответственно, и больше оснований отвергнуть гипотезу.
Уровень значимости, как правило, обозначается буквой б (альфа). Популярные показатели среди специалистов: 0,1%, 1%, 5% и 10%. Если, скажем, говорится, что шансы на совпадения равны 1 к 1000, то определённо речь идёт об уровне 0,1% статистической значимости случайной величины. Различные по значению б-уровни имеют свои плюсы и минусы. Если показатель меньше, то больше вероятность, что альтернативная гипотеза значимая. Хотя при этом возможен риск, что ложное нулевое предположение не будет отвергнуто. Можно сделать вывод, что выбор оптимального б-уровня зависит от баланса "значимость-мощность" или, соответственно, от компромисса вероятностей ложноположительного и ложноотрицательного решений. Синонимом "статистической значимости" в отечественной литературе является термин "достоверность".

Определение нулевой гипотезы

В математической статистике это предположение, проверяемое на согласованность с уже имеющимися в запасе эмпирическими данными. В большинстве случаев в качестве нулевой гипотезы берётся гипотеза о том, что корреляция между исследуемыми переменными отсутствует или что в изучаемых распределениях нет различий однородности. При стандартных исследованиях математик пытается опровергнуть нулевую гипотезу, то есть доказать, что она не согласована с экспериментально полученными данными. Причем должно иметь место и альтернативное предположение, которое принимается вместо нулевого.

Ключевое определение

Критерий U (Манна-Уитни) в математической статистике позволяет оценивать различия двух выборок. Они могут быть даны по уровню некоего признака, который измерен количественно. Этот метод идеален для оценки различий малых выборок. Этот простой критерий был предложен Фрэнком Уилкоксоном в 1945 году. А уже в 1947 году метод был пересмотрен и дополнен учёными Х. Б. Манном и Д. Р. Уитни, именами которых он и именуется по сей день. Критерий Манна-Уитни в психологии, математике, статистике и во многих других науках является одним из основополагающих элементов математического обоснования результатов теоретических исследований.

Описание

Критерий Манна-Уитни - относительно простой метод без параметров. Его мощность значительна. Она существенно выше, чем мощность Q-критерия Розенбаума. Метод оценивает, насколько мала область перекрёстных значений между выборками, а именно между ранжированными рядами значений первой и второй подборки. Чем значение критерия меньше, тем больше вероятность, что расхождения значений параметра достоверны. Чтобы корректно применить критерий U (Манна-Уитни), не стоит забывать о некоторых ограничениях. В каждой выборке должно быть как минимум 3 значения признака. Возможна ситуация, когда в одном случае значений два, но во втором обязательно тогда их должно быть хотя бы пять. В исследуемых выборках должно быть минимальное количество совпадающих показателей. Все числа должны быть разными в идеальном случае.

Использование

Как правильно использовать критерий Манна-Уитни? Таблица, которая составлена по данному методу, содержит определенные критические значения. Для начала нужно создать единый ряд из обеих сопоставленных выборок, который затем ранжируется. То есть элементы выстраиваются по степени нарастания признака, и меньший ранг присваивается меньшему значению. В итоге получим такое общее число рангов:

N = N1 + N2,

где величины N1 и N2 - количество единиц, содержащихся в первой и второй выборках соответственно. Далее единый ранжированный ряд значений делится на две категории. Единицы, соответственно, из первой и второй выборок. Теперь считается по очереди сумма рангов значений в первом и во втором рядах. Определяется большая из них (Tx), которая соответствует выборке с nx единицами. Чтобы использовать метод Уилкоксона далее, вычисляется его значение по следующей методике. Необходимо по таблице для выбранного уровня значимости выяснить критическое значение этого критерия для конкретно взятых N1 и N2.
Получившийся показатель может быть меньше или равен значению из таблицы. В этом случае констатируется значительное различие уровней признака в исследуемых выборках. Если полученное значение больше табличного, тогда нулевая гипотеза принимается. Когда производится расчет критерия Манна-Уитни, следует заметить, что если нулевая гипотеза справедлива, критерий будет иметь математическое ожидание, а также дисперсию. Отметим, что при достаточно больших объёмах данных выборок метод считается практически нормально распределенным. Достоверность различий тем выше, чем меньшее значение принимает критерий Манна-Уитни.

Значения критерия Пирсона (критерия)

  1. Таблицы вероятностей, связанных со значениями критерия Манна-Уитни.

Таблицы вероятностей, связанных со значениями критерия Манна-Уитни. Для экспе­римен­таль­но­го­ значения критерия (меньшего из двух значений) и объемов выборок находят вероятность того, что обе группы принадлежат одной генеральной совокупности. Таким образом, низкое значение вероятности, например, Р

    Таблица 3.

  1. Таблица 4.

  2. Таблица 5.

    1. Таблица 6.

  1. Таблица критических значений критерия Манна-Уитни для уровня значимости .

Если , то различие между выборками достоверно для , то есть нулевую гипотезу следует от­вергнуть.

N 2

N 1

2. U – критерий Манна-Уитни

Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1 и n2 больше или равны 3 (либо n1 = 2, а n2 тогда больше или равно 5.)

Метод определяет, достаточно ли мала зона пересекающихся значений между двумя рядами. Чем меньше эта область, тем более вероятно, что различия достоверны. Эмпирическое (фактически полученное) значение критерия U отражает то, насколько велика зона совпадения между рядами. Чем меньше Uэмп., тем более вероятно, что различия достоверны.

Гипотезы.

Но: Уровень признака в группе 2 не ниже уровня признака в группе 1.

Н1: Уровень признака в группе 2 ниже уровня признака в группе 1.

Ограничения критерия U.

1. В каждой выборке должно быть не менее 3 наблюдений или, в крайнем случае, допускается соотношение 2 к 5 или более.

2. В каждой выборке должно быть не более 60 наблюдений.

Алгоритм подсчета критерия U – Манна-Уитни.

1.Перенести все данные выборок на индивидуальные карточки (на которых цветом или как-то еще будет отражено, к какой из выборок принадлежит значение).

2. Разложить все карточки в общий ряд по мере нарастания признака, не считаясь с тем, к какой выборке они относятся.

3. Проранжировать (согласно алгоритму ранжирования) значения на карточках, приписывая меньшему значению меньший ранг. Всего рангов должно быть n1 + n2 (объем первой выборки + объем второй выборки).

4. Заново разложить карточки в два ряда, по признаку принадлежности к выборке 1 или выборке 2.

6. Определить большую из двух ранговых сумм.

7. Определить значение U по формуле:

8. Определить из таблиц критические значения U, в соответствии с этим, принять либо отклонить гипотезу Но.

3. Н – критерий Крускала - Уоллиса

Критерий Нприменяется для оценки различий по степени выраженности анализируемого признака одновременно между тремя, четырьмя и более выборками. Он позволяет выявить степень изменения признака в выборках, не указывая, однако, на направление этих изменений.

Критерий основан на том принципе, что чем меньше взаимопересечение выборок, тем выше уровень значимости Н эмп . Следует подчеркнуть, что в выборках может быть разное количество испытуемых, хотя в приведенных ниже задачах приводится равное число испытуемых в выборках.

Работа с данными начинается с того, что все выборки условно объединяются по порядку встречающихся величин в одну выборку и значениям этой объединенной выборки проставляются ранги. Затем полученные ранги проставляются исходным выборочным данным и по каждой выборке отдельно подсчитывается сумма рангов. Критерий построен на следующей идее – если различия между выборками незначимы, то и суммы рангов не будут существенно отличаться одна от другой и наоборот.

Величина Н эмп подсчитывается по формуле:

Н эмп

Где N – общее число членов в обобщенной выборке;

n i – число членов в каждой отдельной выборке;

–квадраты сумм рангов по каждой выборке.

При определении критических значений критерия применительно к четырем и более выборкам используют таблицу для критерия хи -квадрат, подсчитав предварительно число степеней свободы v для с = 4. Тогда v = с – 1 = 4 – 1=3..

Подчеркнем, что если использовать критерии, позволяющие сравнивать только два ряда значений, то полученный выше результат потребовал бы шести сравнений – первая выборка со второй, третьей и т.д.

Для использование критерия Н необходимо соблюдать следующие условия:

1. Измерение должно быть проведено в шкале порядка, интервалов или отношений.

2. Выборки должны быть незагисимыми.

3. Допускается разное число испытуемых в сопоставляемых выборках.

4. При сопоставлении трех выборок допускается, чтобы в одной из них было n = 3, а в двух других n = 2. Однако в таком случае различия могут быть зафиксированы лишь на 5 % уровне значимости.

5. Таблица 9 Приложения предусмотрена только для трех выборок и {n 1n 2, n З}, £ 5, то есть максимальное число испытуемых во всех трех выборках может быть меньше и равно 5.

6. При большем числе выборок и разном количестве испытуемых в каждой выборке следует пользоваться таблицей для критерия хи -квадрат. В этом случае число степеней свободы при этом определяется по формуле: v = с – 1, где с – количество сопоставляемых выборок.

U-критерий Манна - Уитни это:

U-критерий Манна - Уитни

U-критерий Манна - Уитни

U-критерий Манна - Уитни (англ. Mann - Whitney U-test ) - статистический критерий, используемый для оценки различий между двумя выборками по уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.

Другие названия: критерий Манна - Уитни - Уилкоксона (англ. Mann - Whitney - Wilcoxon, MWW ), критерий суммы рангов Уилкоксона (англ. Wilcoxon rank-sum test ) или критерий Уилкоксона - Манна - Уитни (англ. Wilcoxon - Mann - Whitney test ).

История

Данный метод выявления различий между выборками был предложен в 1945 году Френком Уилкоксоном (F. Wilcoxon ). В 1947 году он был существенно переработан и расширен Х. Б. Манном (H. B. Mann ) и Д. Р. Уитни (D. R. Whitney ), по именам которых сегодня обычно и называется.

Описание критерия

Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума.

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.

Ограничения применимости критерия

  1. В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти.
  2. В выборочных данных не должно быть совпадающих значений (все числа - разные) или таких совпадений должно быть очень мало.

Использование критерия

Для применения U-критерия Манна - Уитни нужно произвести следующие операции.

  • Автоматический расчет U-критерия Манна - Уитни

Таблица критических значений

  • Таблица критических значений U-критерия Манна - Уитни
  • Critical Values for the Mann - Whitney U-Test.

См. также

  • Критерий Краскела - Уоллиса - многомерное обобщение U-критерия Манна - Уитни.

Литература

  • Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. - 1947. - № 18. - P. 50-60.
  • Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. - 1945. - P. 80-83.
  • Гублер Е. В., Генкин А. А. Применение непараметрических критериев статистики в медико-биологических исследованиях. - Л., 1973.
  • Сидоренко Е. В. Методы математической обработки в психологии. - С-Пб., 2002.

Wikimedia Foundation. 2010.

  • U-954
  • U-точка женщины

Смотреть что такое "U-критерий Манна - Уитни" в других словарях:

    U-критерий Манна - U критерий Манна Уитни (англ. Mann Whitney U test) статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять… … Википедия

    U-критерий Манна-Уитни - (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми … Википедия

    Критерий Манна-Уитни

    Критерий Манна-Уитни-Вилкоксона - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    Критерий Манна-Уитни-Уилкоксона - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    критерий Манна Уитни - - Тематики электросвязь, основные понятия EN Mann Whitney U test … Справочник технического переводчика

    Критерий Вилкоксона-Манна-Уитни - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    Критерий Уилкоксона-Манна-Уитни - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    Критерий суммы рангов Вилкоксона - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

    Критерий суммы рангов Уилкоксона - U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия

Книги

  • Статистика и котики, Владимир Савельев. Из этой книги вы узнаете, что такое дисперсия и стандартное отклонение, как найти t-критерий Стьюдента и U-критерий Манна-Уитни, для чего используются регрессионный и факторный анализы,… Подробнее Купить за 280 руб электронная книга

Критерий Манна-Уитни представляет непараметрическую альтернативу t -критерия для независимых выборок. Преимущество его состоит в том, что мы отказываемся от предположения нормальности распределения и одинаковых дисперсий. Необходимо, чтобы данные были измерены как минимум в порядковой шкале.

STATISTICA предполагает, что данные расположены тем же образом, что в и t -критерии для независимых выборок. Файл должен содержать кодовую (независимую) переменную, имеющую, по крайней мере, два разных кода для однозначной идентификации принадлежности каждого наблюдения к определенной группе.

Предположения и интерпретация. Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t -критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки. U критерий - наиболее мощная (чувствительная) непараметрическая альтернатива t-критерия для независимых выборок ; фактически, в некоторых случаях он имеет даже большую мощность, чем t -критерий.

Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению (см. Siegel, 1956). Поэтому вместе с U статистикой будут показаны z значение (для нормального распределения и соответствующее p -значение.

Точные вероятности для малых выборок. Для выборок малого объема STATISTICA вычислит точную вероятность, связанную с соответствующей U статистикой. Эта вероятность основана на подсчете всех возможных значений U при заданном количестве наблюдений в двух выборках (см. Dinneen & Blakesley, 1973). Программа сообщит (в последнем столбце таблицы результатов) значение 2 * p, где p равно 1 минус кумулятивная (односторонняя) вероятность соответствующей U статистики. Заметим, что это обычно не приводит к большой недооценке статистической значимости соответствующих эффектов (см. Siegel, 1956).

Статистика критерия выглядит следующим образом.

где W - статистика Вилкоксона , предназначенная для проверки этой же гипотезы

в противном случае

Таким образом, статистика U считает общее число тех случаев, в которых элементы второй выборки превосходят элементы первой выборки. Если гипотеза верна, то

Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t -критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки. U критерий - наиболее мощная (чувствительная) непараметрическая альтернатива t -критерия для независимых выборок; фактически, в некоторых случаях он имеет даже большую мощность, чем t -критерий.

Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению. Поэтому, вместе с U статистикой, будут показано z значение (для нормального распределения) и соответствующее p -значение.

Подробные инструкции по поводу того, как использовать критерий, вы можете найти дальше в части, касающейся примера применения.

Пример

Проверим гипотезу о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности с помощью непараметрического U-критерия Манна-Уитни. Сравним результаты, полученные в примере Основные статистики и t-критерий Стьюдента для 2-го и 3-го столбцов таблицы по критерию Стьюдента, с результатами непараметрического сравнения.

Для расчета U-критерия Уилкоксона расположим варианты сравниваемых выборок в порядке возрастания в один обобщенный ряд и присвоим вариантам обобщенного ряда ранги от 1 до n1 + n2. Первая строка представляет собой варианты первой выборки, вторая - второй выборки, третья - соответствующие ранги в обобщенном ряду:





















Надо обратить внимание, что если имеются одинаковые варианты, им присваивается средний ранг, однако значение последнего ранга должно быть равно n1 + n2 (в нашем случае 20). Это правило используют для проверки правильности ранжирования.

Отдельно для каждой выборки рассчитываем суммы рангов их вариант R1 и R2. В нашем случае:

R1 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69

R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141

Для проверки правильности вычислений можно воспользоваться другим правилом: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). В нашем случае R1 + R2 = 210.

Статистика U1 = 69 - 10*11/2 = 14; U2 = 141 - 10*11/2 = 86.

Для проверки одностороннего критерия выбираем минимальную статистику U1 = 14 и сравниваем ее с критическим значением для n1 = n2 = 10 и уровня значимости 1%, равным 19.

Так как вычисленное значение критерия меньше табличного, нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборками признаются статистически значимыми. Таким образом, вывод о существовании различий, сделанный с помощью параметрического критерия Cтьюдента, подтверждается с помощью данного непараметрического метода.

По уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.

Другие названия: критерий Манна - Уитни - Уилкоксона (англ. Mann - Whitney - Wilcoxon, MWW ), критерий суммы рангов Уилкоксона (англ. Wilcoxon rank-sum test ) или критерий Уилкоксона - Манна - Уитни (англ. Wilcoxon - Mann - Whitney test ). Реже: критерий числа инверсий .

Энциклопедичный YouTube

    1 / 3

    ✪ U-критерий МАННА-УИТНИ | АНАЛИЗ ДАННЫХ #8

    ✪ U-критерий МАННА-УИТНИ в STATISTICA #03 | СТАТИСТИКА STATISTICA

    ✪ U критерий Манна Уитни

    Субтитры

История

Данный метод выявления различий между выборками был предложен в 1945 году Фрэнком Уилкоксоном (F. Wilcoxon ). В 1947 году он был существенно переработан и расширен Х. Б. Манном (H. B. Mann ) и Д. Р. Уитни (D. R. Whitney ), по именам которых сегодня обычно и называется.

Описание критерия

Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума .

Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.

Ограничения применимости критерия

  1. В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти.
  2. В выборочных данных не должно быть совпадающих значений (все числа - разные) или таких совпадений должно быть очень мало (до 10).

Использование критерия

Для применения U-критерия Манна - Уитни нужно произвести следующие операции.

  1. Составить единый ранжированный ряд из обеих сопоставляемых выборок, расставив их элементы по степени нарастания признака и приписав меньшему значению меньший ранг. Общее количество рангов получится равным: N = n 1 + n 2 , {\displaystyle N=n_{1}+n_{2},} где - количество элементов в первой выборке, а - количество элементов во второй выборке.
  2. Разделить единый ранжированный ряд на два, состоящие соответственно из единиц первой и второй выборок. Подсчитать отдельно сумму рангов, пришедшихся на долю элементов первой выборки, и отдельно - на долю элементов второй выборки. Определить большую из двух ранговых сумм ( T x {\displaystyle T_{x}} ), соответствующую выборке с n x {\displaystyle n_{x}} элементами.
  3. Определить значение U-критерия Манна - Уитни по формуле: U = n 1 ⋅ n 2 + n x ⋅ (n x + 1) 2 − T x . {\displaystyle U=n_{1}\cdot n_{2}+{\frac {n_{x}\cdot (n_{x}+1)}{2}}-T_{x}.}
  4. По таблице для избранного уровня статистической значимости определить критическое значение критерия для данных n 1 {\displaystyle n_{1}} и n 2 {\displaystyle n_{2}} . Если полученное значение U {\displaystyle U} меньше табличного или равно ему, то признается наличие существенного различия между уровнем признака в рассматриваемых выборках (принимается альтернативная гипотеза). Если же полученное значение U {\displaystyle U} больше табличного, принимается
Похожие публикации