Для определения достоверности различий манна уитни. Критерий манна-уитни
Критерий Манна-Уитни представляет непараметрическую альтернативу t -критерия для независимых выборок. Преимущество его состоит в том, что мы отказываемся от предположения нормальности распределения и одинаковых дисперсий. Необходимо, чтобы данные были измерены как минимум в порядковой шкале.
STATISTICA предполагает, что данные расположены тем же образом, что в и t -критерии для независимых выборок. Файл должен содержать кодовую (независимую) переменную, имеющую, по крайней мере, два разных кода для однозначной идентификации принадлежности каждого наблюдения к определенной группе.
Предположения и интерпретация. Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t -критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки. U критерий - наиболее мощная (чувствительная) непараметрическая альтернатива t-критерия для независимых выборок ; фактически, в некоторых случаях он имеет даже большую мощность, чем t -критерий.
Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению (см. Siegel, 1956). Поэтому вместе с U статистикой будут показаны z значение (для нормального распределения и соответствующее p -значение.
Точные вероятности для малых выборок. Для выборок малого объема STATISTICA вычислит точную вероятность, связанную с соответствующей U статистикой. Эта вероятность основана на подсчете всех возможных значений U при заданном количестве наблюдений в двух выборках (см. Dinneen & Blakesley, 1973). Программа сообщит (в последнем столбце таблицы результатов) значение 2 * p, где p равно 1 минус кумулятивная (односторонняя) вероятность соответствующей U статистики. Заметим, что это обычно не приводит к большой недооценке статистической значимости соответствующих эффектов (см. Siegel, 1956).
Статистика критерия выглядит следующим образом.
где W - статистика Вилкоксона , предназначенная для проверки этой же гипотезы
в противном случае
Таким образом, статистика U считает общее число тех случаев, в которых элементы второй выборки превосходят элементы первой выборки. Если гипотеза верна, то
Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t -критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки. U критерий - наиболее мощная (чувствительная) непараметрическая альтернатива t -критерия для независимых выборок; фактически, в некоторых случаях он имеет даже большую мощность, чем t -критерий.
Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению. Поэтому, вместе с U статистикой, будут показано z значение (для нормального распределения) и соответствующее p -значение.
Подробные инструкции по поводу того, как использовать критерий, вы можете найти дальше в части, касающейся примера применения.
Пример
Проверим гипотезу о принадлежности сравниваемых независимых выборок к одной и той же генеральной совокупности с помощью непараметрического U-критерия Манна-Уитни. Сравним результаты, полученные в примере Основные статистики и t-критерий Стьюдента для 2-го и 3-го столбцов таблицы по критерию Стьюдента, с результатами непараметрического сравнения.
Для расчета U-критерия Уилкоксона расположим варианты сравниваемых выборок в порядке возрастания в один обобщенный ряд и присвоим вариантам обобщенного ряда ранги от 1 до n1 + n2. Первая строка представляет собой варианты первой выборки, вторая - второй выборки, третья - соответствующие ранги в обобщенном ряду:
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
| ||||||||||
Надо обратить внимание, что если имеются одинаковые варианты, им присваивается средний ранг, однако значение последнего ранга должно быть равно n1 + n2 (в нашем случае 20). Это правило используют для проверки правильности ранжирования.
Отдельно для каждой выборки рассчитываем суммы рангов их вариант R1 и R2. В нашем случае:
R1 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69
R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141
Для проверки правильности вычислений можно воспользоваться другим правилом: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). В нашем случае R1 + R2 = 210.
Статистика U1 = 69 - 10*11/2 = 14; U2 = 141 - 10*11/2 = 86.
Для проверки одностороннего критерия выбираем минимальную статистику U1 = 14 и сравниваем ее с критическим значением для n1 = n2 = 10 и уровня значимости 1%, равным 19.
Так как вычисленное значение критерия меньше табличного, нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборками признаются статистически значимыми. Таким образом, вывод о существовании различий, сделанный с помощью параметрического критерия Cтьюдента, подтверждается с помощью данного непараметрического метода.
Ограничения критерия
Назначение критерия
Непараметрический критерий Манна-Уитни
U - критерий Манна-Уитни предназначен для оценки различий между двумя выборками по уровню какого-либо признака, измеренного начиная со шкалы порядка (не ниже). Он позволяет выявлять различия между малыми выборками, когда n 1 , n 2 ³ 3 или n 1 = 2, n 2 ³ 5, и является более мощным, чем критерий Розенбаума.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами упорядоченных значений. При этом 1-м рядом (выборкой группой) называется тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.
Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.
Расчетное (эмпирическое) значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп. , тем более вероятно, что различия достоверны.
1. Признак должен быть измерен по ординальной, интервальной или пропорциональной шкале.
2. Выборки должны быть независимыми.
3. В каждой выборке должно быть не менее 3 наблюдений: n 1 , n 2 ³ 3 ; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.
4. В каждой выборке должно быть не более 60 наблюдений: n 1 , n 2 £ 60. Однако уже при n 1 , n 2 ³ 20 ранжирование становится достаточно трудоемким.
1. Для расчета критерия необходимо мысленно все значения 1-й выборки и 2-й выборки объединить в одну общую объединенную выборку и упорядочить их.
Все расчеты удобно производить в таблице (таблица 16), состоящей из 4-х столбцов. В эту таблицу заносятся упорядоченные значения объединенной выборки.
При этом:
a) значения объединенной выборки упорядочиваются по нарастанию значений;
b) значения каждой из выборок записываются в свой столбик: значения 1-й выборки записываются в столбик № 2, значения 2-й выборки записываются в столбик № 3;
c) каждое значение записывается на отдельной строчке;
d) общее число строк в этой таблице равно N=n 1 +n 2 , где n 1 - число испытуемых в 1-й выборке, n 2 - число испытуемых во 2-й выборке
Таблица 16
R 1 | x | y | R 2 |
1 | 2 | 3 | 4 |
7,5 | |||
7,5 | |||
….. | ….. | ||
….. | ….. | ||
∑=28,5 | ….. | ….. | ∑=16,5 |
2. Значения объединенной выборки ранжируются согласно правилам ранжирования, причем в столбике № 1 записываются ранги R 1 соответствующие значениям 1-й выборки, в столбике № 4 - ранги R 2 , соответствующие значениям 2-й выборки,
3. Подсчитывается сумма рангов отдельно по столбику № 1 (для выборки 1) и отдельно по столбику № 4 (для выборки 2). Обязательно проверить, совпадает ли общая сумма рангов с расчетной суммой рангов для объединенной выборки.
4. Определить бόльшую из двух ранговых сумм. Обозначим ее как Т х.
5. Определить расчетное значение критерия U по формуле:
где n 1 - количество испытуемых в выборке 1,
n 2 - количество испытуемых в выборке 2,
T x - бόльшая из двух ранговых сумм,
n x - количество испытуемых в выборке с бόльшей суммой рангов.
6. Правило вывода: Определить критические значения U по таблице критических значений для критерия Манна-Уитни (см. приложение 1.4) в зависимости от n 1 и n 2 .
Если U эмп. > U кр. 0,05 , различия между выборками статистически незначимы.
Если U эмп. £ U кр. 0,05 , различия между выборками статистически достоверны.
Чем меньше значения U, тем достоверность различий выше.
Где T x - наибольшая сумма рангов, n x - наибольшая из объемов выборок n 1 и n 2 .
Назначение сервиса . С помощью данного онлайн-калькулятора производится расчет U критерия Манна-Уитни .
Назначение критерия
Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n 1 , n 2 ≥ 3 или n 1 =2, n 2 ≥ 5. В каждой выборке должно быть не более 60 наблюдений.Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Положим, что первым рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а вторым рядом - тот, где они предположительно ниже.
Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.
Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше U эмп, тем более вероятно, что различия достоверны.
Гипотезы
H 0: Уровень признака в группе 2 не ниже уровня признака в группе 1.
H 1: Уровень признака в группе 2 ниже уровня признака в группе 1.
Алгоритм расчета критерия Манна-Уитни
- Объединить все данные в единый ряд, пометив данные, принадлежащие разным выборкам.
- Проранжировать значения , приписывая меньшему значению меньший ранг. Всего рангов получится (n 1 + n 2).
- Подсчитать сумму рангов отдельно для каждой выборки.
- Определить большую из двух ранговых сумм.
- Определить значение U по формуле:
U = n 1 ·n 2 + n x ·(n x + 1)/2 – T x ,
где n 1 – объем выборки №1; n 2 – объем выборки №2; T x – большая из двух ранговых сумм; n x – объем максимальной выборки: n x = max(n 1 , n 2). - Определить критические значения U кр по таблице . Если U эмп > U кр (0,05). H 0 принимается. Если U эмп ≤ U кр (0,05) H 0 отвергается. Чем меньше значения U, тем достоверность различий выше.
Пример . У предполагаемых участников психологического эксперимента был измерен уровень вербального и невербального интеллекта с помощью методики Д. Векслера. Было обследовано две группы юношей в возрасте от 18 до 24 лет студентов физического факультета и психологического факультета. Показатели вербального интеллекта представлены в таблице. Можно ли утверждать, что одна из групп превосходит другую по уровню вербального интеллекта?
Ф | П |
135 | 130 |
130 | 129 |
131 | 121 |
128 | 129 |
127 | 119 |
137 | 124 |
126 | 125 |
137 | 129 |
131 | 129 |
137 | 130 |
137 | 131 |
127 | 123 |
133 | |
125 |
Сравнение результатов показывает, что значения выборки X несколько выше, чем выборки Y, поэтому первой считаем выборку X.
Таким образом, нам требуется определить, можно ли считать имеющуюся разницу между баллами существенной.
Решение .
Проранжируем представленную таблицу. При ранжировании объединяем две выборки в одну. Ранги присваиваются в порядке возрастания значения измеряемой величины, т.е. наименьшему рангу соответствует наименьший балл. Заметим, что в случае совпадения баллов для нескольких учеников ранг такого балла следует считать, как среднее арифметическое тех позиций, которые занимают данные баллы при их расположении в порядке возрастания.
Так как в матрице имеются связанные ранги (одинаковый ранговый номер) 1-го ряда, произведем их переформирование. Переформирование рангов производиться без изменения важности ранга, то есть между ранговыми номерами должны сохраниться соответствующие соотношения (больше, меньше или равно). Также не рекомендуется ставить ранг выше 1 и ниже значения равного количеству параметров (в данном случае n = 26). Переформирование рангов производится в табл.
Номера мест в упорядоченном ряду | Расположение факторов по оценке эксперта | Новые ранги |
1 | 119 | 1 |
2 | 121 | 2 |
3 | 123 | 3 |
4 | 124 | 4 |
5 | 125 | 5.5 |
6 | 125 | 5.5 |
7 | 126 | 7 |
8 | 127 | 8.5 |
9 | 127 | 8.5 |
10 | 128 | 10 |
11 | 129 | 12.5 |
12 | 129 | 12.5 |
13 | 129 | 12.5 |
14 | 129 | 12.5 |
15 | 130 | 16 |
16 | 130 | 16 |
17 | 130 | 16 |
18 | 131 | 19 |
19 | 131 | 19 |
20 | 131 | 19 |
21 | 133 | 21 |
22 | 135 | 22 |
23 | 137 | 24.5 |
24 | 137 | 24.5 |
25 | 137 | 24.5 |
26 | 137 | 24.5 |
Используя предложенный принцип ранжирования, получим таблицу рангов.
X | Ранг X | Y | Ранг Y |
125 | 5.5 | 119 | 1 |
126 | 7 | 121 | 2 |
127 | 8.5 | 123 | 3 |
127 | 8.5 | 124 | 4 |
128 | 10 | 125 | 5.5 |
130 | 16 | 129 | 12.5 |
131 | 19 | 129 | 12.5 |
131 | 19 | 129 | 12.5 |
133 | 21 | 129 | 12.5 |
135 | 22 | 130 | 16 |
137 | 24.5 | 130 | 16 |
137 | 24.5 | 131 | 19 |
137 | 24.5 | ||
137 | 24.5 | ||
Сумма | 234.5 | Сумма | 116.5 |
Этих данных достаточно, чтобы воспользоваться формулой расчёта эмпирического значения критерия:
Гипотеза H 0 о незначительности различий между выборками принимается, если U кр < u эмп. В противном случае H 0 отвергается и различие определяется как существенное.
где U kp - критическая точка, которую находят по таблице Манна-Уитни.
Найдем критическую точку U kp
По таблице находим U kp (0.05) = 45
Так как U kp > u эмп - принимаем альтернативную гипотезу H 1 ; различия в уровнях выборок можно считать существенными.
По уровню какого-либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми выборками.
Другие названия: критерий Манна - Уитни - Уилкоксона (англ. Mann - Whitney - Wilcoxon, MWW ), критерий суммы рангов Уилкоксона (англ. Wilcoxon rank-sum test ) или критерий Уилкоксона - Манна - Уитни (англ. Wilcoxon - Mann - Whitney test ).
История
Данный метод выявления различий между выборками был предложен в 1945 году Френком Уилкоксоном (F. Wilcoxon ). В 1947 году он был существенно переработан и расширен Х. Б. Манном (H. B. Mann ) и Д. Р. Уитни (D. R. Whitney ), по именам которых сегодня обычно и называется.
Описание критерия
Простой непараметрический критерий. Мощность критерия выше, чем у Q-критерия Розенбаума .
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами (ранжированным рядом значений параметра в первой выборке и таким же во второй выборке). Чем меньше значение критерия, тем вероятнее, что различия между значениями параметра в выборках достоверны.
Ограничения применимости критерия
- В каждой из выборок должно быть не менее 3 значений признака. Допускается, чтобы в одной выборке было два значения, но во второй тогда не менее пяти.
- В выборочных данных не должно быть совпадающих значений (все числа - разные) или таких совпадений должно быть очень мало.
Использование критерия
Для применения U-критерия Манна - Уитни нужно произвести следующие операции.
Автоматический расчет U-критерия Манна - Уитни
Таблица критических значений
См. также
- Критерий Краскела - Уоллиса - многомерное обобщение U-критерия Манна - Уитни.
Литература
- Mann H. B., Whitney D. R. On a test of whether one of two random variables is stochastically larger than the other. // Annals of Mathematical Statistics. - 1947. - № 18. - P. 50-60.
- Wilcoxon F. Individual Comparisons by Ranking Methods. // Biometrics Bulletin 1. - 1945. - P. 80-83.
- Гублер Е. В., Генкин А. А. Применение непараметрических критериев статистики в медико-биологических исследованиях. - Л., 1973.
- Сидоренко Е. В. Методы математической обработки в психологии. - С-Пб., 2002.
Wikimedia Foundation . 2010 .
Смотреть что такое "U-критерий Манна - Уитни" в других словарях:
критерий Манна Уитни - — Тематики электросвязь, основные понятия EN Mann Whitney U test … Справочник технического переводчика
U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия
U критерий Манна Уитни (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении … Википедия
U критерий Манна Уитни (англ. Mann Whitney U test) статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять… … Википедия
- (англ. Mann Whitney U test) непараметрический статистический критерий, используемый для оценки различий между двумя выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять различия в значении параметра между малыми … Википедия
Или Критерий согласия Колмогорова Смирнова статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели.… … Википедия
Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона Манна Уитни. Критерий Краскела Уоллиса является ранговым, поэтому он инвариантен по отношению к любому… … Википедия
Критерий Кохрена используют при сравнении трёх и более выборок одинакового объёма. Расхождение между дисперсиями считается случайным при выбранном уровне значимости, если: где квантиль случайной величины при числе суммируемых… … Википедия
- (максиминный критерий) один из критериев принятия решений в условиях неопределённости. Критерий крайнего пессимизма. История Критерий Вальда был предложен Абрахамом Вальдом в 1955 году для выборок равного объема, а затем распространен на … Википедия
U-критерий Манна-Уитни чаще всего используется при обработке результатов эмпирического исследования при написании курсовых, дипломных и магистерских работ по психологии.
U-критерий Манна-Уитни - непараметрический статистический критерий. Это означает, что его требования к группам и измеренным психологическим показателям минимальны:
- Сравниваемые выборки не должны быть очень большими - не более 60 человек в каждой. Если группы большего объема, то лучше использовать t-критерий Стъюдента .
- Минимальная численность групп ограничена 3-мя испытуемыми в каждой группе.
- Численность сравниваемых групп может быть не одинаковой, но не должна очень сильно различаться.
- Психологические показатели могут быть показателями психологических тестов, школьными оценками, экспертными оценки успешности профессиональной деятельности и т.п.
Как рассчитывается U-критерий Манна-Уитни
Не вдаваясь в математические тонкости, рассмотрим логику расчёта U-критерия Манна-Уитни.
Например, в результате тестирования были получены интегральные показатели осмысленности жизни замужних и незамужних женщин . Одной из задач дипломной работы ставится выявление различий осмысленности жизни у женщин, состоящих и не состоящих в браке. Выборки небольшие (по 30 человек), поэтому можно использовать U-критерий Манна-Уитни.
Процедура расчёта U-критерия Манна-Уитни в самом общем и приближенном виде выглядит следующим образом:
- Показатели осмысленности жизни женщин обеих групп ранжируются (располагаются в порядке возрастания).
- Оба упорядоченных ряда объединяются и вновь ранжируются.
- Если в общем ранжированном ряду показателей осмысленности жизни показатели замужних и незамужних женщин чередуются или пересекаются, то различий, скорее всего, нет.
- Возможно, что в общем ранжированном ряду показателей осмысленности жизни показатели замужних и незамужних женщин слабо пересекаются. Например, показатели незамужних женщин расположены в области низких показателей осмысленности жизни, а показатели замужних - в области высоких. В этом случае, скорее всего, различия в уровне осмысленности жизни в экспериментальной и контрольной группах есть - осмысленность жизни у замужних женщин выше, чем у незамужних.
При расчете U-критерия Манна-Уитни с помощью статистических программ выдается значение самого критерия и уровень статистической значимости различий выраженности психологического показателя. Эти показатели необходимо занести в таблицу и выделить те психологические показатели, уровень значимости различий которых в группах ниже, чем 0,05.
Пример расчета U-критерия Манна-Уитни вручную
В результате психодиагностического обследования групп мужчин и женщин (по 20 человек в каждой) были выявлены показатели внутреннего сопротивления при обращении в службу знакомств (в баллах):
- Мужчины: 45 67 45 67 88 67 56 67 78 56 45 67 89 56 4 56 74 57 89 67
- Женщины: 70 66 66 66 63 63 61 60 54 47 13 45 56 45 34 45 34 5 62 34