Тесты для ранговых переменных
В ряде методов по имеющимся числовым значениям исследуемой переменной объектам приписываются ранги. Для вычисления рангов объекты упорядочиваются от минимального значения переменной к максимальному, и порядковые номера объектов считаются рангами. Если для некоторых объектов числовые значения переменной повторяются, то всем этим объектам приписывается единый ранг, равный среднеарифметическому значению их порядковых номеров. Об объектах, ранги которых совпадают, говорят, что они имеют связанные ранги. Наличие связанных рангов в выдаче по ранговым тестам обозначается словом «ties» (связи). Обычно выводится число связей и статистика критерия, скорректированная для связей. В качестве примера построения рангов возьмем упорядоченную информацию об успеваемости 7 студентов.
Первые три объекта имеют ранги 1, 2, 3; следующая пара – ранг 4,5 = (4 + 5) / 2, следующая пара – 6 и 7. 5.3.1. Двухвыборочный тест Манна – Уитни (Mann – Witney) Критерий предназначен для сравнения распределений переменных в двух группах на основе сравнения рангов. NPAR TESTS M-W = V14 BY Tp(1,4). Задание теста аналогично заданию критерия Колмогорова - Смирнова (вместо ключевого слова K-S используется слово M-W). Статистикой критерия является сумма рангов объектов в меньшей группе, хотя существует пара эквивалентных формул, обозначаемых U и W. Можно также считать, что критерием является средний ранг в указанной группе. Если он значительно отклоняется от ожидаемой величины (N + 1) / 2 (или средние ранги в группах существенно различны), то обнаруживается отличие распределений. Если гипотеза о совпадении распределений не отвергается, то это означает близость средних рангов в группах, но совпадение распределений не гарантируется (хотя бы потому, что они могут отличаться сколь угодно мало). Авторам теста удалось показать асимптотическую нормальность статистики в условиях выборки групп из одной совокупности, на основе чего отыскивается наблюдаемая значимость критерия – вероятность случайно отклониться от среднего (ожидаемого) значения ранга больше, чем отклонилось выборочное значение статистики. В выдаче распечатывается значения статистик U и W, а также двусторонняя значимость критерия. Пример. Используя ранговый критерий, требуется сравнить по возрасту группу считающих, что острова нужно отдать по юридическим причинам, и группу имеющих иное мнение. COUNT d2 = v6s1 TO v6s8 (2). IF (d2>0) wd2 = 1. IF (v4 = 1 or v4 = 2) wd2 = 2. NPAR TEST M-W = v9 BY wd2(1,3). По величине двусторонней значимости можем сделать вывод, что тест Манна - Уитни в указанных группах не обнаружил существенных различий между распределениями по возрасту (табл. 5.10 – 5.11). Таблица5. 10 Критерий Манна - Уитни. Суммы рангов
Таблица5. 11 Критерий Манна - Уитни. Значимость критерия
Одномерный дисперсионный анализ Краскэла - Уоллиса (Kruskal - Wallis) В основе сравнения средних рангов заданного числа групп лежит одномерный дисперсионный анализ, в котором вместо значений переменных используются ранги объектов исследуемой переменной. NPAR TESTS K-W = V14 BY V4(1,3). В условиях гипотезы равенства распределений в группах нормированный межгрупповой разброс имеет распределение, близкое к распределению хи-квадрат. В выдаче распечатывается значимость этой статистики. Следующий пример показывает различие доходов жителей населенных пунктов разного типа. NPAR TESTS K-W = v9 BY tp(1,4). Таблица5. 12 Тест Краскэла – Уоллиса. Средние ранги
Таблица5. 13 Тест Краскэла - Уоллиса. Значимость критерия
Тест показывает (Sig=0), что точка зрения респондента на иностранную помощь существенно связана c типом населенного пункта, в котором он проживает (табл. 5.12 - 5.13).
|