Типичные примеры использования Multiple Response Tables
Пример 1. Подготовка дихотомически закодированного неальтернативного признака. В анкете имеются вопросы «Сколько лет проживали 14. В Западной Сибири? 15. В Восточной Сибири? 16. На Дальнем Востоке?» Рассмотрим, как можно получить в одной таблице распределение по неальтернативному признаку «Места проживания», полученному по ответам на эти вопросы. Элементарные дихотомические переменные, соответствующие данному признаку, можно построить с помощью следующих команд: COMPUTE m1 = V14. COMPUTE m2 = V15. COMPUTE m3 = V16. RECODE m1 m2 m3 (1 THR HI = 1). VAR LAB m1 "Зап Сиб" m2 "Вост Сиб" m3 "Дальн Вост". * General Tables. TABLES /MRGROUP $v3 'Мешает договору' v3s1 to v3s8 /MDGROUP $region m1 m2 m3 (1) /GBASE = RESPONSES /FTOTAL = $t000005 "Total" $t000006 "Total" /TABLE = $region + $t000005 BY $v3 + $t000006 /STATISTICS count($v3(F5.0)) rpct($v3(PCT5.1) 'Row Response %':$region) rpct($v3(PCT5.1) 'Col Response %':$v3). Пример 2. Объединение подсказок в неальтернативном признаке, закодированном в виде списка. Объединение подсказок можно сделать за счет приведения этих переменных в дихотомическую форму. Задача: объединить в 7-м вопросе ответы: «продажа островов» и «продажа с компенсацией» и исследовать его связь с регионом проживания респондента (переменная R). Для этого следует выполнить программу: COUNT D1 = V7S1 TO V7S7 (1)/ D2 = V7S1 TO V7S7 (2,3)/ D3 = V7S1 TO V7S7(4 TO 10). RECODE D1 TO D3(1 THR 10 = 1). *метки переменных. VAR LAB D1 'Жесткий вариант' D2 'Совместное использование' D3 'мягкий вариант'. TABLES MDGROUPS D "Степень жесткости позиции" D1 D2 D3(1) /TABLES D+T BY R+T/ STAT COUNT(D) CPCT(D:D) CPCT(D:R). 3.4. Множественные сравнения в таблицах Как уже было отмечено, в сложных табличных отчетах SPSS отсутствуют статистики значимости. Это касается также таблиц для неальтернативных вопросов. Этот пробел восполнила программа Typology Tables, разработанная в Институте экономики и ОПП СО РАН, г. Новосибирск (исследование финансировалось грантом РФФИ № 00-06-80221). В программе рассматриваются двумерные таблицы частотных распределений и таблицы средних по количественным переменным в группах по сочетаниям ответов на неальтернативные вопросы. Исследуется значимость отклонений частот от ожидаемых в условиях независимости ответов на два вопроса и отклонений эмпирических средних от теоретических средних в итоговых ячейках. Эта программа может быть вставлена пунктом командой меню в SPSS версий 8, 9, 10. 3.4.1. Z -статистика значимости отклонения частот В качестве статистики значимости используется асимптотически нормально (~N (0, 1))распределенная статистика Z =(N 11 – E 11) / s. Мы уже рассматривали эту статистику под названием ASRESID (Adjusted residuals) в CROSSTABS. Для малых выборок эта статистика корректируется на основе прямого вычисления вероятностей так, чтобы для нее выполнялись соотношения нормального распределения. 3.4.2. Z -статистика отклонения средних При анализе средних в таблицах для неальтернативных признаков каждая ячейка рассматривается по отдельности, при этом среднее в группе, соответствующей ячейке, сравнивается со средними по объектам, не содержащимся в группе. Обозначим A совокупность объектов, соответствующую i -му ответу вертикального и j -му ответу горизонтального вопроса, B – ее дополнение. Число объектов в группе A равно NA = N ij. Группа объектов B может иметь разное содержание в зависимости от того, с чем мы хотим сравнить среднее в этой группе: 1) со средним по всей совокупности, тогда B – дополнение A до всей совокупности и содержит NB = N – N ij объектов; 2) с итоговым средним по строке, тогда B – дополнение A до i -й группы по вертикальному вопросу, а NB = N i . – N ij; 3) с итоговым средним по столбцу, тогда B – дополнение A до j -й группы по горизонтальному вопросу, а NB = N . j – N ij. Для проверки значимости различия средних в группах A и B в предположении теоретического нормального распределения, при несовпадении дисперсии в группах используется статистика , где S – оценка дисперсии X на исследуемой совокупности. Автором данного методического пособия показано, что в случае, когда случайные величины и получаются за счет перемешивания выборки по переменной X, знаменатель выражения для Z является точным значением дисперсии разности и . Распределение Z асимптотически нормально. 3.4.3. Как выяснить надежность результата? В соответствии с общепринятым использованием 5 %-го уровня значимости мы можем заявить, что величина стандартизованного смещения Z, превышающая 1,96, свидетельствует о существенности связи (вероятность в условиях независимости получить большее смещение равна 5 %, см. выделенные клетки со значимыми смещениями в табл. 2). Однако это утверждение о значимости верно только для отдельно взятой клетки таблицы, как мы ранее показали, вероятность того, что в этой таблице из 100 независимых клеток имеется хотя бы одна «значимая» статистика, равна 99,41. Это результат множественных сравнений статистик. Чтобы снизить вероятность принятия случайных отклонений за закономерные, нужно использовать более жесткий критерий, хотя, конечно, и обычное применение Z -статистик позволяет избежать очевидных ошибок. К сожалению, таблицу с Z -статистиками, подобную табл. 2, обычными средствами статистических пакетов получить сложно, поскольку в них нет средств анализа значимости по неальтернативным вопросам. 3.4.4. Критические значения Z -статистики при множественных сравнениях Для выяснения значимости вычисляется критическое значение максимальной по модулю Z - статистики таблицы (max | Z ij|), и значимыми считаем Z ij, превышающие это значение. Как обычно, критическое значение выбирается так, чтобы вероятность случайно его превзойти была равна заданному значению (обычно 5 %).
|