Анализ связи между неколичественными переменными
3.2.1. CROSSTABS – таблицы сопряженности CROSSTABS позволяет получать таблицы сопряженности многомерных распределений и связей двух и более переменных. Рекомендуется использовать CROSSTABS для переменных с небольшим числом значений (обычно для неколичественных переменных), так как каждая комбинация значений соответствует новой клетке в таблице. CROSSTABS /TABLES = v1 v2 BY v10 BY pol. Таблицы сопряженности для пары переменных X и Y содержат частоты Nij, с которыми встретилось сочетание i -го значения X и j -го значения Y. Кроме того, в таблице обязательно присутствуют маргинальные частоты Ni.. , равные сумме чисел Nij по i -строке; N. j – сумме по столбцу (частоты i -го значения X и j -го значения Y, подсчитанные независимо) и N – общее число объектов. Основные подкоманды CROSSTABS: /TABLES – задание таблиц; /CELLS – статистики клеток таблицы; /STATISTICS –статистики взаимосвязи переменных; /METHOD – метод проверки значимости связи переменных; /BARCHART – столбиковая диаграмма. 3.2.1.1. Подкоманда /TABLES – задание таблиц Параметр TABLES может быть опущен: CROSSTABS v1 TO v5 BY v10. Строки таблицы сопряженности соответствуют значениям переменной, указанной в тексте команды перед ключевым словом «BY»; столбцы матрицы соответствуют значениям переменной, расположенной после «BY». Пример. Совместное распределение по региону (R), точке зрения на иностранную помощь (v1) и полу (V8): CROSSTABS TABLES R BY v1 BY v8/cells = COUNT ROW. В результате выполнения этой команды рассчитывается табл. 3.3. Перед ключевым словом BY указываются переменные, по которым вычисляется двувходовая таблица (переменная, значения которой идентифицируют строки), после ключевого слова BY указываются переменные, идентифицирующие столбцы. За следующими BY идут переменные условий, определяющие подвыборки, на которых рассчитываются таблицы. Хотя в современной версии пакета эти таблицы объединяются в одну таблицу, их статистический анализ производится по отдельности. Ключевым словом BY могут разделяться и списки переменных. В этом случае процедурой получаются таблицы по всем парам таблиц из первого и второго списка. Например, CROSSTABS V8 V11 V12 BY V4 V1. Эта команда выведет таблицу сопряженности: V8 c V4, V8 c V1, V11 c V4, V11 c V1 и т. д., то есть сочетания по всем переменным, перечисленным в команде. Всего будет выдано на печать 6 таблиц. Если более двух списков переменных разделены ключевыми словами BY, то переменные, стоящие за вторым, третьим и т. д. BY, задают условия получения таблиц. Таблицы формируются на подвыборках, соответствующих сочетаниям значений этих переменных. Таблица3.3 Распределение переменной «Точка зрения на иностранную помощь»
Употребление BY в команде CROSSTABS возможно до 10 раз, но и этого достаточно, чтобы занять все ресурсы компьютера. Если мы хотим получить в одной команде CROSSTABS несколько независимых таблиц, то следует отделять списки переменных символом /: CROSSTABS V8 V11 BY V4 V1/ V12 BY V1 /CELLS row. Таблица, заполненная одними частотами Nij, обычно не имеет смысла, так как она не проясняет должным образом взаимосвязи переменных. Для исследования взаимосвязи необходимы статистики оценки взаимосвязи самих переменных и статистики оценки связи их значений. 3.2.1.2. Подкоманда /CELLS Параметр CELLS задает вывод некоторых статистик (см. ниже параметры подкоманды CELLS) для клеток таблицы сопряженности. Cells переводится как «клетка». Если этот параметр не указан, то в клетках таблицы выводятся только абсолютные частоты. Пример задания статистик клеток: CROSSTABS V1 BY V4 /CELLS = COUNT ROW COLUMN. Параметры подкоманды /CELLS: COUNT – абсолютное число объектов (Nij); ROW – проценты по строке; COLUMN – проценты по столбцу; TOTAL – проценты по отношению ко всей выборке; EXPECTED – частоты (Eij = Ni. × N.j/N), ожидаемые в случае независимости переменных (N – общая сумма частот в таблице); RESID – изменение (Nij – Eij) частоты Nij по сравнению с ожидаемым Eij в условиях независимости переменных; SRESID – стандартизованное изменение частоты по сравнению с ожидаемым (Nij – Eij)/ . Напомним, что статистика хи-квадрат, вычисляемая для проверки гипотезы независимости рассматриваемых переменных, является суммой квадратов этих величин. ASRESID – стандартизованные изменения частоты Zij = (Nij – Eij)/σ ij, где σ ij вычисляется исходя из гипергеометрического распределения Nij (см. ниже п. 3.3.1). Статистика Zij имеет асимптотически нормальное распределение N (0,1); ALL – вывод для клетки всех статистик. Табл. 3.4 получена в результате преобразования данных и применения процедуры CROSSTABS с параметром CELLS: RECODE v4 (1,2 = 1)(3 = 2)(4 = 3) into W4. VAR LAB W4 "Возможность удовлетворить территориальные требования Японии". VAL LAB W4 1 "отдать" 2 "не надо" "не знаю". CROSSTABS /TABLES = v1 BY W4 /CELLS = COUNT ROW col. Верхний процент в клетке означает отношение числа объектов, попавших в эту клетку, к итоговой сумме числа объектов по строке. Нижний процент соответствует отношению значения клетки к итоговой сумме по столбцу. По величине процентов, приведенных в клетках, можно сравнивать группы респондентов по распределению как по значениям «вертикальной» переменной, так и по «горизонтальной». В частности, анализируя первую строку матрицы (она соответствует ответам тех респондентов, которые считают, что иностранная помощь не нужна), видим, что основная часть – 81,7 % этой группы респондентов против передачи островов Японии. При этом их доля среди тех, кто против передачи островов, составляет всего 27,2 %; а основная часть (62,0 %) противников передачи островов допускает возможность получения ограниченной иностранной помощи. В последнем столбце таблицы расположены итоги по каждой строке, которые совпадают с распределением по переменной v1. Так как до выполнения команды CROSSTABS были объявлены неопределенные значения v1 и v4, таблица рассчитывалась без их учета, поэтому объем выборки, учтенный в таблице, составил 712 анкет из 721 имеющихся. Аналогичные данные для столбцов приведены в строке TOTAL. Таблица3.4 Связь ответов на вопросы «Точки зрения на иностранную помощь»
Проценты в CROSSTABS позволяют изучать взаимосвязь переменных, а не только структуру таблицы. В частности, сравнивая строки, можно сделать заключение, что более склонны отдать острова те, кто считает, что нужна помощь восточным регионам (37 %), чем те, кто считает, что помощи не нужно. Можно взять в качестве точки отсчета распределение в целом по совокупности (всего 15 % в среднем по массиву готовы отдать все или часть островов).
|