Анализ связи между неколичественными переменными. CROSSTABS - таблицы сопряженности
CROSSTABS получает таблицы сопряженности многомерных распределений и связей двух и более переменных. Рекомендуется использовать CROSSTABS для переменных с небольшим числом значений (обычно для неколичественных переменных), так как каждая комбинация значений соответствует новой клетке в таблице. CROSSTABS /TABLES= v1 v2 BY v10 BY pol. Таблицы сопряженности для пары переменных X и Y содержат частоты Nij, с которыми встретилось сочетание i -го значения X и j -го значения Y. Кроме того, в таблице обязательно присутствуют маргинальные частоты Ni. - равные сумме чисел Nij по строке; N.j - сумме по столбцу (частоты i -го значения X и j -го значения Y, подсчитанные независимо) и N - общее число объектов. Таблица, заполненная одними частотами Nij, обычно не имеет смысла, так как не проясняет должным образом взаимосвязи между переменными. Для исследования взаимосвязи необходимы статистики взаимосвязи переменных и статистики связи значений.
Основные подкоманды CROSSTABS: /TABLES - задание таблиц; /CELLS - статистики клеток таблицы; / STATISTICS - статистики взаимосвязи переменных. /METHOD - метод проверки значимости связи переменных. /BARCHART - столбиковая диаграмма. /TABLES задание таблиц Параметр TABLES может быть опущен: CROSSTABS v1 TO v5 BY v10. Строки таблицы сопряженности соответствуют значениям переменной, указанной в тексте команды перед ключевым словом "BY"; столбцы матрицы соответствуют значениям переменной, расположенной после " BY ". Пример - совместное распределение по региону (R), точке зрения на иностранную помощь (v1) и полу (V8): CROSSTABS TABLES R BY v1 BY v8/cells = COUNT ROW. В результате выполнения этой команды рассчитывается таблица 3.3. Перед ключевым словом BY указываются переменные, по которым вычисляется двухвходовая таблица (переменная, значения которой идентифицируют строки), после ключевого слова BY указываются переменные, идентифицирующие столбцы. За следующими BY идут переменные условий, определяющие подвыборки, на которых рассчитываются таблицы. Хотя в современной версии пакета эти таблицы объединяются в одну таблицу, их статистический анализ производится по-отдельности. Ключевым словом BY могут разделяться и списки переменных. В этом случае процедурой получаются таблицы по всем парам таблиц из первого и второго списка. Например, CROSSTABS V8 V11 V12 BY V4 V1. Эта команда выведет таблицу сопряженности: V8 c V4, V8 c V1, V11 c V4, V11 c V1 и т.д., то есть сочетания по всем переменным, перечисленным в команде. Всего будет выдано на печать 6 таблиц. Если более двух списков переменных разделены ключевыми словами " BY ", то переменные, стоящие за вторым, третьим и т.д. " BY ", задают условия получения таблиц. Таблицы формируются на подвыборках, соответствующих сочетаниям значений этих переменных. Таблица 3.3. Распределение переменной "Точка зрения на иностранную помощь" в разрезе региона и пола респондентов.
Употребление " BY " в команде CROSSTABS возможно до 10 раз, но и этого достаточно, чтобы занять все ресурсы компьютера. Если мы хотим получить в одной команде CROSSTABS несколько независимых таблиц, то следует отделять списки переменных символом "/":. CROSSTABS V8 V11 BY V4 V1/ V12 BY V1/cells row.
CELLS Параметр CELLS задает вывод некоторых статистик (см. ключевые слова параметра CELLS) для клеток таблицы сопряженности. " CELLS " переводится как "клетка". Если этот параметр не указан, то в клетках таблицы выводятся только абсолютные частоты. CROSSTABS V1 BY V4 /CELLS = COUNT ROW COLUMN. Параметры подкоманды /CELLS COUNT - абсолютное число объектов (Nij); ROW - проценты по строке; COLUMN - проценты по столбцу; TOTAL - проценты по отношению ко всей выборке; EXPECTED - частоты (Eij=Ni.*N.j/N), ожидаемые в случае независимости переменных (N – общая сумма частот в таблице); RESID - изменение частоты по сравнению с ожидаемым (Nij - Eij); SRESID - стандартизованное изменение частоты по сравнению с ожидаемым (Nij - Eij)/ (корень из слагаемого статистики Хи-квадрат, вычисляемой для проверки гипотезы независимости); ASRESID - стандартизованное к нормальному распределению N(0,1) изменение частоты Zij =(Nij - Eij)/ σij; ALL - вывод для клетки всех статистик; Таблица 3.4. Связь "Точки зрения на иностранную помощь" и "Возможн. удовлетворить территор. требований Японии" (частоты и проценты)
Таблица 3.4 получена в результате преобразования данных и применения процедуры CROSSTABS с параметром CELLS: recode v4 (1,2=1)(3=2)(4=3) into W4. var lab W4 "Возможность удовлетворить территориториальные требования Японии". Val lab W4 1 "отдать" 2 "не надо" "не знаю". CROSSTABS /TABLES = v1 BY W4 /CELLS= COUNT ROW col. Верхний процент в клетке соответствует отношению абсолютного числа объектов, попавших в эту клетку, к итоговой сумме по строке. Нижний процент соответствует отношению значения клетки к итоговой сумме по столбцу. По величине процентов, приведенных в клетках, можно сравнивать группы респондентов по распределению как по "вертикальной" переменной, так и по "горизонтальной". В частности, анализируя первую строку матрицы (она соответствует ответам тех респондентов, которые считают, что иностранная помощь не нужна), видим, что основная часть - 81.7% этой группы респондентов против передачи островов Японии. При этом их доля среди тех, кто против передачи островов, составляет всего 27.2%; а основная часть (62.0%) противников передачи островов допускает возможность получения ограниченной иностранной помощи. В последнем столбце таблицы расположены итоги по каждой строке, которые совпадают с распределением по переменной V1. Так как до выполнения команды CROSSTABS, были объявлены неопределенные значения v1 и v4, таблица рассчитывалась без их учета, поэтому объем выборки, учтенный в таблице, составил 712 анкет из 721 имеющихся. Аналогичные данные приведены в строке TOTAL для столбцов. Проценты в Crosstabs позволяют изучать взаимосвязь переменных, а не только структуру таблицы. В частности, сравнивая строки, можно сделать заключение, что более склонны отдать острова те, кто считает, что нужна помощь восточным регионам (37%), чем те, кто считает, что помощи не нужно. Можно взять в качестве точки отсчета распределение в целом по совокупности (15% всего готовы отдать все или часть островов в среднем по массиву).
|