Создание таблиц сопряженности
Рассмотрим файл candidats.sav (данные по списку кандидатов в депутаты Парламента Республики Молдова от ПКРМ на выборах 2005г.). Загрузите файл с вашими данными. Для создания таблиц сопряженности и вычисления на их основе меры связанности, выберите меню команды Анализ / Описательные статистики/Таблицы сопряженности. Откроется диалоговое окно Таблицы сопряженности. Здесь в списке исходных переменных можно выбрать переменные для строк и столбцов таблицы сопряженности. Для каждого сочетания двух переменных будет создана таблица сопряженности. Например, если в списке Строки находится три переменных, а в списке Столбцы – две, то мы получим 3x2=6 таблиц сопряженности. Построим таблицу сопряженности из переменных «пол» и «профессия». Чтобы таблица приняла более удобный для анализа вид, перенесем переменную «пол» в список Столбцы, а «профессия» – в список Строки (рис.3.1). (Сравните с таблицей, когда в строках – пол, а в столбцах - профессия). Рис.3.1. Диалоговое окно «Таблица сопряженности»
Первая таблица содержит информацию о числе самих наблюдений (рис.3.2). Рис.3.2. Таблица «Сводка обработки наблюдений»
Из второй таблицы (рис.3.3) (собственно таблицы сопряженности) видно, что два наблюдения содержат пропущенные (или утерянные) значения в переменной «профессия». Переменная «пол» является столбцовой переменной, т.к. каждое её значение отображается в отдельном столбце. Соответственно, «профессия» - это переменная строк. Значение в каждой ячейке таблицы – количество наблюдений (частота). Числа в последней строке и в последнем столбце Итого показывают суммы значений соответственно по строкам и столбцам.
Рис.3.3. Таблица сопряженности «Профессия*пол»
Так, из столбца Итого видно, что из общего числа кандидатов в депутаты по профессиональной принадлежности превалируют инженерные (31 из 100), педагогические (10 из 100) и юридические (10 из 100) специальности. Причем большинство кандидатов, как в данных специальностях, так и во всей совокупности – это мужчины (см. строку Итого и строки наиболее массовых профессий). · В данном примере из 100 человек – 77 мужчин и 23 женщины. · Среди женщин-кандидатов наибольшей популярностью пользуется, в первую очередь, педагогическое направление (4 педагога и 2 преподавателя), затем – инженерное и юридическое (по 3 для каждого направления) и медицинское (2). · Мужчины наиболее перспективными считают: 1. инженерные профессии; 2. педагогику и преподавание; 3. юриспруденцию; 4. экономику. Для данной таблицы сопряженности параметры приняты по умолчанию, поэтому в каждой ячейке отображается только абсолютная частота. Более тщательно исследовать существование зависимости позволяет вычисление значений ожидаемых частот. Чтобы определить эти значения, выполните следующие действия: · выберите меню команды Анализ / Описательные статистики/Таблицы сопряженности; · соответствующие переменные перенесите в список строк и список столбцов; · щелкните на кнопке Ячейки. Откроется диалоговое окно Таблицы сопряженности: Вывод в ячейках (рис.3.4).
Рис.3.4. Диалоговое окно «Таблицы сопряженности: Вывод в ячейках»
По умолчанию в ячейках таблицы сопряженности отображаются только наблюдаемые значения частот. В группе Частоты можно выбрать один или более следующих вариантов: - Наблюдаемые. Будут отображаться наблюдаемые частоты. Это настройка по умолчанию. - Ожидаемые. Если установить этот флажок, будут отображаться ожидаемые частоты. Они вычисляются как произведение сумм соответствующей строки и столбца, деленное на общую сумму частот. · установите флажок Ожидаемые; · щелкните Продолжить и затем OK. Вы получите таблицу сопряженности, где под наблюдаемыми частотами расположены ожидаемые значения (рис.3.5).
Рис.3.5. Таблица сопряженности «Профессия*пол», содержащая ожидаемые частоты
Ещё одну возможность выявления существования зависимости между переменными дает вычисление остатков. Эти остатки являются показателем того, насколько сильно наблюдаемые и ожидаемые частоты отклоняются друг от друга. Чтобы получить остатки частот, выберите меню команды Анализ / Описательные статистики/Таблицы сопряженности, перенесите переменные соответственно в список строк и список столбцов, затем щелкните на кнопке Ячейки. Флажки Наблюдаемые и Ожидаемые следует оставить помеченными. В группе Остатки можно выбрать один или более следующих вариантов отображения: · Нестандартизированные (ненормированные). Отображаются ненормированные остатки, т.е. разность наблюдаемых () и ожидаемых () частот. · Стандартизированные (Нормированные): Отображаются нормированные остатки. Для этого ненормированные остатки делятся на квадратный корень из ожидаемой частоты: Нормированные остатки полезны при последующем проведении анализа тестов по критерию . · Скорректированные стандартизированные (Уточненные и нормированные). Нормированные остатки вычисляются с учетом сумм по строкам и столбцам: где z – сумма по текущей строке, s – сумма по текущему столбцу, N – общая сумма частот. Установите флажок Нестандартизированные и щелкните Продолжить, а в главном диалоговом окне – OK. Перед вами появится таблица сопряженности, содержащая абсолютные частоты, ожидаемые частоты и остаток (рис.3.6). Рис.3.6. Таблица сопряженности «Профессия*пол», содержащая абсолютные частоты, ожидаемые частоты и остаток
|