На рис. 8.4 приведены фрагменты выводимых результатов, сгенерированные программой после выполнения шага 4 и 5.
Первое, на что необходимо обратить внимание при интерпретации выводимых результатов, - это соотношение между наблюдаемыми (Count) и ожидаемыми (Expected count) частотами в каждой ячейке. Беглый взгляд на первую таблицу говорит о том, что эти величины заметно различаются. Как уже отмечалось, это различие характеризуется остатком, который рассчитывается как разность между наблюдаемой и ожидаемой величинами. При составлении таблицы сопряженности мы включили в каждую ячейку остаток (Residual), поэтому па самом деле вам нет необходимости самому сравнивать наблюдаемую величину с ожидаемой, чтобы оценить их соотношение. Итак, различие наблюдаемых и ожидаемых величин говорит о том, что переменные пол и хобби связаны друг с другом. Это подтверждается относительно большим значением критерия (14,032) и малым значением р-уровня (р<0,000), то есть высокой статистической значимостью. Как можно видеть, аналогичная картина наблюдается и с результатами остальных тестов на независимость.
Таблица сопряженности пол * хобби
|
|
|
| хобби
| Итого
|
|
|
| спорт
| компьютер
| искусство
|
пол
| ЖЕН
| Частота
|
|
|
|
|
Ожидаемая частота
| 20,1
| 22,6
| 18,3
| 61,0
|
Остаток
| -5,1
| -3,6
| 8,7
|
|
МУЖ
| Частота
|
|
|
|
|
Ожидаемая частота
| 12,9
| 14,4
| 11,7
| 39,0
|
Остаток
| 5,1
| 3,6
| -8,7
|
|
Итого
| Частота
|
|
|
|
|
Ожидаемая частота
| 33,0
| 37,0
| 30,0
| 100,0
|
Критерии хи-квадрат
|
| Значение
| ст.св.
| Асимпт. значимость (2-стор.)
|
Хи-квадрат Пирсона
| 15,405a
|
| ,000
|
Отношение правдоподобия
| 17,504
|
| ,000
|
Линейно-линейная связь
| 12,652
|
| ,000
|
Кол-во валидных наблюдений
|
|
|
|
a. В 0 (,0%) ячейках ожидаемая частота меньше 5. Минимальная ожидаемая частота равна 11,70.
|
Симметричные меры
|
|
| Значение
| Прибл. значимость
|
Номинальная по номинальной
| Фи
| ,392
| ,000
|
V Крамера
| ,392
| ,000
|
Кол-во валидных наблюдений
|
|
|
Рис. 8.4. Фрагменты окна вывода после выполнения шага 56
Для таблиц сопряженности большой размерности следует помнить о проблеме малых значений частот. Малым считается значение ожидаемой частоты, меньшее 5. Предполагается, что если более 25 % ячеек таблицы сопряженности имеют малые ожидаемые значения частот, то вероятность ошибки -анализа очень высока. В этом случае необходимо исключать градации с малыми значениями частот или объединять градации.