Представление результатовНа рис. 8.4 приведены фрагменты выводимых результатов, сгенерированные программой после выполнения шага 4 и 5. Первое, на что необходимо обратить внимание при интерпретации выводимых результатов, - это соотношение между наблюдаемыми (Count) и ожидаемыми (Expected count) частотами в каждой ячейке. Беглый взгляд на первую таблицу говорит о том, что эти величины заметно различаются. Как уже отмечалось, это различие характеризуется остатком, который рассчитывается как разность между наблюдаемой и ожидаемой величинами. При составлении таблицы сопряженности мы включили в каждую ячейку остаток (Residual), поэтому па самом деле вам нет необходимости самому сравнивать наблюдаемую величину с ожидаемой, чтобы оценить их соотношение. Итак, различие наблюдаемых и ожидаемых величин говорит о том, что переменные пол и хобби связаны друг с другом. Это подтверждается относительно большим значением критерия (14,032) и малым значением р-уровня (р<0,000), то есть высокой статистической значимостью. Как можно видеть, аналогичная картина наблюдается и с результатами остальных тестов на независимость.
Рис. 8.4. Фрагменты окна вывода после выполнения шага 56 Для таблиц сопряженности большой размерности следует помнить о проблеме малых значений частот. Малым считается значение ожидаемой частоты, меньшее 5. Предполагается, что если более 25 % ячеек таблицы сопряженности имеют малые ожидаемые значения частот, то вероятность ошибки -анализа очень высока. В этом случае необходимо исключать градации с малыми значениями частот или объединять градации.
|