Проблема определения числа факторов.
Как уже говорилось полное описание дисперсии исходных признаков возможно только в ситуации, когда число факторов равно числу исходных признаков. Основная направленность факторного анализа – это именно сокращение числа показателей, и, следовательно, мы идем на то, что полученные факторы не будут на 100% объяснять исходную информацию и то, сколько же именно процентов будет объяснено, зависит от того, какое число факторов будет получено. Матрица объясненной дисперсии в таблице 5.1 показывает, что если будет взято 3 фактора, то они объяснят около35% исходной информации, а если возьмем 8 факторов, то такая модель объяснит уже около 68% информации. Какой процент является приемлемым, на каком числе факторов остановиться? Точного ответа на этот вопрос нет, однако есть несколько подходов, дающих определенные основания для его решения. Критерий Кайзера. Есть определенные математические основания говорящие, что целесообразно отбирать столько факторов, сколько существует собственных чисел корреляционной матрицы, больших единицы. Для нашего примера таких чисел 5 и потому в данной модели было отобрано именно 5 факторов. Отметим, что критерий Кайзера по отбору числа факторов в команде факторного анализа SPSS используется по умолчанию. Второй подход. Мы сами будем отбирать число факторов, ориентируясь на то, что бы это число факторов объясняло требуемый процент общей исходной дисперсии. Например, если исследователь решает, что факторная модель должна объяснять не менее 75% общей дисперсии исходных переменных, то таблица общей дисперсии в таблице 5.1 показывает, что необходимо взять 10 факторов. Определение числа факторов осуществляется в меню Extraction.., вызов которого осуществляется нажатием соответствующей клавиши в главном меню команды факторного анализа (рисунок 5.1). На рисунке 5.6 показано меню Extraction. В меню Extraction так же находится окно, выбрав которое можно получить график «каменной осыпи» (окно Scree plot). В той части меню, которая названа Extrаct, мы определяем что выбор числа факторов будет осуществляться через значения собственных числе («Eigenvalues over» - собственные числа больше чем…), либо через непосредственное указание требуемого числа факторов («Number of factors»). В любом случае мы должны указать точное значение (либо собственных чисел, либо числа факторов), которые будут основанием для отбора числа факторов в модели.
|