Задание факторного анализа
Задание факторного анализа может быть весьма простым. Например, достаточно задать команду FACTOR и подкоманду VARIABLES с указанием переменных и запустить команду на счет. Однако если удобнее самому управлять расчетами, то следует задать некоторые параметры. Рассмотрим работу такой команды на агрегированном по городам файле наших учебных данных (напоминаем, что объектами этого файла являются города, в которых проводился опрос по поводу возможности передачи Японии Курильских островов, см. выше): FACTOR /VARIABLES W3D1 TO W3D6 /PLOT EIGEN /CRITERIA FACTORS (2) /SAVE REGRESSION (ALL F). Команда задана для получения факторов по переменным – долям числа респондентов, указавших различные причины неподписания договора (/VARIABLES W3D1 TO W3D6): W3D1 – нет необходимости; W3D2 – традиционное недоверие; W3D3 – незаинтересованность Японии; W3D4 – разные политические симпатии; W3D5 – нежелание Японии признать границы; W3D6 – нежелание СССР рассматривать вопрос об островах. Подкоманда /PLOT EIGEN выдает графическую иллюстрацию долей объясненной дисперсии. Подкоманда /CRITERIA FACTORS (2) задает получение 2 факторов; если этой подкоманды не будет, программа сама определит число факторов. Задавая /SAVE REGRESSION ALL F), мы получаем регрессионным методом непосредственно в активном файле оценки всех (ALL) факторов. Это будут переменные F1, F2 с заданным нами корневым именем F и добавленными к нему номерами факторов. Рассмотрим результаты анализа. Табл. 7.1 содержит сведения об информативности полученных главных компонент. Первый фактор объясняет часть общей дисперсии, равную 2,402 (40,04 %), фактор 2 – 1,393 (23,1 %), третий – 0,853 (14,22 %) и т. д. Первые два фактора объясняют 63,25 % дисперсии, первые три – 77,47 %. Поскольку уже третья компонента объясняет менее 1 дисперсии (l3=0,853), рассматривается всего 2 фактора – какой смысл рассматривать факторы, объясняющие меньше дисперсии, чем переменная из исходных данных? Матрица факторных нагрузок представлена в табл. 7.2. Мы не будем анализировать эту матрицу, но ниже проанализируем подробнее факторные нагрузки после вращения (табл. 7.3). Таблица7. 1 Дисперсия, объясненная факторным анализом
Extraction Method: Principal Component Analysis. Таблица7. 2 Матрица факторных нагрузок
Таблица7. 3 Матрица факторных нагрузок после вращения факторов
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Анализ факторных нагрузок показал, что фактор 2 существенно связан с W3D6 – долей считающих, что договор не подписан, так как СССР не желает рассматривать вопрос об островах. Он также отрицательно связан с долей считающих, что все беды из-за непризнания границ Японией (W3D5). Имеется относительно небольшая положительная его связь с переменной W3D1 – «нет необходимости, отношения нормальны». Поэтому можно условно назвать этот фактор «фактором несоветской ориентации». Первый фактор связан с переменными W3D3 – «нет заинтересованности Японии», W3D4 «разные политические симпатии», и несколько слабее, отрицательно, с W3D2 – «недоверие друг другу». Условно его можно назвать фактором «судьбы». Конечно, в серьезных исследованиях можно было бы проверить факторы с самых разных сторон, нам же пока достаточно пояснить принцип интерпретации, который состоит в формулировке содержания фактора, ухватывающего суть явления. Сохраненные в виде переменных подкомандой SAVE факторы могут быть использованы для исследования данных, конструирования типологий и т. д. В частности, с помощью команды GRAPH мы получили поле рассеяния наших объектов (рис. 7.3*) – городов в пространстве двух переменных – факторов. По этому графику, например, можно заключить, что жители Александровска-Сахалинского проявили в курильском опросе наиболее «несоветскую» ориентацию. Они менее всего склонны считать, что договора нет потому, что «так сложилось» в силу «недоверия» между странами и из-за разных политических симпатий.
|