Объединение файлов (merge files)
В пакете реализована возможность объединять файлы. Его предпочтительно делать с помощью меню DATA/ MERGE.
Назначение: команда позволяет объединить данные различных файлов. Рассмотрим, какие виды объединения файлов возможны. Во-первых, это дополнение массива данных новыми ОБЪЕКТАМИ (функция ADD). На практике такая операция необходима, если - происходит многоэтапное исследование по одной и той же анкете, опрос в нескольких регионах и т.п.; - исследователю повезло - удалось получить информацию другого обследования (не панельного, то есть, опрошены другие люди), частично совместимую по переменным с имеющейся; но необходимо составить общий массив данных. Во-вторых, дополнение данных новыми ПЕРЕМЕННЫМИ (функция MATCH). Такое пополнение массива данных обычно необходимо, если - не удается сразу закодировать все данные; на подмножестве данных нужно произвести срочные расчеты, другую часть необходимо еще подготовить к вводу; - - необходимо соединить данные панельных обследований; - - дополнение данными из агрегированного файла (функция TABLE). Пусть, например, получены точные сведения о промышленности города, детской смертности, загрязнении атмосферы и т.д.. Эти данные необходимо внести в каждую анкету. Их можно закодировать, но экономичнее и быстрее сделать файл агрегированных данных и этой процедурой приписать к объектам-анкетам в исходный файл (см. рис.2.4).
Подробно о выполнении объединения файлов следует смотреть Руководство пользователя. Книга 1.
В качестве примера проведем присоединение данных агрегированного файла (см. пример из предыдущего раздела) к анкетным данным курильского обследования: get file "D:oct.sav". SORT CASES BY g (A). MATCH FILES /FILE=* /TABLE='D: Aggr.sav' /BY g. EXECUTE. Сортировка файлов данных по ключевой переменной здесь обязательна; если данные не отсортированы, есть риск их потерять. После объединения, в данных D:oct.sps появятся переменные d1, d2, d3, d4, d5 и d6, a также w1, w2, w4, w8, w9, w10 и wr. Теперь можно изучать, как связано "общественное мнение" с индивидуальными характеристиками респондентов. Заметим, что "ручное" написание команды в данном случае требует особой внимательности, так как диагностика ошибок в этой команде сделана здесь не на высоком уровне.
Глава 3. Процедуры получения описательных статистик и таблиц сопряженности Процедуры статистического анализа и описания распределений снабжены обычно таким множеством подкоманд, задающих разнообразные режимы работы и параметры, что текст подсказки по соответствующим командам напоминает новогодние елки, обвешанные игрушками. Поэтому команды для выполнения этих процедур удобнее формировать в диалоговых окнах, которые позволяют успешно их формировать практическт без знания синтаксиса команд. Ниже приведены образцы применения команд преимущественно с указанием лишь основных параметров. Как мы уже отметили, потребность в пакетном режиме использования статистических процедур возникает, когда приходится многократно повторять расчет, корректируя лишь параметры. Для первичного анализа данных обычно достаточно процедур реализучемых следующими командами: FREQUNCIES - получение распределений; DESCRIPTIVES - одномерные описательные статистики; EXPLORE (EXAMINE) - одномерные описательные статистики в группах объектов; CROSSTABS - таблицы сопряженности; MEANS - средние; MULTIPLE RESPONSE, GENERAL TABLE - таблицы для неальтернативных признаков. Эти команды используются преимущестевенно для описания данных. FREQUNCIES, DESCRIPTIVES, EXPLORE (EXAMINE), CROSSTABS, находятся в разделе меню DESCRIPTIVE STATISTICS. MEANS находится в разделе COMPARE MEANS, MULTIPLE RESPONSE и GENERAL TABLE - в Custom Tables. Характерно, что команда меню EXPLORE в синтаксисе имеет имя EXAMINE. Команды описания распределений
|