Студопедия — Объединение файлов (merge files)
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Объединение файлов (merge files)






В пакете реализована возможность объединять файлы. Его предпочтительно делать с помощью меню DATA/ MERGE.

 

Назначение: команда позволяет объединить данные различных файлов. Рассмотрим, какие виды объединения файлов возможны.

Во-первых, это дополнение массива данных новыми ОБЪЕКТАМИ (функция ADD). На практике такая операция необходима, если

- происходит многоэтапное исследование по одной и той же анкете, опрос в нескольких регионах и т.п.;

- исследователю повезло - удалось получить информацию другого обследования (не панельного, то есть, опрошены другие люди), частично совместимую по переменным с имеющейся; но необходимо составить общий массив данных.

Во-вторых, дополнение данных новыми ПЕРЕМЕННЫМИ (функция MATCH). Такое пополнение массива данных обычно необходимо, если

- не удается сразу закодировать все данные; на подмножестве данных нужно произвести срочные расчеты, другую часть необходимо еще подготовить к вводу;

- - необходимо соединить данные панельных обследований;

- - дополнение данными из агрегированного файла (функция TABLE). Пусть, например, получены точные сведения о промышленности города, детской смертности, загрязнении атмосферы и т.д.. Эти данные необходимо внести в каждую анкету. Их можно закодировать, но экономичнее и быстрее сделать файл агрегированных данных и этой процедурой приписать к объектам-анкетам в исходный файл (см. рис.2.4).

┌─────┐ │1 │ ┌─────┐ ┌─────┐ ┌─────┐ ┌─────────┐ │2 │ │1 │ │1 │ │1 │ │1 │ │3 │ │2 │ │2 │ │2 │ │2 │ └─────┘ │3 │ │3 │+│3 │ ═══> │3 │ + ═══> │4 │ │4 │ │4 │ │4 │ ┌─────┐ │5 │ │5 │ │5 │ │5 │ а │4 │ └─────┘ б └─────┘ └─────┘ └─────────┘ │5 │ └─────┘ ┌─────┐ ┌────────┐ │1 │<──┐ │1 │ │1 │<──┤ ┌────┐ │1 │ │2 │<─┐└── │1 │ │2 │ │2 │<─┼─── │2 │ ═══> │2 │ │2 │<─┘┌── │3 │ │2 │ │3 │<──┤ └────┘ │3 │ в │3 │<──┘ │3 │ └─────┘ └────────┘   Рис. 2.4. Объединение данных: а - по объектам (ADD); б - по признакам (MATCH); в - внесение данных для групп объектов (TABLE...)

Подробно о выполнении объединения файлов следует смотреть Руководство пользователя. Книга 1.

 

В качестве примера проведем присоединение данных агрегированного файла (см. пример из предыдущего раздела) к анкетным данным курильского обследования:

get file "D:oct.sav";.

SORT CASES BY g (A).

MATCH FILES /FILE=* /TABLE='D: Aggr.sav' /BY g.

EXECUTE.

Сортировка файлов данных по ключевой переменной здесь обязательна; если данные не отсортированы, есть риск их потерять.

После объединения, в данных D:oct.sps появятся переменные d1, d2, d3, d4, d5 и d6, a также w1, w2, w4, w8, w9, w10 и wr. Теперь можно изучать, как связано "общественное мнение" с индивидуальными характеристиками респондентов.

Заметим, что "ручное" написание команды в данном случае требует особой внимательности, так как диагностика ошибок в этой команде сделана здесь не на высоком уровне.

 

Глава 3. Процедуры получения описательных статистик и таблиц сопряженности

Процедуры статистического анализа и описания распределений снабжены обычно таким множеством подкоманд, задающих разнообразные режимы работы и параметры, что текст подсказки по соответствующим командам напоминает новогодние елки, обвешанные игрушками. Поэтому команды для выполнения этих процедур удобнее формировать в диалоговых окнах, которые позволяют успешно их формировать практическт без знания синтаксиса команд. Ниже приведены образцы применения команд преимущественно с указанием лишь основных параметров. Как мы уже отметили, потребность в пакетном режиме использования статистических процедур возникает, когда приходится многократно повторять расчет, корректируя лишь параметры.

Для первичного анализа данных обычно достаточно процедур реализучемых следующими командами:

FREQUNCIES - получение распределений;

DESCRIPTIVES - одномерные описательные статистики;

EXPLORE (EXAMINE) - одномерные описательные статистики в группах объектов;

CROSSTABS - таблицы сопряженности;

MEANS - средние;

MULTIPLE RESPONSE, GENERAL TABLE - таблицы для неальтернативных признаков.

Эти команды используются преимущестевенно для описания данных. FREQUNCIES, DESCRIPTIVES, EXPLORE (EXAMINE), CROSSTABS, находятся в разделе меню DESCRIPTIVE STATISTICS. MEANS находится в разделе COMPARE MEANS, MULTIPLE RESPONSE и GENERAL TABLE - в Custom Tables.

Характерно, что команда меню EXPLORE в синтаксисе имеет имя EXAMINE.

Команды описания распределений







Дата добавления: 2015-08-30; просмотров: 383. Нарушение авторских прав; Мы поможем в написании вашей работы!



Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Вопрос. Отличие деятельности человека от поведения животных главные отличия деятельности человека от активности животных сводятся к следующему: 1...

Расчет концентрации титрованных растворов с помощью поправочного коэффициента При выполнении серийных анализов ГОСТ или ведомственная инструкция обычно предусматривают применение раствора заданной концентрации или заданного титра...

Психолого-педагогическая характеристика студенческой группы   Характеристика группы составляется по 407 группе очного отделения зооинженерного факультета, бакалавриата по направлению «Биология» РГАУ-МСХА имени К...

Типовые ситуационные задачи. Задача 1.У больного А., 20 лет, с детства отмечается повышенное АД, уровень которого в настоящее время составляет 180-200/110-120 мм рт Задача 1.У больного А., 20 лет, с детства отмечается повышенное АД, уровень которого в настоящее время составляет 180-200/110-120 мм рт. ст. Влияние психоэмоциональных факторов отсутствует. Колебаний АД практически нет. Головной боли нет. Нормализовать...

Эндоскопическая диагностика язвенной болезни желудка, гастрита, опухоли Хронический гастрит - понятие клинико-анатомическое, характеризующееся определенными патоморфологическими изменениями слизистой оболочки желудка - неспецифическим воспалительным процессом...

Признаки классификации безопасности Можно выделить следующие признаки классификации безопасности. 1. По признаку масштабности принято различать следующие относительно самостоятельные геополитические уровни и виды безопасности. 1.1. Международная безопасность (глобальная и...

Studopedia.info - Студопедия - 2014-2024 год . (0.008 сек.) русская версия | украинская версия