Студопедия — Структура файла данных
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Структура файла данных






Перед тем как начать ввод данных, необходимо определить структуру будущего файла. Для этого вы должны ответить себе на вопрос, как будут использоваться в анализах те или иные переменные. К сожалению, многие пользователи начина­ют задумываться об этом гораздо позже, чем следует, и в этом кроется причина многих неудач при проведении анализа данных: чем сложнее план исследования, тем больше шансов, что из-за необдуманных действий исследователя он завер­шится неудачей.

Итак, первое, что следует сделать, - определить последовательность действий при обработке данных. Кроме того, необходимо четко представлять себе структуру и взаимосвязи переменных в вашем плане исследования. Ниже перечислены наиболее характерные для файлов данных ошибки и недостатки.

· Отсутствуют ключевые переменные (пол, возраст и т. п.), являющиеся осно­вой для анализа.

· Переменная плохо отражает содержание соответствующей реальной вели­чины (например, на сложный вопрос имеются только два варианта ответа: «да» и «нет»).

· При большом количестве независимых переменных отсутствуют зависимые переменные, отражающие цель исследования (или наоборот).

· Недостаточно независимых переменных, влияющих на заданную зависимую переменную.

Эти примеры демонстрируют, что залогом успеха как исследования в целом, так и создания файла данных в частности является тщательно продуманный выбор структуры данных.

Следует отметить, что структура файла данных должна соответствовать плану исследования. С другой стороны, план исследования должен быть составлен так, чтобы его исходные данные можно было бы обработать в соответствии с задача­ми и гипотезами исследования. Самый оптимальный и простой путь обеспече­ния этих соответствий - определение структуры данных на этапе планирования исследования, еще до сбора данных. Это позволит избежать большинства типич­ных ошибок, относящихся как к планированию исследования, так и к организа­ции данных.

На этапе планирования исследования структура данных может быть задана в ви­де предварительного списка переменных с указанием их типов и диапазонов возможных значений, например так, как в табл. 3.1.

Таблица 3.1. Предварительный список переменных

Название Тип Диапазон возможных значений
  Идентификационный номер Номинативная 1-100
  Пол Номинативная 1-2
  Класс Номинативная 1-3
  Предполагаемый, для поступления ВУЗ Номинативная : 1- гуманитарный; 2 - эко­номический; 3—технический; 4-естественнонаучный
  Внешкольные увлечения Номинативная 1 - спорт; 2 - компьютер; 3 - искусство
6-10 I Показатели тестов 1-5 : Количественные 1-20
  Средний балл отметок за 10-й класс Количественная 3-5
  Средний балл отметок за 11-й класс Количественная 3-5

 

Каждая переменная - это имеющее значение для исследователя основание, по­зволяющее отличать объекты друг от друга. На предварительном этапе следует выделять два типа переменных: количественные и категориальные (номина­тивные). Количественная переменная позволяет различать объекты по уровню выраженности некоторого свойства, например: средний балл отметки, тестовый показатель и пр. Идентификация количественных переменных на предвари­тельном этапе не составляет труда: обычно они соответствуют тому, что исследо­ватель намеревается измерить. Второй тип - категориальные (номинативные) переменные. Обычно они используются как основания для деления объектов (испытуемых) на группы или категории: пол, класс, возрастная категория, уровень дохода и пр. Типичная ошибка начинающего исследователя - игнорирование возможных оснований для деления объектов на группы в качестве самостоятель­ных номинативных переменных в структуре данных.

Важным свойством номинативных переменных является возможность их пред­ставления в виде набора целых чисел. Например, трем видам внешкольных увле­чений (хобби) учащихся (спорт, компьютер, искусство) можно сопоставить чис­ла 1, 2 и 3 соответственно. Числовое представление данных в компьютерных программах всегда предпочтительнее символьного, поскольку обработка чисел происходит быстрее, проще и с меньшей вероятностью ошибок. Кроме того, чи­словое представление легко модифицировать: вы можете переназначить числа, соответствующие созданным элементам, а также (что часто требуется на практи­ке) без проблем включить в анализ новые элементы. Например, если в группе окажется учащийся, увлечение которого не соответствует перечисленным, будет полезно включить в переменную хобби категорию с названием другие и присво­ить ей число 4.

Порядок создания переменных также важен при вводе данных. Здесь следует придерживаться простого правила: наиболее важные и часто используемые переменные должны помещаться в начало файла, для остальных данных во­прос порядка следования не столь важен, однако рекомендуется объединять их в группы по «физическому смыслу». Чаще всего в начало файла следует по­местить категориальные переменные, которые далее предполагается использо­вать для деления объектов (испытуемых) на группы, например пол, семейное положение и пр. Далее можно перечислять остальные сведения, а логическое объединение переменных производить в зависимости от того, какие аспекты они отражают.

Далее приведем инструкции, с помощью которых вы сможете приступить к освоению программы SPSS.

Шаг 1. Первое, что необходимо сделать, - это запустить программу SPSS и в открывшемся диалоговом окне щелкнуть на кнопке Отмена (Cancel). Вы полу­чите доступ к окну редактора данных, представленному на рис. 3.1.

Рис. 3.1. Исходный вид окна редактора данных SPSS

Шаг 2. Перейдите на вкладку Переменные (Variable View), щелкнув на ее ярлычке мышью (рис. 3.2).

Рис. 3.2. Вкладка просмотра переменных окна редактора данных

Вкладка Данные (Data View), которая отображается сразу после запуска редактора данных, предназначена для ввода значений в создаваемый файл дан­ных. Вкладка Переменные (Variable View) позволяет задать структуру файла данных, то есть определить имена, метки и структуры переменных. Заго­ловки столбцов представляют собой параметры каждой из переменных: Имя (Name), Тип (Туре), Ширина (Width), Десятичные (Decimals), Метка (Label), Значения (Values), Пропуски (Missing), Столбцы (Columns), Выравнивание (Align) и Шкала (Measure). Будем описывать процесс создания файла данных в том поряд­ке, в котором только что перечислили параметры переменных.

В следующих пошаговых инструкциях возьмем за основу данные из файла ex0l.sav. В про­цессе создания файла можно выделить три основных действия: задание имени переменной, определение ее параметров и ввод данных. Необязательно последо­вательно выполнять каждый из трех этапов для каждой переменной, такой поря­док выбран лишь в качестве примера. На практике вам может оказаться удобнее создавать файл данных «порциями»: сначала вы полностью зададите часть пере­менных, обработаете их, затем введете новую группу переменных и т. д. Мы же сейчас обратимся к рассмотрению параметров переменных.

 







Дата добавления: 2015-08-30; просмотров: 421. Нарушение авторских прав; Мы поможем в написании вашей работы!



Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Логические цифровые микросхемы Более сложные элементы цифровой схемотехники (триггеры, мультиплексоры, декодеры и т.д.) не имеют...

Машины и механизмы для нарезки овощей В зависимости от назначения овощерезательные машины подразделяются на две группы: машины для нарезки сырых и вареных овощей...

Классификация и основные элементы конструкций теплового оборудования Многообразие способов тепловой обработки продуктов предопределяет широкую номенклатуру тепловых аппаратов...

Именные части речи, их общие и отличительные признаки Именные части речи в русском языке — это имя существительное, имя прилагательное, имя числительное, местоимение...

СИНТАКСИЧЕСКАЯ РАБОТА В СИСТЕМЕ РАЗВИТИЯ РЕЧИ УЧАЩИХСЯ В языке различаются уровни — уровень слова (лексический), уровень словосочетания и предложения (синтаксический) и уровень Словосочетание в этом смысле может рассматриваться как переходное звено от лексического уровня к синтаксическому...

Плейотропное действие генов. Примеры. Плейотропное действие генов - это зависимость нескольких признаков от одного гена, то есть множественное действие одного гена...

Методика обучения письму и письменной речи на иностранном языке в средней школе. Различают письмо и письменную речь. Письмо – объект овладения графической и орфографической системами иностранного языка для фиксации языкового и речевого материала...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия