Структура файла данных
Перед тем как начать ввод данных, необходимо определить структуру будущего файла. Для этого вы должны ответить себе на вопрос, как будут использоваться в анализах те или иные переменные. К сожалению, многие пользователи начинают задумываться об этом гораздо позже, чем следует, и в этом кроется причина многих неудач при проведении анализа данных: чем сложнее план исследования, тем больше шансов, что из-за необдуманных действий исследователя он завершится неудачей. Итак, первое, что следует сделать, - определить последовательность действий при обработке данных. Кроме того, необходимо четко представлять себе структуру и взаимосвязи переменных в вашем плане исследования. Ниже перечислены наиболее характерные для файлов данных ошибки и недостатки. · Отсутствуют ключевые переменные (пол, возраст и т. п.), являющиеся основой для анализа. · Переменная плохо отражает содержание соответствующей реальной величины (например, на сложный вопрос имеются только два варианта ответа: «да» и «нет»). · При большом количестве независимых переменных отсутствуют зависимые переменные, отражающие цель исследования (или наоборот). · Недостаточно независимых переменных, влияющих на заданную зависимую переменную. Эти примеры демонстрируют, что залогом успеха как исследования в целом, так и создания файла данных в частности является тщательно продуманный выбор структуры данных. Следует отметить, что структура файла данных должна соответствовать плану исследования. С другой стороны, план исследования должен быть составлен так, чтобы его исходные данные можно было бы обработать в соответствии с задачами и гипотезами исследования. Самый оптимальный и простой путь обеспечения этих соответствий - определение структуры данных на этапе планирования исследования, еще до сбора данных. Это позволит избежать большинства типичных ошибок, относящихся как к планированию исследования, так и к организации данных. На этапе планирования исследования структура данных может быть задана в виде предварительного списка переменных с указанием их типов и диапазонов возможных значений, например так, как в табл. 3.1. Таблица 3.1. Предварительный список переменных
Каждая переменная - это имеющее значение для исследователя основание, позволяющее отличать объекты друг от друга. На предварительном этапе следует выделять два типа переменных: количественные и категориальные (номинативные). Количественная переменная позволяет различать объекты по уровню выраженности некоторого свойства, например: средний балл отметки, тестовый показатель и пр. Идентификация количественных переменных на предварительном этапе не составляет труда: обычно они соответствуют тому, что исследователь намеревается измерить. Второй тип - категориальные (номинативные) переменные. Обычно они используются как основания для деления объектов (испытуемых) на группы или категории: пол, класс, возрастная категория, уровень дохода и пр. Типичная ошибка начинающего исследователя - игнорирование возможных оснований для деления объектов на группы в качестве самостоятельных номинативных переменных в структуре данных. Важным свойством номинативных переменных является возможность их представления в виде набора целых чисел. Например, трем видам внешкольных увлечений (хобби) учащихся (спорт, компьютер, искусство) можно сопоставить числа 1, 2 и 3 соответственно. Числовое представление данных в компьютерных программах всегда предпочтительнее символьного, поскольку обработка чисел происходит быстрее, проще и с меньшей вероятностью ошибок. Кроме того, числовое представление легко модифицировать: вы можете переназначить числа, соответствующие созданным элементам, а также (что часто требуется на практике) без проблем включить в анализ новые элементы. Например, если в группе окажется учащийся, увлечение которого не соответствует перечисленным, будет полезно включить в переменную хобби категорию с названием другие и присвоить ей число 4. Порядок создания переменных также важен при вводе данных. Здесь следует придерживаться простого правила: наиболее важные и часто используемые переменные должны помещаться в начало файла, для остальных данных вопрос порядка следования не столь важен, однако рекомендуется объединять их в группы по «физическому смыслу». Чаще всего в начало файла следует поместить категориальные переменные, которые далее предполагается использовать для деления объектов (испытуемых) на группы, например пол, семейное положение и пр. Далее можно перечислять остальные сведения, а логическое объединение переменных производить в зависимости от того, какие аспекты они отражают. Далее приведем инструкции, с помощью которых вы сможете приступить к освоению программы SPSS. Шаг 1. Первое, что необходимо сделать, - это запустить программу SPSS и в открывшемся диалоговом окне щелкнуть на кнопке Отмена (Cancel). Вы получите доступ к окну редактора данных, представленному на рис. 3.1. Рис. 3.1. Исходный вид окна редактора данных SPSS Шаг 2. Перейдите на вкладку Переменные (Variable View), щелкнув на ее ярлычке мышью (рис. 3.2). Рис. 3.2. Вкладка просмотра переменных окна редактора данных Вкладка Данные (Data View), которая отображается сразу после запуска редактора данных, предназначена для ввода значений в создаваемый файл данных. Вкладка Переменные (Variable View) позволяет задать структуру файла данных, то есть определить имена, метки и структуры переменных. Заголовки столбцов представляют собой параметры каждой из переменных: Имя (Name), Тип (Туре), Ширина (Width), Десятичные (Decimals), Метка (Label), Значения (Values), Пропуски (Missing), Столбцы (Columns), Выравнивание (Align) и Шкала (Measure). Будем описывать процесс создания файла данных в том порядке, в котором только что перечислили параметры переменных. В следующих пошаговых инструкциях возьмем за основу данные из файла ex0l.sav. В процессе создания файла можно выделить три основных действия: задание имени переменной, определение ее параметров и ввод данных. Необязательно последовательно выполнять каждый из трех этапов для каждой переменной, такой порядок выбран лишь в качестве примера. На практике вам может оказаться удобнее создавать файл данных «порциями»: сначала вы полностью зададите часть переменных, обработаете их, затем введете новую группу переменных и т. д. Мы же сейчас обратимся к рассмотрению параметров переменных.
|