Практическое занятие по предварительной подготовке данных в SPSS for Windows
Окна SPSS:
· окно редактора данных SPSS Data Editor (две закладки: Data View / Variable View)
· окно результатов SPSS Viewer
· окно команд SPSS Syntax Editor
· окно редактора графиков SPSS Chart Editor
Основные типы файлов:
· файл данных (*.SAV)
· файл результатов (*.SPO)
· файл команд (*.SPS)
Этапы подготовки данных к статистическому анализу:
P Определение переменных
P Ввод данных
P Проверка качества ввода
P Чистка введенных данных
P Преобразование матрицы данных
P Перекодировка и группировка переменных
P Вычисление новых переменных
действие
| реализация
|
Определение переменной
(окно редактора данных, закладка Variable Viewer)
|
Имя переменной
| Столбец Name.
Длина имени – до 8 символов.
Запрещены слова: all, and, or, not, with, by, to, eq, ne, lt, le, gt, ge.
Запрещены символы: пробел,!,?, ' и *.
Имя не может заканчиваться точкой.
Каждое имя должно быть уникальным.
Имена нечувствительны к регистру.
|
Тип переменной
| Столбец Type.
Основные типы: Numeric (числовой)
String (строковый)
|
Формат переменной
| Столбцы: Width (общее число позиций)
Decimals (число позиций после десятичной точки)
Рекомендуется начинать установку формата с Decimals.
|
Метка переменной
| Столбец Label (любой поясняющий текст).
Может быть на русском языке.
|
Метки значений переменной
| Столбец Values (могут задаваться для каждого значения, особенно для номинальных и порядковых переменных).
Могут быть на русском языке.
|
Пропущенные значения (пользовательские)
| Столбец Missing.
До 3х дискретных значений либо интервал.
|
Пропущенные значения (системные)
| Пустая клетка в окне редактора (закладка Data Viewer) или перекодировка (см. "Перекодировка").
|
Уровень измерения
| Столбец Measure: Scale (количественный)
Ordinal (порядковый)
Nominal (номинальный)
|
Ввод данных
|
Ввод данных
| Окно редактора данных (закладка Data View).
Переход между клетками – по клавише Enter или по клавишам управления курсором.
|
Проверка качества ввода и чистка данных
|
Построение одномерных распределений
| Analyze½descriptive statistics½frequencies…½имена нужных переменных в окно Variable(s)½OK.
|
Построение таблиц сопряженности
| Analyze½descriptive statistics½crosstabs…½имя переменной, образующей строки таблицы, в окно Row(s) ½имя переменной, образующей столбцы, в окно Column(s)½OK.
|
Чистка данных
| Окно редактора данных (закладка Data View) или перекодировка (см. Перекодировка).
|
Преобразование матрицы данных
|
Добавление переменной
| Окно редактора данных (закладка Variable Viewer): выделить строку с переменной, перед которой должна быть вставка½вызвать контекстное меню (правой кнопкой мыши)½Insert Variables.
Окно редактора данных (закладка Data Viewer): выделить столбец с переменной, перед которой должна быть вставка½вызвать контекстное меню (правой кнопкой мыши)½Insert Variables.
|
действие
| реализация
|
Удаление переменной
| Окно редактора данных (закладка Variable Viewer): выделить строку с удаляемой переменной½вы звать контекстное меню (правой кнопкой мыши)½Clear.
Окно редактора данных (закладка Data Viewer): выделить столбец с удаляемой переменной ½вызвать контекстное меню (правой кнопкой мыши)½CutилиClear.
|
Добавление случая
| Окно редактора данных (закладка Data Viewer): выделить строку, перед которой должна быть вставка½вызвать контекстное меню (правой кнопкой мыши)½Insert Cases.
|
Удаление случая
| Окно редактора данных (закладка Data Viewer): выделить удаляемую строку½вызвать контекстное меню (правой кнопкой мыши)½CutилиClear.
|
Сортировка случаев
| Окно редактора данных (закладка Data Viewer): выделить столбец с переменной, по которой производится сортировка½вызвать контекстное меню (правой кнопкой мыши)½Sort ascending(по возрастанию)илиSort descending(по убыванию).
Окно редактора данных: Data½Sort Cases…½перенести в окно Sort by имена переменных, по которым осуществляется сортировка½Sort Order: выбрать Ascending или Descending½OK.
|
Отбор случаев по заданным критериям с помощью фильтров.
| Окно редактора данных: Data½Select Cases…½в разделе Select выбрать If condition is satisfied½кнопка If…½в открывшемся окне задать критерии отбора, используя логические операторы½Continue½ Unselected Cases AreвыбратьFiltered½OK.
Для снятия фильтра в разделе SelectвыбратьAll cases.
|
Перекодировка, группировка, вычисление переменных
|
Перекодировка дискретных значений
| Окно редактора данных: Data½Transform½Recode½ Into Different Variable(s)…½перенести имя перекодируемой переменной в окно Input Variable à Output Variable½ввести имя новой переменной в отрывшееся окно Output Variable Name½кнопка Old and New Values½в разделе Old Value выбратьValue½ввести старое значение½ в разделе New Value выбратьValue½ввести новое значение½кнопка Add(правило перекодировки появится в окне)½задать последовательно все правила перекодировки, проверить их наличие в окне½Continue½Change½OK.
|
Группировка (построение интервалов)
| Окно редактора данных: Data½Transform½Recode½ Into Different Variable(s)…½перенести имя перекодируемой переменной в окно Input Variable à Output Variable½ввести имя новой переменной в отрывшееся окно Output Variable Name½кнопка Old and New Values½в разделе Old Value выбратьодин из трех вариантов интервалов Range(с двумя границами, с открытой верхней границей или с открытой нижней границей) ½задать границы интервалов½ в разделе New Value выбратьValue½ввести новое значение½кнопка Add(правило перекодировки появится в окне)½задать последовательно все правила перекодировки, проверить их наличие в окне ½Continue½Change½OK.
|
действие
| реализация
|
Перцентильная группировка
| Analyze½descriptive statistics½frequencies…½ имена группируемой переменной переместить в окно Variable(s)½ кнопка Statistics…½в разделе Percentile Valuesвыбрать один из трех вариантов группировки½Continue½OK½полученные границы использовать для построения интервалов.
|
Вычисление переменных с использованием арифметических операций и стандартных математических функций
| Окно редактора данных: Data½Transform½ Compute…½ввести имя вычисляемой переменной в окно Target Variable½в окнеNumeric Expression задать формулу для вычисления, с использованием арифметических выражений и стандартных математических функций½OK.
|
Вычисление переменных в соответствии с некоторыми условиями.
| Окно редактора данных: Data½Transform½ Compute…½ввести имя вычисляемой переменной в окно Target Variable½в окнеNumeric Expression задать число или формулу для вычисления½кнопка If…½выбрать Include if case satisfies condition½в окне задать условие½Continue½OK½На вопрос Change existing variable?ответитьOK.
Повторять столько раз, сколько необходимо задать условий.
|
Вычисление переменных, подсчитывающих ответы с одинаковыми оценками
| Окно редактора данных: Data½Transform½Count…½в окне Target Variable задать имя новой переменной½в окно Numeric Variables поместить имена переменных, содержащих оценки½кнопка Define Values½в разделе Values выбрать Value½ввести значение подсчитываемых оценок½кнопка Add½Continue½ OK
|
Стандартизация переменной
| Окно редактора данных: Data½Transform½Rank Cases…½поместить имена переменных в окно Variable(s) ½кнопка Rank Types…½флажок Normal Scores…½кнопка More>>½Continue½OK
В результате в файле появится новая переменная с nимя, значения которой являются -оценки значений переменной имя.
|
Чтение, сохранение, обмен файлами и результатами вычислений
|
Чтение файлов данных SPSS и других форматов
| File½Open½Data…½в открывшемся окне перейти в нужную папку½выбрать нужный тип файла (*.sav, *.dbf, *.xls и т.п.) ½выбрать нужный файл½кнопка открыть.
|
Сохранение файлов данных SPSS и других форматов
| Окно редактора данных: File½Save As…½ в открывшемся окне перейти в нужную папку½выбрать нужный тип файла (*.sav, *.dbf, *.xls, *.dat и т.п.) ½ввести имя файла½кнопка сохранить.
|
Использование результатов, полученных в SPSS, другими приложениями Windows (Word, Excel, PowerPoint)
| Выделите в файле результатов нужную таблицу или рисунок½откройте контекстное меню (правая кнопка мыши) ½Copy objects½перейдите в нужное приложение½поместите курсор в место, куда следует вставить объект½вызовите контекстное меню½вставить.
|
Задание 1: Создайте матрицу данных для Анкеты 1. Для этого выполните в SPSS описание всех 6-ти переменных.
2. Введите данные для 1-го респондента из Анкеты 1, для следующих 10 произвольно.
Сохраните матрицу данных в вашей папке.
Задание 2: результаты вступительного экзамена
Методическое указание: после выполнения каждого задания сохраняйте матрицу данных в своей папке.
1. Определите переменные:
№
| имя (name)
| тип (type)
| ширина
(width)
| десятичные знаки (decimals)
| Метка переменной (label)
| Метки значений (values)
|
| ID
| numeric
|
|
| 'Личный номер'
|
|
| RSname
| string
|
|
| 'Имя абитуриента'
|
|
| gender
| string
|
|
| 'Пол абитуриента'
| м 'мужской'
ж 'женский'
|
| test1
| numeric
|
|
| 'Тест по иностранному языку'
|
|
| grade2
| numeric
|
|
| 'Сочинение'
|
|
| grade3
| numeric
|
|
| 'Человек и общество'
|
|
2. Введите данные:
личный номер
| имя абитуриента
| пол
| тест по иностран- ному языку
| сочинение
| человек и общество
|
| Людмила А.
| ж
|
| 4.5
| 4.5
|
| Галина А.
| ж
|
|
|
|
| Владимир А
| м
|
| 4.5
| 4.5
|
| Геннадий Б.
| м
|
| 3.5
| 3.5
|
| Сергей Б.
| м
|
| 4.5
|
|
| Мария Б.
| ж
|
|
| 4.5
|
| Наталья Б.
| ж
|
|
|
|
| Нина В.
| ж
|
| 3.5
|
|
| Елена Г.
| ж
|
| 4.5
| 4.5
|
| Александр Д.
| м
|
| 3,5
|
|
| Юрий Е.
| м
|
|
|
|
| Виктор Ж.
| м
|
|
| 4.5
|
| Антон З.
| м
|
| 3.5
|
|
| Ольга К.
| ж
|
|
|
|
| Григорий К.
| м
|
|
|
|
| Ольга К.
| ж
|
|
| 4.5
|
| Валентина Л.
| ж
|
|
|
|
| Людмила П.
| ж
|
|
| 3.5
|
| Андрей Р.
| м
|
|
|
|
| Виктор Р.
| м
|
| 4.5
|
|
| Татьяна Ф.
| ж
|
| 3.5
|
|
| Валентин Ш.
| м
|
| 3.5
| 4.5
|
| Виктория Я.
| ж
|
|
|
|
| Сергей Я.
| м
|
| 4.5
| 4.5
|
| Светлана Я.
| ж
|
|
| 4.5
|
3. Добавьте в список еще одного абитуриента:
3.1. вставьте пустую строку после строки № 20;
3.2. присвойте абитуриенту № 26;
3.2. введите для него произвольные имя и пол, и следующие результаты экзаменов:
test1=45, grade2=3; grade3=3.
4. Создайте переменную grade1 'оценка по иностранному языку':
4.1. вставьте новую переменную после переменной 'тест';
4.2. определите и задайте все параметры новой переменной;
4.3. вычислите значения новой переменной через перекодировку результатов теста (recode).
5. Проверьте правильность вычисления переменной grade1:
5.1. упорядочьте абитуриентов по убыванию переменной test1;
5.2. убедитесь, что оценки соответствуют результатам теста;
5.3. при необходимости исправьте ошибки в правилах перекодировки.
6. Проверьте качество ввода данных по одномерным распределениям переменных gender, test1, grade1, grade2, grade3.
При необходимости исправьте ошибки ввода.
7. Проверьте соблюдение логического правила: 'после получения оценки 2 абитуриент следующие экзамены не сдает':
7.1. перекодируйте системные пропущенные значения в переменных grade2 и grade3 в значение '0';
7.2. постройте таблицы сопряженности между переменными grade1 и grade2; grade2 и grade3
7.3. при необходимости исправьте ошибки ввода.
8. Создайте переменную sum1 'сумма баллов':
8.1. определите новую переменную, задайте для нее необходимые параметры;
8.2. вычислите ;
8.3. постройте одномерное распределение переменной sum1
Вопрос: как определить по распределению студентов, проваливших экзамены?
8.4. объявите для переменных grade2 и grade3 значение '0' пользовательским пропуском;
8.5. определите и вычислите новую переменную ;
8.6. постройте одномерное распределение переменной sum2, сравните его с распределением sum1