Типы статистических шкал.
В эмпирическом исследовании могут встречаться, к примеру, следующие переменные (указано их наиболее вероятное кодирование): Pol: 1 = мужской 2 = женский Семейное положение: 1 = холост/не замужем 2 = женат/замужем 3 = вдовец/вдова 4 = разведен(а) Курение 1 = некурящий 2 = изредка курящий 3 = интенсивно курящий 4 = очень интенсивно курящий. Рост. Вес. И т.д. Рассмотрим сначала графу Пол. Мы видим, что назначение соответствия цифр 1 и 2 обоим полам абсолютно произвольно, их можно было поменять местами или обозначить другими цифрами. Мы, конечно, не имеем в виду, что женщины стоят на ступеньку ниже мужчин, или мужчины значат меньше, чем женщины. Следовательно, отдельным числам не соответствует никакою эмпирического значения. В этом случае говорят о переменных, относящихся к номинальной шкале. В нашем примере рассматривается переменная с номинальной шкалой, имеющая две категории. Такая переменная имеет еще одно название- дихотомическая. Такая же ситуация и с переменной Семейное положение. Здесь также соответствие между числами и категориями семейного положения не имеет никакого эмпирического значения. Но в отличии от Пола, эта переменная не является дихотомической — у нее четыре категории вместо двух. Возможности обработки переменных, относящихся к номинальной шкале очень ограничены. Собственно говоря, можно провести только частотный анализ таких переменных. К примеру, расчет среднего значения для переменной Семейное положение, совершенно бессмысленен. Переменные, относящиеся к номинальной шкале часто используются для группировки, с помощью которых совокупная выборка разбивается по категориям этих переменных. В частичных выборках проводятся одинаковые статистические тесты, результаты которых затем сравниваются друг с другом. В качестве следующего примера рассмотрим переменную Курение. Здесь кодовым цифрам присваивается эмпирическое значение в том порядке, в котором они расположены в списке. Переменная Курение, в итоге, сортирована в порядке значимости снизу вверх: умеренный курильщик курит больше, нежели некурящий, а сильно курящий — больше, чем умеренный курильщик и т.д. Такие переменные, для которых используются численные значения, соответствующие постепенному изменению эмпирической значимости, относятся к порядковой шкале. Однако эмпирическая значимость этих переменных не зависит от разницы между соседними численными значениями. Так, несмотря на то, что разница между значениями кодовых чисел для некурящего и изредка курящего и изредка курящего и интенсивно курящего в обоих случаях равна единице, нельзя утверждать, что фактическое различие между некурящим и изредка курящим и между изредка курящим и интенсивно курящим одинаково. Для этого данные понятия слишком расплывчаты. Кроме частотного анализа, переменные с порядковой шкалой допускают также вычисление определенных статистических характеристик, таких как медианы. В некоторых случаях возможно вычисление среднего значения. Если должна быть установлена связь (корреляция) с другими переменными такого рода, для этой цели можно использовать коэффициент ранговой корреляции. Для сравнения различных выборок переменных, относящихся к порядковой шкале, могут применяться непараметрические тесты, формулы которых оперируют рангами. Рассмотрим теперь переменную Рост. Его абсолютные значения отображают порядковое отношение между респондентами, но и разница между двумя значениями также имеет эмпирическую значимость. Например, если у Ивана рост равен 180, а у Федора — 170, а у Петра — 160, можно сказать, что Иван в сравнении с Федором выше, и еще выше Петра. Такие переменные, у которых есть разность (интервал) между двумя значениями и она имеет эмпирическую значимость, относятся к интервальной шкале. Они могут обрабатываться любыми статистическим методами без ограничений. Так, к примеру, среднее значение является полноценным статистическим показателем для характеристики таких переменных. К таким переменным относятся Вес, Размер и т.д. Очень часто переменные интервальной шкалы, к которой относятся данные, могут называться шкалой отношений. Поэтому в настройках Define Variable (определение переменных) обе эти шкалы определяютсяя как Scale (Метрическая). Теперь необходимо обосновать и определить тип шкал для наших переменных:Vozrast (Возраст); Ves (Вес); Rost (Рост); Noga (Размер буви); Pol (Пол); Volos (Цвет волос); Glaz (Цвет глаз). Vozrast (Возраст),Ves (Вес), Rost (Рост) - интервальная шкала. Pol (Пол), Volos (Цвет волос); Glaz (Цвет глаз).- номинальная шкала. После выяснения этого важнейшего вопроса необходимо ввести тип шкалы в таблицу для наших переменных. Делается все очень просто: двойной клик по наименованию переменной и появляется окно Define Variable (определение переменных). В этом окне выбираем рамку Measurement (измерение) и устанавливаем кнопку в одно из трех состояний для каждой переменной. Переменные: Vozrast (Возраст),Ves (Вес), Rost (Рост) будут иметь значение Scale. Переменные: Pol (Пол), Volos (Цвет волос); Glaz (Цвет глаз) будут иметь значение Nominal. Переменных относящихся к шкале Ordinal (порядковая) у нас не будет. Со шкалой переменных мы разобрались. Теперь продолжим дальше определение переменных. Type (тип переменных), чтобы задать тип переменной, щелкните по кнопке Туре. Откроется диалоговое окно Define Variable Type (Определение типа переменной). Примите предлагаемую настройку Numeric (Численный) и установите длину "2" для переменной Vozrast и количество десятичных разрядов "0", так как в этой переменной будут храниться только значения возраста. Подтвердите настройку кнопкой ОК и перейдите к следующему полю переменной Ves. Учитывая цифровую кодировку значений переменных, наши переменные все будут Numeric. Labels..(Метка переменной) — это название, позволяющая описать переменную более подробно. После клика по кнопке Labels.. появляется диалоговое окно, и в него вы можете занести до 256 символов. В метках переменных различаются прописные и строчные буквы. Они отображаются в том виде, в каком были введены. Для переменной Vozrast введите в качестве метки «данные о возрасте студента (ки)». В этой же опции введем Метки значений (Values). Метки значений — это название, позволяющее более подробно описать возможные значения переменной. Так, например, в случае переменной Pol можно задать метку "женский" для значения "1" и метку "мужской" для значения "2". Подтвердите настройку по умолчанию. Впрочем, ввод данных также можно подтвердить клавишей <Enter>. Missing values (Пропущенные значения). В SPSS допускаются два вида пропущенных значений: Пропущенные значения, определяемые системой (System-defined missing values): Если в матрице данных есть незаполненные численные ячейки, система SPSS самостоятельно идентифицирует их как пропущенные значения. Этот факт отображается в матрице данных с помощью запятой (,). Пропущенные значения, задаваемые пользователем (User-defined missing values): Если в определенных случаях у переменных отсутствуют значения, например, если на вопрос не был дан ответ, ответ неизвестен, или существуют другие причины, пользователь может с помощью кнопки Missing объявить эти значения как пропущенные. Пропущенные значения можно исключить из последующих вычислений. В нашем примере пропущенным значением, определяемым пользователем мы объявим вариант ответа "0" (нет данных) для переменной Pol. Column Format (формат столбцов). Поле Columns определяет ширину, которую будет иметь в таблице данный столбец при отображении значений. Ширину столбца также можно изменить непосредственно в окне редактора данных. Для этого поместите указатель мыши на разделитель между двумя заголовками столбцов с именами переменных. Вид указателя изменится. Появившаяся двойная стрелка указывает, что соответствующий столбец можно расширить или сузить путем перетаскивания. Таким образом, определив все параметры переменных вы можете приступать к вводу собранных данных по своей группе.
|