Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Ранговые преобразования





В SPSS существует возможность задавать ранги для измеренных значений переменной, проводить оценки Сэвиджа, вычислять процентные ранги и формировать процентильные группы, добавляя в файл данных соответствующие переменные.

Так, например, в формулах для непараметрических тестов (см. главу 14) вместо исходных измеренных значений переменной используются присвоенные им ранги. Однако эти процедуры производят автоматическое присвоение рангов и в явном виде выполнять предварительные ранговые преобразования не требуется. Поэтому они играют второстепенную роль.

Мы продемонстрируем присвоение рангов на более наглядном примере, а затем проведем обзор различных типов рангов.

 

Пример рангового преобразования

В главе 20 представлен файл europa.sav, содержащий отдельные статистические показатели по 28 европейским странам. В частности, он включает переменные land (краткое обозначение страны) и tjul (средняя дневная температура в июле). Требуется расположить страны в нисходящем порядке согласно значениям последней переменной и затем вывести их в отсортированном виде.

· Загрузите файл europa.sav.

· Выберите в меню команды Transform (Преобразовать) Rank Cases... (Присвоить ранги наблюдениям) Откроется диалоговое окно Rank Cases.

Рис. 8.10:Диалоговое окно Rank Cases

· Щелкните в списке переменных на переменной tju1. В поле By: (По) можно задать группирующую переменную. В этом случае назначение рангов будет выполнено раздельно по группам, образуемым этой переменной.

· Присвоим самой теплой стране (с максимальным значением переменной tju1) ранг 1; для этого щелкните в поле Assign Rank I to (Присвоить ранг 1) на опции Largest value (Максимальное значение).

Щелкнув на кнопке Rank types... (Типы рангов), можно увидеть стандартную настройку Rank. Пока оставим ее без изменений; остальные настройки мы рассмотрим в разделе 8.6.2.

· Кнопка Ties... (Связки) открывает диалоговое окно Rank Cases: Ties.

Его настройки указывают, как программа будет поступать при появлении одинаковых измеренных величин. По умолчанию принято (и, как правило, это наилучший вариант), что присваивается среднее (Mean) из значений рангов этих величин. При установке Low все значения получают наименьший, при установке High — наибольший из этих рангов. При выбранной опции Sequential ranks to unique values (Присваивать последовательные ранги) все связанные наблюдения получают одинаковый ранг; следующему наблдению присваивается следующее по порядку целое число. Поэтому максимальный присвоенный ранг равен не общему количеству значений, а количеству различных значений.

Перечисленные четыре способа присвоения рангов можно пояснить с помощью простого примера, в котором семь значений расположены по убыванию.

Рис. 8.11: Диалоговое окно Rank Cases: Ties

Значение Mean Low High Sequential ranks to unique values
         
  2,5      
  2,5      
         
         
         
         

· Оставьте стандартную настройку и закройте диалоговое окно кнопкой Continue.

· Начните присвоение рангов, щелкнув на ОК.

В файл данных будет добавлена переменная rtju1, содержащая ранги, присвоенные значениям переменной tju1. Для обозначения ранговой переменной к имени исходной переменной спереди дописывается буква г.

Затем отсортируем файл данных по этой ранговой переменной.

· Для этого, как описано в разделе 7.3, выберите в меню команды Data (Данные) Son Cases... (Сортировать наблюдения) и в появившемся диалоговом окне выберите в качестве переменной сортировки rtjul. Примите предлагаемый по умолчанию порядок сортировки по возрастанию.

· Запустите сортировку кнопкой ОК. Теперь выведем значения переменных rtju1, land и tju1 в отсортированном виде.

· Для этого выберите в меню команды (см. раздел 4.8) Analyze (Анализ) Reports (Отчеты) Case summaries... (Итоги по наблюдениям) и перенесите в поле Variables переменные rtjul, land и tjul в указанной последовательности.

· Запустите создание отчета кнопкой ОК. В окне просмотра будет показана следующая таблица.

Отсюда можно заключить, что Греция является самой теплой страной (ранг 1), за ней следует Италия (ранг 2), следующий ранг имеют две страны — Албания и Румыния (средний ранг 3,5) и т.д.

Case Processing Summary a (Сводка случаев)

  RANK TJU LAN Средняя дневная температура в июле
  1,00 GRI  
  2,00 ITA  
  3,50 ALB  
  3,50 RUM  
  5,50 JUG  
  5,50 TUE  
  7,50 BUL  
  7,50 UNG  
  9,50 FOR  
  9,50 SPA  
  13,00 DEU  
  13,00 FRA  
  13,00 OES  
  13,00 SCH  
  13,00 TSC  
  17,00 DD  
  17,00 POL  
  17,00 SOW  
  19,50 BEL  
  19,50 LUX  
  23,50 DAE  
  23,50 FIN  
  23,50 GRO  
  23,50 NIE  
  23,50 NOR  
  23,50 SCH  
  27,00 IRL  
  28,00 ISL  
Total (Всего)N      
a. Limited to first 100 cases(Ограничено первыми 100 случаями)

 

 

2 Типы рангов

В диалоге Rank Cases можно, щелкнув на кнопке Rank Types... (Типы рангов), от-крыть диалоговое окно Rank Cases: Types (Ранги: Типы). В этом окне представлены шесть типов рангов; щелкнув на кнопке More» (Еще), можно увидеть еще два.

Ниже приведено объяснение различных типы рангов.

· Rank (Ранг): Абсолютные значения рангов (см. раздел 8.6.1). Это установка по умолчанию.

· Savage score (Оценка Сэвиджа): Это значения ранга, полученное на основе экспоненциального распределения. При общем количестве значений переменной т оценка Сэвиджа для i-го ранга определяется по формуле

Рис. 8.12: Диалоговое окно Rank Cases: Types

· Fractional Rank (Относительный ранг): Это значение ранга деленное на количество наблюдений.

· Fractional Rank as % (Относительный ранг в %): Это численные значения относительных рангов, умноженные на 100. Например, процентный ранг 33,93 означает, что 33,93% всех наблюдений имеют более низкий ранг.

· Sum of case weights (Сумма весов наблюдений): Эта величина представляет интерес только при определении рангов для подгрупп и является постоянной в каждой подгруппе; она соответствует количеству случаев в подгруппе.

· Ntiles (N-процентили): Пользователь может задать число групп процентилей, на которые должны быть разбиты наблюдения (по умолчанию 4). Тогда каждому случаю присваивается значение процентильной группы, к которой он принадлежит.

· Proportion estimates (Долевые оценки): Вычисление накопленной доли при предположении нормальном распределении переменной. Для ранга г и количества наблюдений я соответствующие долевые оценки вычисляются по четырем нижеследующим формулам.

Blom: (r-3/8)/(n+1/4)
Tukey: (r-1/3)/(n+1/3)
Rankit: (r-1/2)/n
Van der Waerden: r/(n+1)

· Normal scores (Нормальные ранги): Значения процентилей, относящиеся к долевым оценкам.

Для перечисленных рангов SPSS автоматически задает имена переменных, которые приведены в нижеследующей таблице. При этом имеет значение, был ли выбран единственный тип ранга или одновременно вычислялись ранги нескольких типов (что является исключением). В последнем случае, для обеспечения однозначности переменных имена должны различаться. В таблице приводятся также принятые в SPSS метки этих переменных. Для долевых оценок и нормальных рангов здесь приведен вариант, когда применяется формула Блома (Blom); при выборе других формул расчета этих рангов метки соответственно изменяются. Имя исходной переменной — lem (в нашем примере — это средняя ожидаемая продолжительность жизни мужчин).

Тип ранга Единственный тип ранга Несколько типов Метка переменной
Ранг rlem rlem RANK of LEM
Оценка Сэвиджа slem slem SAVAGE of LEM
Относительный ранг rlem rfrOO-1 RFRACTION of LEM
Относительный ранг в % plem perOO! PERCENT of LEM
Сумма весов наблюдений nlem nOOl N of LEM
N-процентили nlem ntiOOl NTILES of LEM
Долевые оценки (по Блому) plern plem PROPORTION of LEM using BLOM
Нормальные ранги (по Блому) nlem nlem NORMAL of LEM using BLOM

Если провести ранговые преобразования всех возможных типов и вывести получившиеся значения с помощью средства формирования сводки наблюдений, мы получим следующую таблицу.

Case Processinq Summary3 (Сводка наблюдений)

  LAN RANK LE SAVAG of RFRACT Nof PERCE of Nof NTILES LE PROPOR Nof using NORM of usin BLO
  ALB 3,00   ,107 10,7     ,092  
  BEL 11,50   ,410 41,0     ,393  
  BUL 15,50   ,553 55,3     ,535 ,088
  DAE 24,00 ,843 ,857 85,7     ,836 ,979
  DEU 13,00   ,464 46,4     ,446  
  DO 17,00   ,607 60,7     ,588 ,223
  FIN 4,00   ,142 14,2     ,128  
  FRA 19.00 ,098 ,678 67,8     ,659 ,410
  GRI 11,50   ,410 41,0     ,393  
  GRO 20,00 ,209 ,714 71,4     ,694 ,509
  IRL 15,50   ,553 55,3     ,535 ,088
  ISL 27,00 1,927 ,964 96,4     ,942 1,575
  ITA 18,00   ,642 64,2     ,623 ,315
  JUG 1,00   ,035 3,5     ,022  
  LUX 14,00   ,500 50,0     ,482  
  NIE 25,00 1,093 ,892 89,2     ,871 1,134
  NOR 28,00 2,927 1,000 100,0     ,977 2,011
  OES 9,00   ,321 32,1     ,305  
  POL 7,00   ,250 25,0     ,234  
  POR 2,00   ,071 7,1     ,057  
  RUM 6,00 - ,214 21,4     ,199  
  SCH 26,00 1,427 ,928 92,8     ,907 1,323
  SCH 23,00 ,643 ,821 82,1     ,800 ,844
  sow 22.00 ,477 ,785 78,5     ,765 ,724
  SPA 21,00 ,334 ,750 75,0     ,730 ,613
  TSC 5,00 - ,178 17,8     ,163  
  TUE 10,00 - ,357 35,7     ,340 -
  UNG 8,00   ,285 28,5     ,269  
Total (Всего) N                  

a. Limited to first 100 cases (Ограничено первыми 100 наблюдениями)

Кодирование и кодировочная таблица

Для того чтобы полученные данные можно было обработать, прежде всего следует создать кодировочную таблицу. Кодировочная таблица устанавливает соответствие между отдельными вопросам анкеты и переменными. используемыми при компьютерной обработке данных. Например, пункту анкеты "Пол" может быть поставлена в соответствие переменная sex.

Переменные — это ячейки памяти, в которые можно записывать значения, введенные с клавиатуры. Мы выбрали для переменной имя sex, так как имена переменных в SPSS для Windows могут содержать до восьми символов. Другое, более подробное имя было бы слишком длинным. Имена переменных могут состоять из букв латинского алфавита, цифр и специальных символов; причем первым символом имени должна быть буква.

Переменные могут принимать различные значения. Переменная sex может иметь два возможных значения: "женский" и "мужской". Кодировочная таблица определяет кодовые числа, соответствующие отдельным значениям переменных; например, значению "женский" может соответствовать цифра "1", а значению "мужской" — "2".

Подитожим задачи, которые решаются при составлении кодировочной таблицы:

· Кодировочная таблица устанавливает соответствие между отдельным вопросам анкеты и переменными.

· " Кодировочная таблица устанавливает соответствие между возможным значениями переменных и кодовыми числами.

Для нашей анкеты мы можем составить следующую кодировочную таблицу. Она приводится в самой анкете.

 







Дата добавления: 2015-08-30; просмотров: 543. Нарушение авторских прав; Мы поможем в написании вашей работы!




Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...


Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...


Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...


Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Основные разделы работы участкового врача-педиатра Ведущей фигурой в организации внебольничной помощи детям является участковый врач-педиатр детской городской поликлиники...

Ученые, внесшие большой вклад в развитие науки биологии Краткая история развития биологии. Чарльз Дарвин (1809 -1882)- основной труд « О происхождении видов путем естественного отбора или Сохранение благоприятствующих пород в борьбе за жизнь»...

Этапы трансляции и их характеристика Трансляция (от лат. translatio — перевод) — процесс синтеза белка из аминокислот на матрице информационной (матричной) РНК (иРНК...

Классификация ИС по признаку структурированности задач Так как основное назначение ИС – автоматизировать информационные процессы для решения определенных задач, то одна из основных классификаций – это классификация ИС по степени структурированности задач...

Внешняя политика России 1894- 1917 гг. Внешнюю политику Николая II и первый период его царствования определяли, по меньшей мере три важных фактора...

Оценка качества Анализ документации. Имеющийся рецепт, паспорт письменного контроля и номер лекарственной формы соответствуют друг другу. Ингредиенты совместимы, расчеты сделаны верно, паспорт письменного контроля выписан верно. Правильность упаковки и оформления....

Studopedia.info - Студопедия - 2014-2024 год . (0.009 сек.) русская версия | украинская версия