Ранговые преобразования

⇐ Предыдущая 1 234 5 6 7 8 9 10 Следующая ⇒

В SPSS существует возможность задавать ранги для измеренных значений переменной, проводить оценки Сэвиджа, вычислять процентные ранги и формировать процентильные группы, добавляя в файл данных соответствующие переменные.

Так, например, в формулах для непараметрических тестов (см. главу 14) вместо исходных измеренных значений переменной используются присвоенные им ранги. Однако эти процедуры производят автоматическое присвоение рангов и в явном виде выполнять предварительные ранговые преобразования не требуется. Поэтому они играют второстепенную роль.

Мы продемонстрируем присвоение рангов на более наглядном примере, а затем проведем обзор различных типов рангов.

Пример рангового преобразования

В главе 20 представлен файл europa.sav, содержащий отдельные статистические показатели по 28 европейским странам. В частности, он включает переменные land (краткое обозначение страны) и tjul (средняя дневная температура в июле). Требуется расположить страны в нисходящем порядке согласно значениям последней переменной и затем вывести их в отсортированном виде.

· Загрузите файл europa.sav.

· Выберите в меню команды Transform (Преобразовать) Rank Cases... (Присвоить ранги наблюдениям) Откроется диалоговое окно Rank Cases.

Рис. 8.10:Диалоговое окно Rank Cases

· Щелкните в списке переменных на переменной tju1. В поле By: (По) можно задать группирующую переменную. В этом случае назначение рангов будет выполнено раздельно по группам, образуемым этой переменной.

· Присвоим самой теплой стране (с максимальным значением переменной tju1) ранг 1; для этого щелкните в поле Assign Rank I to (Присвоить ранг 1) на опции Largest value (Максимальное значение).

Щелкнув на кнопке Rank types... (Типы рангов), можно увидеть стандартную настройку Rank. Пока оставим ее без изменений; остальные настройки мы рассмотрим в разделе 8.6.2.

· Кнопка Ties... (Связки) открывает диалоговое окно Rank Cases: Ties.

Его настройки указывают, как программа будет поступать при появлении одинаковых измеренных величин. По умолчанию принято (и, как правило, это наилучший вариант), что присваивается среднее (Mean) из значений рангов этих величин. При установке Low все значения получают наименьший, при установке High — наибольший из этих рангов. При выбранной опции Sequential ranks to unique values (Присваивать последовательные ранги) все связанные наблюдения получают одинаковый ранг; следующему наблдению присваивается следующее по порядку целое число. Поэтому максимальный присвоенный ранг равен не общему количеству значений, а количеству различных значений.

Перечисленные четыре способа присвоения рангов можно пояснить с помощью простого примера, в котором семь значений расположены по убыванию.

Рис. 8.11: Диалоговое окно Rank Cases: Ties

Значение	Mean	Low	High	Sequential ranks to unique values

	2,5
	2,5

· Оставьте стандартную настройку и закройте диалоговое окно кнопкой Continue.

· Начните присвоение рангов, щелкнув на ОК.

В файл данных будет добавлена переменная rtju1, содержащая ранги, присвоенные значениям переменной tju1. Для обозначения ранговой переменной к имени исходной переменной спереди дописывается буква г.

Затем отсортируем файл данных по этой ранговой переменной.

· Для этого, как описано в разделе 7.3, выберите в меню команды Data (Данные) Son Cases... (Сортировать наблюдения) и в появившемся диалоговом окне выберите в качестве переменной сортировки rtjul. Примите предлагаемый по умолчанию порядок сортировки по возрастанию.

· Запустите сортировку кнопкой ОК. Теперь выведем значения переменных rtju1, land и tju1 в отсортированном виде.

· Для этого выберите в меню команды (см. раздел 4.8) Analyze (Анализ) Reports (Отчеты) Case summaries... (Итоги по наблюдениям) и перенесите в поле Variables переменные rtjul, land и tjul в указанной последовательности.

· Запустите создание отчета кнопкой ОК. В окне просмотра будет показана следующая таблица.

Отсюда можно заключить, что Греция является самой теплой страной (ранг 1), за ней следует Италия (ранг 2), следующий ранг имеют две страны — Албания и Румыния (средний ранг 3,5) и т.д.

Case Processing Summary a (Сводка случаев)

	RANK TJU	LAN	Средняя дневная температура в июле
	1,00	GRI
	2,00	ITA
	3,50	ALB
	3,50	RUM
	5,50	JUG
	5,50	TUE
	7,50	BUL
	7,50	UNG
	9,50	FOR
	9,50	SPA
	13,00	DEU
	13,00	FRA
	13,00	OES
	13,00	SCH
	13,00	TSC
	17,00	DD
	17,00	POL
	17,00	SOW
	19,50	BEL
	19,50	LUX
	23,50	DAE
	23,50	FIN
	23,50	GRO
	23,50	NIE
	23,50	NOR
	23,50	SCH
	27,00	IRL
	28,00	ISL
Total (Всего)N
a. Limited to first 100 cases(Ограничено первыми 100 случаями)

2 Типы рангов

В диалоге Rank Cases можно, щелкнув на кнопке Rank Types... (Типы рангов), от-крыть диалоговое окно Rank Cases: Types (Ранги: Типы). В этом окне представлены шесть типов рангов; щелкнув на кнопке More» (Еще), можно увидеть еще два.

Ниже приведено объяснение различных типы рангов.

· Rank (Ранг): Абсолютные значения рангов (см. раздел 8.6.1). Это установка по умолчанию.

· Savage score (Оценка Сэвиджа): Это значения ранга, полученное на основе экспоненциального распределения. При общем количестве значений переменной т оценка Сэвиджа для i-го ранга определяется по формуле

Рис. 8.12: Диалоговое окно Rank Cases: Types

· Fractional Rank (Относительный ранг): Это значение ранга деленное на количество наблюдений.

· Fractional Rank as % (Относительный ранг в %): Это численные значения относительных рангов, умноженные на 100. Например, процентный ранг 33,93 означает, что 33,93% всех наблюдений имеют более низкий ранг.

· Sum of case weights (Сумма весов наблюдений): Эта величина представляет интерес только при определении рангов для подгрупп и является постоянной в каждой подгруппе; она соответствует количеству случаев в подгруппе.

· Ntiles (N-процентили): Пользователь может задать число групп процентилей, на которые должны быть разбиты наблюдения (по умолчанию 4). Тогда каждому случаю присваивается значение процентильной группы, к которой он принадлежит.

· Proportion estimates (Долевые оценки): Вычисление накопленной доли при предположении нормальном распределении переменной. Для ранга г и количества наблюдений я соответствующие долевые оценки вычисляются по четырем нижеследующим формулам.

Blom:	(r-3/8)/(n+1/4)
Tukey:	(r-1/3)/(n+1/3)
Rankit:	(r-1/2)/n
Van der Waerden:	r/(n+1)

· Normal scores (Нормальные ранги): Значения процентилей, относящиеся к долевым оценкам.

Для перечисленных рангов SPSS автоматически задает имена переменных, которые приведены в нижеследующей таблице. При этом имеет значение, был ли выбран единственный тип ранга или одновременно вычислялись ранги нескольких типов (что является исключением). В последнем случае, для обеспечения однозначности переменных имена должны различаться. В таблице приводятся также принятые в SPSS метки этих переменных. Для долевых оценок и нормальных рангов здесь приведен вариант, когда применяется формула Блома (Blom); при выборе других формул расчета этих рангов метки соответственно изменяются. Имя исходной переменной — lem (в нашем примере — это средняя ожидаемая продолжительность жизни мужчин).

Тип ранга	Единственный тип ранга	Несколько типов	Метка переменной
Ранг	rlem	rlem	RANK of LEM
Оценка Сэвиджа	slem	slem	SAVAGE of LEM
Относительный ранг	rlem	rfrOO-1	RFRACTION of LEM
Относительный ранг в %	plem	perOO!	PERCENT of LEM
Сумма весов наблюдений	nlem	nOOl	N of LEM
N-процентили	nlem	ntiOOl	NTILES of LEM
Долевые оценки (по Блому)	plern	plem	PROPORTION of LEM using BLOM
Нормальные ранги (по Блому)	nlem	nlem	NORMAL of LEM using BLOM

Если провести ранговые преобразования всех возможных типов и вывести получившиеся значения с помощью средства формирования сводки наблюдений, мы получим следующую таблицу.

Case Processinq Summary3 (Сводка наблюдений)

	LAN	RANK LE	SAVAG of	RFRACT Nof	PERCE of	Nof	NTILES LE	PROPOR Nof using	NORM of usin BLO
	ALB	3,00		,107	10,7			,092
	BEL	11,50		,410	41,0			,393
	BUL	15,50		,553	55,3			,535	,088
	DAE	24,00	,843	,857	85,7			,836	,979
	DEU	13,00		,464	46,4			,446
	DO	17,00		,607	60,7			,588	,223
	FIN	4,00		,142	14,2			,128
	FRA	19.00	,098	,678	67,8			,659	,410
	GRI	11,50		,410	41,0			,393
	GRO	20,00	,209	,714	71,4			,694	,509
	IRL	15,50		,553	55,3			,535	,088
	ISL	27,00	1,927	,964	96,4			,942	1,575
	ITA	18,00		,642	64,2			,623	,315
	JUG	1,00		,035	3,5			,022
	LUX	14,00		,500	50,0			,482
	NIE	25,00	1,093	,892	89,2			,871	1,134
	NOR	28,00	2,927	1,000	100,0			,977	2,011
	OES	9,00		,321	32,1			,305
	POL	7,00		,250	25,0			,234
	POR	2,00		,071	7,1			,057
	RUM	6,00	-	,214	21,4			,199
	SCH	26,00	1,427	,928	92,8			,907	1,323
	SCH	23,00	,643	,821	82,1			,800	,844
	sow	22.00	,477	,785	78,5			,765	,724
	SPA	21,00	,334	,750	75,0			,730	,613
	TSC	5,00	-	,178	17,8			,163
	TUE	10,00	-	,357	35,7			,340	-
	UNG	8,00		,285	28,5			,269
Total (Всего) N

a. Limited to first 100 cases (Ограничено первыми 100 наблюдениями)

Кодирование и кодировочная таблица

Для того чтобы полученные данные можно было обработать, прежде всего следует создать кодировочную таблицу. Кодировочная таблица устанавливает соответствие между отдельными вопросам анкеты и переменными. используемыми при компьютерной обработке данных. Например, пункту анкеты "Пол" может быть поставлена в соответствие переменная sex.

Переменные — это ячейки памяти, в которые можно записывать значения, введенные с клавиатуры. Мы выбрали для переменной имя sex, так как имена переменных в SPSS для Windows могут содержать до восьми символов. Другое, более подробное имя было бы слишком длинным. Имена переменных могут состоять из букв латинского алфавита, цифр и специальных символов; причем первым символом имени должна быть буква.

Переменные могут принимать различные значения. Переменная sex может иметь два возможных значения: "женский" и "мужской". Кодировочная таблица определяет кодовые числа, соответствующие отдельным значениям переменных; например, значению "женский" может соответствовать цифра "1", а значению "мужской" — "2".

Подитожим задачи, которые решаются при составлении кодировочной таблицы:

· Кодировочная таблица устанавливает соответствие между отдельным вопросам анкеты и переменными.

· " Кодировочная таблица устанавливает соответствие между возможным значениями переменных и кодовыми числами.

Для нашей анкеты мы можем составить следующую кодировочную таблицу. Она приводится в самой анкете.

⇐ Предыдущая 1 234 5 6 7 8 9 10 Следующая ⇒

Дата добавления: 2015-08-30; просмотров: 543. Нарушение авторских прав; Мы поможем в написании вашей работы!

Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...

Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

БИОХИМИЯ ТКАНЕЙ ЗУБА В составе зуба выделяют минерализованные и неминерализованные ткани...

Типология суицида. Феномен суицида (самоубийство или попытка самоубийства) чаще всего связывается с представлением о психологическом кризисе личности...

ОСНОВНЫЕ ТИПЫ МОЗГА ПОЗВОНОЧНЫХ Ихтиопсидный тип мозга характерен для низших позвоночных - рыб и амфибий...

Конституционно-правовые нормы, их особенности и виды Характеристика отрасли права немыслима без уяснения особенностей составляющих ее норм...

Толкование Конституции Российской Федерации: виды, способы, юридическое значение Толкование права – это специальный вид юридической деятельности по раскрытию смыслового содержания правовых норм, необходимый в процессе как законотворчества, так и реализации права...

Значення творчості Г.Сковороди для розвитку української культури Важливий внесок в історію всієї духовної культури українського народу та її барокової літературно-філософської традиції зробив, зокрема, Григорій Савич Сковорода (1722—1794 pp...

Studopedia.info - Студопедия - 2014-2026 год . (0.01 сек.) русская версия | украинская версия