Студопедия — Мера Гудмена и Краскала
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Мера Гудмена и Краскала






 

Коэффициенты корреляции для анализа данных порядкового (рангового) уровня. Для начала введем обозначения:

количество категорий переменной A;

количество категорий переменной B.

Для примера возьмем какую-нибудь пару наблюдений, одно из которых принадлежит ячейке i1, j1, т.е. имеет категорию i1 переменной A и категорию j1 переменной B, а второе измерение – из ячейки i2, j2.

Порядковые меры связи – это всегда простые функции от следующих четырех величин:

S – общее число пар наблюдений, для которых либо одновременно i1 > i2 и j1 > j2, либо, наоборот, i1 < i2 и j1 < j2, т.е. когда ранги пар измерений совпадают;

D – общее число пар наблюдений, для которых либо i1 > i2 и j1 < j2, либо i1 < i2 и j1 > j2, т.е. когда ранги пар измерений не совпадают;

Та – общее число пар наблюдений, для которых i1 = i2;

Tb – общее число пар наблюдений, для которых j1 = j2.

Когда между переменными A и B существует сильная связь, число S становится большим, а число D – малым.

Меры ранговой корреляции γ – Гудмена и Краскала, τ – Кендалла и d – Сомерса различаются только способом нормирования разности “S – D”.

Мера γ Гудмена и Краскала (предложена в 1954 г.):

Мера γ Гудмена и Краскала – это разность между вероятностями “правильного” и “неправильного” порядка для двух наблюдений, взятых наугад при условии, что совпадающих рангов нет.

 

γ Гудмена и Краскала изменяется в интервале от –1 до + 1:

в общем случае при отсутствии зависимости между А и В, γ обращается в 0, однако, не всегда, если γ = 0, то А и В независимы.

Пример вычислений приведен на рис. 4.

Рис. 4. Пример таблицы для вычисления меры γ Гудмена и Краскала

 

Для вычисления S => последовательно перебираются все ячейки, с умножением их частоты на суммарную частоту того блока ячеек, которые лежат ниже и правее следующей выбранной ячейки.

На рис. 4 частота “13” в ячейке (1,1) должна умножаться на частоту выделенного прямоугольника 2x3 (она равна: 24+28+34+8+15+24=133).

Совокупность таких (i – 1)(j – 1) перекрестных произведений и есть S (рис. 5).

Рис. 5. Таблицы для вычисления величины S

 

S = 13 х (24+28+34+8+15+24) + 13 х (28+34+15+24) + 12 х (34+24) + 4 х (8+15+24) +
+ 24 х (15+24) + 28 х (24) = 5534

Величина D => вычисляется совершенно так же, только частота в каждой ячейке умножается на суммарную частоту блока, расположенного ниже и слева (рис. 6).

Рис. 6. Таблицы для вычисления величины D

 

Отсюда D = 22 х (4+24+28+3+8+15) + 12 х (4+24+3+8) + 13 х (4+3) + 34 х (3+8+15) +
+ 28 х (3+8) + + 24 х (2) = 3627

Итак: γ = 5534 – 3627 = 0,208.

5534 + 3627

3.3. Проблема связанных рангов. Коэффициент τ (тау) Кендалла

Если значения признака имеют одинаковую оценку, то ранги, присваиваемые этим значениям, называются связанными. В таких случаях действует особое правило приписывания рангов. Напри­мер, если 12-й и 13-й сверху ранги 245 учащихся выпускного класса имеют средний балл 4,76, то обоим учащимся надо при­своить ранг, равный среднему двух рангов (12 + 13)/2 = 12,5. Или когда эксперт не может установить разницу в достоинствах почерка трех первых учащихся, он присваивает им всем среднее первых трех рангов, 2 = (1+2+3)/3.

Когда мы имеем дело со связанными рангами, ни уравнение rs, ни уравнение γне пригодны для вычисления тесноты связи между ран­гами.

Но способ вычислить корреляцию между изучаемыми признаками существует.

Ранговый коэффициент корреляции Кендалла τ может использоваться для измерения взаимосвязи между качественными и количественными признаками, характеризующими однородные объекты и ранжированные по одному принципу.

Коэффициент ранговой корреляции Кенделла – мера связи, основанная на числе совпадений или инверсий в ранжировках статистических признаков Х и Y.

Расчет данного коэффициента выполняется в следующей последовательности:

1) значения Х ранжируются в порядке возрастания или убывания;

2) значения У располагаются в порядке, соответствующем значениям Х;

3) для каждого ранга У определяется число следующих за ним значений рангов, превышающих его величину. Суммируя, таким образом, числа, определяют величину Р как меру соответствия последовательности рангов по Х и У. Она учитывается со знаком плюс;

4) для каждого ранга У определяется число следующих за ним рангов, меньших его величины. Суммарная величина обозначается через Q и фиксируется со знаком “–”;

5) определяется сумма баллов по всем членам ряда.

Ранговый коэффициент Кендалла определяется по формуле

 

,

 

где n – число наблюдений; S – сумма разностей между числом последовательностей и числом инверсий по второму признаку S = PQ.

Пусть восьми испытуемым присвоены разные ранги по признакам Х и Y.

Расчет данного коэффициента выполняется следующим образом.

1. Значения Х ранжируются в порядке возрастания или убывания.

2. Значения Y располагаются в порядке, соответствующем значениям Х.

3. Для каждого ранга Y определяется число следующих за ним значений рангов, превышающих его величину. Суммируя таким образом числа, определяем величину Р как меру соответствия последовательностей рангов по Х и Y и учитываем со знаком +.

4. Для каждого ранга Y определяется число следующих за ним рангов, меньших его величины. Суммарная величина обозначается через Q и фиксируется со знаком –.

5. Определяется сумма баллов по всем членам ряда.

Пример вычисления коэффициента тау Кендалла – τ (1 обозначает наивысший ранг) приведен в табл. 13.

 

Таблица 13

Пример вычисления коэффициента тау Кендалла

 

Испытуемый Лицо Х – ранг первого признака Y – ранг второго признака Совпадения Инверсии
  А        
  С        
  В        
  Н        
  Е F D        
  G        
n=8       Р=21 Q=7

 

Р = 5+6+5+3+1+0+1+1+0=21

Q = 2+0+0+1+2+2+0+0=7

 

.

 

Как правило, коэффициент Кендалла меньше коэффициента Спирмена. При достаточно большом объеме совокупности значения коэффициентов Спирмена и Кендалла имеют следующую зависимость

 

τ = 2/3 rs.

 

3.4. Множественный коэффициент ранговой корреляции (коэффициент конкордации) – W

Множественная (общая, совокупная) корреляция – корреляционная зависимость переменной от ряда факторов (варьирующих признаков).

Множественный коэффициент ранговой корреляции W (коэффициент конкордации) – определение тесноты связи между произвольным числом ранжированных признаков.

Он используется для измерения степени согласованности двух или нескольких рядов проранжированных значений переменных.

 

W = ,

 

где К – число переменных,

N – число ранжируемых объектов,

S – отклонение суммы квадратов рангов от средней квадратов рангов ,

а – среднее суммы рангов (табл. 14).

 

Таблица 14

Пример вычисления множественного коэффициента W

Респондент (объекты) Ранг признаков Σ рангов в строках Квадрат суммы
А В С
1- й          
2- й          
3- й          
4- й          
5- й          
N =5 - - - а=45  

 

 

 







Дата добавления: 2015-09-18; просмотров: 4022. Нарушение авторских прав; Мы поможем в написании вашей работы!



Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Меры безопасности при обращении с оружием и боеприпасами 64. Получение (сдача) оружия и боеприпасов для проведения стрельб осуществляется в установленном порядке[1]. 65. Безопасность при проведении стрельб обеспечивается...

Весы настольные циферблатные Весы настольные циферблатные РН-10Ц13 (рис.3.1) выпускаются с наибольшими пределами взвешивания 2...

Хронометражно-табличная методика определения суточного расхода энергии студента Цель: познакомиться с хронометражно-табличным методом опреде­ления суточного расхода энергии...

Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...

Краткая психологическая характеристика возрастных периодов.Первый критический период развития ребенка — период новорожденности Психоаналитики говорят, что это первая травма, которую переживает ребенок, и она настолько сильна, что вся последую­щая жизнь проходит под знаком этой травмы...

РЕВМАТИЧЕСКИЕ БОЛЕЗНИ Ревматические болезни(или диффузные болезни соединительно ткани(ДБСТ))— это группа заболеваний, характеризующихся первичным системным поражением соединительной ткани в связи с нарушением иммунного гомеостаза...

Studopedia.info - Студопедия - 2014-2024 год . (0.008 сек.) русская версия | украинская версия