Ограничения метода ранговой корреляции
По каждой переменной должно быть представлено не менее 5 наблюдений. Верхняя граница выборки – меньше или равна 40. Коэффициент ранговой корреляции Спирмена rs при большом количестве одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпадающих значений. В случае несоблюдения такого условия вносится поправка на одинаковые ранги (будет дано ниже). Помимо этих ограничений, следует так же помнить об ограничениях корреляционного метода вообще – невозможность обнаружения причинной связи между явлениями. В математической статистике для любой измеряемой величины можно вычислить числовые характеристики. Они помогают произвести интерпретацию данных, записанных в числовом виде. Однако, с их помощью не представляется возможным описать связь между двумя величинами. Существует ряд способов, позволяющих определить параметры связи нескольких измеряемых величин. Наиболее простым среди них можно назвать метод, использующий понятие ранговой корреляции. Для применения данного метода на практике регистрируют два показателя на одной выборке испытуемых, предварительно их проранжировав. Коэффициент ранговой корреляции – это число, по которому можно определить характер и силу связи. Предположим, что у группы испытуемых с помощью некоторой методики оценивались такие качества, как аккуратность и вежливость. По характеру связь может быть либо прямой, либо обратной. Прямая связь показывает, что высокий уровень одной измеряемой величины (например, аккуратности) соответствует достаточно высокому уровню другой измеряемой величины (в данном случае, вежливости). Таким образом, прямая связь между аккуратностью и вежливостью показывает, что от аккуратного человека следует ожидать, что он окажется вежливым. Обратная связь, напротив, демонстрирует, что наиболее высоким значениям первой величины соответствуют наиболее низкие значения второй измеряемой величины. Т.е. наличие обратной связи между аккуратностью и вежливостью показало бы, что наиболее аккуратные люди данной выборки являются наименее вежливыми, и наоборот: вежливым людям не свойственна аккуратность. Однако, знать только характер связи величин недостаточно для полноценного описания этой связи. Важным является также понятие силы. Чем сильнее связь, тем ярче выражена зависимость измеряемых величин. Коэффициент ранговой корреляции позволяет выявить как силу, так и характер связи. В определении рангового коэффициента корреляции ключевую роль играет понятие ранга. Расположим значения x1, x2, …, xn величины X в порядке возрастания (или убывания), т.е. x1< x2< …< xn (или x1> x2> …> xn). Тогда в имеющейся выборке значение xi величины X можно заменить рангом i этого значения. При наличии равных показателей у записанных значений им присваивается общий ранг, равный среднему арифметическому соответствующих вариантных мест. Замена значений величины X на соответствующие ранги называется ранжированием. Проранжировав значения величин X и Y, мы получим новые выборки, по которым можно вычислять ранговые коэффициенты корреляции. Среди ранговых коэффициентов корреляции следует выделить коэффициент Спирмена, определяющийся по формуле: где di – разность соответствующих рангов величин X и Y, n – объём выборки.
Коэффициент корреляции Спирмена обладает следующими свойствами: Коэффициент корреляции может принимать значения от минус единицы до единицы, причем при rs=1 имеет место строго прямая связь, а при rs= -1 – строго обратная связь. Если коэффициент корреляции отрицательный, то имеет место обратная связь, если положительный, то – прямая связь. Если коэффициент корреляции равен нулю, то связь между величинами практически отсутствует. Чем ближе модуль коэффициента корреляции к единице, тем более сильной является связь между измеряемыми величинами. Связь принято считать сильной, если, средней силы, если 0.3< |rs|< 0.7 и слабой, если. Заметим, что существует и более тонкая градация силы связи, представленная шкалой Чертока, отображенной в таблице1:
Таблица 1
Пример Проиллюстрируем на примере, как рассчитывается коэффициент корреляции Спирмена. Определим характер и силу связи между результатами ЕГЭ по математике и физике, используя данные из приведенной ниже таблицы 2.
Таблица 2
Проранжируем имеющиеся данные в порядке их убывания и найдём квадраты разностей соответствующих рангов. Особое внимание следует обратить на то, что пятое и шестое место по физике делят два ученика, набравшие по 75 баллов. В этом случае для данных испытуемых следует присвоить ранг 5, 5 (т.е. среднее арифметическое значение между 5 и 6).
Таблица 3
Объём выборки n=10.Тогда:
Вывод: имеет место прямая связь средней силы.
Использование коэффициента ранговой корреляции Спирмена очень удобно в силу относительной простоты его расчёта. Однако, в математической статистике показано, что коэффициент корреляции Спирмена применим не во всех случаях. Эффективность и качество оценки методом Спирмена снижается, если разница между различными значениями какой-либо из измеряемых величин достаточно велика. Не рекомендуется использовать коэффициент Спирмена, если имеет место неравномерное распределение значений измеряемой величины.
Контрольные вопросы 1. Что такое корреляция? 2. Что позволяет определить метод ранговой корреляции Спирмена? 3. Каковы ограничения метода ранговой корреляции Спирмена? 4. Как по значению коэффициент корреляции Спирмена определить силу и направление связи между величинами? 5. По какой формуле рассчитывается коэффициент ранговой корреляции Спирмена?
|