Ограничения и требования коэффициента корреляции Спирмена
1. Важно, чтобы ∑ рангов переменных X и Y были равны. Иначе говоря: ∑(RX) = ∑(RY), где ∑(RX) и ∑(RY) – суммы рангов Х и Y соответственно. 2. Требования численности: 5 ≤ N ≤ 40. При N > 40 можно пользоваться критическими значениями для r Пирсона с df = n – 2. 3. При наличии связанных (равных) рангов, в формулу нужно вносить поправки на равные ранги. Поправка рассчитывается для той переменной, где есть связанные ранги, т.е. или для Х, или для Y, или для обеих переменных: Общая формула поправки: TХ = ∑(ti3–ti)/12, где ТX – значение поправки, которое прибавляется к числителю формулы, «ti» – объём каждой группы одинаковых рангов. Аналогично рассчитывается поправка для переменной Y. Обычно с помощью ρ решаются следующие задачи: 1. Связанность 2 переменных, измеренных на одной выборке испытуемых. 2. Сходство (близость) 2 испытуемых, оцененных по общим критериям. 3. Связанность двух групповых иерархий признаков. 4. Связанность индивидуальной и групповой иерархий. Пример. При оценке интеллекта его обычно подразделяют на вербальный и невербальный. Первый заключается в умении формировать и использовать понятия для обобщения сходных объектов внешнего мира; он зависит от развития речи и уровня образования. Второй зависит от врождённых свойств и проявляется в быстроте обучения, выделении закономерностей в окружающем мире, не требующих вербализации. В случае наличия связи между вербальным и невербальным интеллектом улучшаются результаты как индивидуальной деятельности, так и взаимодействия между членами группы. Присутствует ли связь между вербальным и невербальным интеллектом в группе студентов-физиков (10 чел.)? Анализ. Здесь мы сталкиваемся с классическим случаем использования КК: мы имеем две различные самостоятельные переменные, измеренные у одних и тех же испытуемых. Все сопутствующие расчёты представлены в таблице.
В переменной ВИ ранги 5,5 встречаются 2 раза, а ранги 9 – 3 раза. В переменной НИ связанных рангов нет. Имеем: Ta=∑(a3–а)/12 = [(33–3) + (23–2)] / 12 = [24 + 6] / 12 = 2,5. Tb= 0. (Отсюда ∑ = 1–[6∙158,5+2,5/(10∙102–1)] = 0,037. Если поправкой на равные ранги пренебречь, то ρ = 1–[6∙158,5/(10 ∙102–1)] = 0,039. Как видим, полученные значения различаются слабо, но чем больше повторяющихся рангов, тем большую погрешность они вносят. Поэтому можно дать такую рекомендацию: если n достаточно велико (n ≥ 10) и связанных рангов мало, поправкой можно пренебречь. Для n = 10 и р = 0,05 ρкр = 0,64. ρэмп < ρкр. Вывод: корреляция между вербальным и невербальным интеллектом у 10 студентов-физиков не отличается от нуля. Это значит, что в данной группе нет какой-либо взаимосвязи вербального и невербального интеллекта.
Фи-коэффициент ассоциации К. Пирсона (Pearson association phi-coefficient) используется для расчёта корреляции (ассоциации) признаков, каждый из которых может принимать только 2 значения (есть признак/нет признака, да/нет, один/другой и т.п.). Основой для расчёта φ-коэффициента служит 4-клеточная таблица сопряжённости следующего вида:
Если 1 – это наличие изучаемого признака, а 0 – его отсутствие, то буквенные обозначения приобретают следующее содержание: A – количество объектов, для которых X=1 и Y=1; B – количество объектов, для которых X=1 и Y=0; C – количество объектов, для которых X=0 и Y=1; D – количество объектов, для которых X=0 и Y=0. Формула имеет следующий вид: Проверяемые статистические гипотезы несколько отличаются от тех, что формулируются для коэффициентов корреляции: Н0: Прямая ассоциация признаков (ad) не отличается от обратной (bc). Н1: Прямая ассоциация признаков (ad) отличается от обратной (bc). NB: Дело в том, что произведение ad характеризует силу прямой связи признаков, а bc – обратной. Если они значимо не отличаются между собой, значит, корреляция (ассоциация) признаков отсутствует; если отличается – корреляция значима. Также как и для остальных КК гипотезы оценивают лишь абсолютную величину разности, но не её направленность. При составлении таблицы сопряжённости очень важно правильно расставлять данные по полям. Например, мы хотим проверить гипотезу о зависимости отношения к кошкам от пола: бытует мнение, что кошек любят женщины, а мужчины чаще не любят. Ниже показаны правильные и неправильные варианты построения таблицы.
Варианты 1-4 представляют правильные варианты составления таблицы, варианты 5-6 – неверные. На этом примере показано, что во всех "правильных" вариантах составления таблицы проверяется гипотеза, что женщины любят кошек, а мужчины нет; во всех "неправильных" проверяется обратная гипотеза (мужчины любят кошек, а женщины – нет). Особенности и условия применения метода: 1. Ни один из основных показателей (a, b, c, d) не должен быть равен нулю. 2. Менее 5 элементов допускается только в одной из 4 ячеек таблицы. Это связано с тем, что φ-коэффициент тесно связан с критерием χ2. В некоторых источниках для каждой ячейки требуется не менее 5 элементов. 3. Конструкция таблицы сопряжённости должна точно соответствовать проверяемой статистической гипотезе. В противном случае φ-коэффициент будет иметь другое психологическое содержание. Достоверность φ проверяется по таблицам критических значений критерия χ2 для df = 1. Для этого φ переводится в величину χ2 по формуле: χ2=φ2·n. Если эмпирическое значение χ2превышает табличное, то Н0 отвергается. Для df = 1 и р = 0,05 χ2кр.=3,841. Пример. Существует расхожее мнение, что на психологов учатся люди, чувствующие свою ущербность, неполноценность в сравнении с другими. Для проверки этого положения были анонимно опрошены 38 студентов-первокурсников, 19 «психологов» и 19 студентов других факультетов. Им задавались вопросы стандартизированного интервью, а на основании ответов делался вывод либо о наличии чувства собственной недостаточности у респондента, либо об его отсутствии. Выясните, существует ли связь между поступлением на психологический факультет вуза и чувством собственной недостаточности. Анализ. Пусть переменная X – это переменная эмоциональных переживаний, а переменная Y – переменная факультета обучения. Если каждая из них может принимать только 2 возможных значения, получатся 4 возможные комбинации: a – психологи с наличием чувства недостаточности; b – непсихологи с наличием чувства недостаточности; c – психологи с отсутствием чувства недостаточности; d – непсихологи с отсутствием чувства недостаточности. Заполним таблицу сопряжённости.
Гипотезы: Н0: Поступление на факультет психологии не связано с чувством личной неадекватности. Н1: Поступление на факультет психологии связано с чувством личной неадекватности. Подставляя известные значения в формулу, получаем φ = 0,17. Проверяем значимость этого коэффициента, переводя его в эмпирическое значение критерия χ2. χ2эмп = 0,172 ∙38 = 1,098. Для df = 1 и р = 0,05 χ2кр. = 3,841. χ2эмп < χ2кр. Н0 принимается: корреляционная связь между фактом обучения на психологическом факультете и чувством собственной недостаточности отсутствует. Иначе говоря, среди первокурсников-психологов людей с чувством личной неадекватности не больше, чем среди студентов других факультетов.
|