МЕРЫ СВЯЗИ ДАННЫХ, ИЗМЕРЕННЫХ В РАЗНЫХ ШКАЛАХ5.1. Точечный бисериальный коэффициент корреляции rрb для данных, измеренных
Если одна переменная измеряется в дихотомической шкале наименований, а другая – в шкале интервалов или отношений, то используется бисериальный коэффициент корреляции. В этом случае одна переменная измеряется дихотомически (например, пол, семейное положение), а измерение другой дает совокупность значений со свойствами шкалы интервалов или отношений. Например, для группы младших школьников мы можем узнать, будут ли они впоследствии исключены из колледжа (показатель 0) на первом году обучения или останутся в нем (показатель 1), а также оценить их интеллект (в школе). Наблюдение двух переменных, интеллекта (X) и успехов (Y), предполагает для каждого учащегося две оценки. Один из способов описания связи между Х и Y – вычисление коэффициента Пирсона по имеющимся данным. Такой коэффициент называется точечным бисериальным коэффициентом корреляции и обозначается rpb. Точечный бисериальный коэффициент корреляции rpb – мера разности между средними оценками по Х объектов, имеющих единицы по Y, и объектов, имеющих нули по Y; оценивание связи между качественным альтернативным и количественным варьирующим признаками. Термин “бисериальный” означает, что существуют две серии объектов при наблюдении X: те, что имеют нуль по Y, и те, что имеют единицу. Названием и формулой этого коэффициента мы обязаны К. Пирсону. Иногда вместо выражения “точечный бисериальный” используется выражение “бисериальное произведение моментов”. Упрощенная формула rpb имеет вид: rpb = , где – среднее по Х объектов, имеющих единицы по Y: – среднее по Х объектов, имеющих нуль по Y; sx – стандартное отклонение всех n значений по X, n1 – число объектов, имеющих единицу по Y; n0 – число объектов, имеющих нуль по Y, и n = n1 + n0. Данное уравнение представляет собой алгебраическое упрощение формулы коэффициента корреляции Пирсона для случая, когда Y – дихотомическая переменная. Это только один из нескольких возможных вариантов упрощений. Как видно из анализа уравнения, rpb есть мера разности между средними оценками по Х объектов, имеющих единицы по Y, и объектов, имеющих нули по Y. Поскольку rpb ничуть не больше коэффициента корреляции Пирсона, который вычисляется по данным специального вида, он должен принимать значения от –1 до +1 включительно. Если объекты, имеющие единицу по Y, имеют среднее по X, равное среднему объектов с нулями по Y, rpb обратится в нуль. Вычисление rpb показано в табл. 19 на данных, собранных для выявления связи пола (номинальная дихотомическая переменная) и роста для 15 подростков – 8 мальчиков и 7 девочек. Мальчики в среднем выше девочек (163,25 и 156,57 см соответственно), но связь, выявленная между полом и ростом, оказалась умеренной (0,41). Только одна девочка выше «среднего» мальчика, но шесть из семи девочек выше самого маленького мальчика. Таблица 19 Пример вычисления точечно-бисериального коэффициента корреляции
|