Свойства корреляции
Выделяют четыре основных свойства корреляции: направленность, тесноту, форму и направление. Направленность корреляции – свойство корреляции, характеризующее одностороннюю обусловленность изменения значений одной из случайных величин изменениями значений другой случайной величины. В общем случае возможна как односторонняя направленность (Х обусловлено Y, но не наоборот, или Y обусловлено X, но не наоборот), так и двусторонняя (взаимная) направленность (Х обусловливает Y, а Y обусловливает X). В частном случае двумерного нормального распределения корреляция всегда взаимна. Но при этом могут оказаться различными степени корреляции. В связи с этим нужно различать корреляцию х по у (х/у) и корреляцию у по х (у/х). Направленность выражается знаком «–» или «+». Теснота (сила) корреляции – свойство корреляции, характеризующее степень обусловленности изменений Х значениями Y, или, наоборот, Y значениями Х. Теснота выражается числовым значением коэффициента в диапазоне от -1 до 1. По аналитическому выражению выделяют связи прямолинейные (или просто линейные) и нелинейные. Если статистическая связь между явлениями может быть приближенно выражена уравнением прямой линии, то ее называют линейной связью. Если же она выражается уравнением какой-либо кривой линии (параболы, гиперболы и др.), то такую связь называют нелинейной или криволинейной. По направлению выделяют связь прямую и обратную. При прямой связи с увеличением значений факторного признака происходит увеличение результативного признака. В случае обратной связи значения результативного признака изменяются под воздействием факторного, но в противоположном направлении по сравнению с изменением факторного признака. 1.3. Интерпретация корреляции: графическая, содержательная
Методы анализа и интерпретации корреляции могут быть как графическими, так и содержательными. Содержательные методы анализа можно подразделить на количественный (математический) анализ и качественный. Количественный (математический) анализ использует интерпретацию коэффициента корреляции. По какой бы формуле ни вычислялся коэффициент корреляции, его величина колеблется в пределах от –1 до +1. Если коэффициент корреляции равен +1, значит, связь между признаками однозначна (функциональная, нестатистическая), по типу прямо пропорциональной зависимости. Если коэффициент равен –1, то связь также является однозначной или функциональной, но по типу обратной пропорциональности. Нулевая величина коэффициента корреляции говорит о полном отсутствии линейной связи между сопоставляемыми признаками. При нулевом коэффициенте корреляции возможно наличие зависимостей другого (нелинейного) типа. Тесная (сильная) корреляция определяется при коэффициенте корреляции порядка не ниже ±0,7. Средняя корреляция определяется при коэффициенте корреляции в диапазоне 0,5-0,69. Умеренная корреляция определяется при коэффициенте корреляции в диапазоне 0,3-0,49. Слабая корреляция определяется при коэффициенте корреляции ниже 0,3. Очень слабая корреляция определяется при коэффициенте корреляции 0,2 и ниже. Возможна как односторонняя направленность, так и двусторонняя (взаимная) направленность связи двух переменных. Всякое вычисленное (эмпирическое) значение коэффициента корреляции должно быть проверено на статистическую значимость. Для оценки достоверности выборочного коэффициента корреляции существуют специально разработанные таблицы. Если эмпирическое значение коэффициента меньше или равно табличному для p = 0,05, то корреляция не является статистически значимой. Если вычисленное значение коэффициента корреляции больше табличного для p = 0,01, то корреляция статистически значима (существенна, реальна). В случае, когда величина коэффициента заключена между двумя табличными значениями, на практике говорят о значимости корреляции для p = 0,05. Статистическая значимость вычисленных значений параметров выборки и выбор методов зависят также от количества измерений. При количестве наблюдений n < 30 пар значений можно вычислить только безусловные средние арифметические, дисперсии, коэффициент линейной корреляции. При количестве наблюдений в пределах 30 < n < 200 пар значений можно осуществить простейшую группировку данных, определить форму корреляции, определить в явном виде регрессии и корреляционные отношения. Графические методы анализа – приемы, предваряющие непосредственное вычисление коэффициента корреляции и выявляющие общую направленность рассматриваемой связи двух признаков. Для этого используют диаграмму рассеивания (табл. 2). Таблица 2
Графическая интерпретация значений коэффициентов корреляции
В табл. 2 перечислены различные значения коэффициента корреляции rxy с иллюстрациями типа линейной связи, которая существует между Х и Y для данных значений значения коэффициента корреляции. Качественный анализ – приемы объяснения связи признаков и возможностей ее практического использования в соответствии с содержательным знанием психологических переменных, которые нас интересуют. Так, наличие корреляции двух переменных отнюдь не означает, что между ними существует причинная связь. Несмотря на то, что корреляцию событий можно использовать для выявления причинных связей наряду с другими методологическими подходами, монопольное применение корреляции к анализу причинности рискованно и может ввести в заблуждение. Во-первых, даже в тех случаях, когда можно предположить существование причинной связи между двумя переменными, коррелирующими между собой, коэффициент корреляции rxy сам по себе ничего не говорит о том, вызывает ли Х появление Y или Y вызывает появление X. Во-вторых, наблюдаемая связь часто существует благодаря другим переменным, а не двум рассматриваемым. В-третьих, взаимосвязи переменных в общественных науках почти всегда слишком сложны, чтобы их можно было объяснить единственной причиной. Так, например, успеваемость в школе – результат многочисленных влияний, да и сама по себе успеваемость является сложным понятием, которое нельзя описать адекватно при помощи какого бы то ни было одного измерения. Рассмотрим некоторые проблемы, возникающие при попытке выявить причинные связи с помощью корреляции. Известно, что в некоторых коммерческих школах существует положительная корреляция между средним заработком преподавателей и процентом выпускников, поступивших в колледж. Значит ли это, что высокооплачиваемое школьное преподавание способствует лучшей подготовке абитуриентов колледжа? Увеличится ли процент выпускников, поступивших в колледж, если повысить плату преподавателям? Конечно, утвердительные ответы на эти вопросы нельзя объяснить одной ассоциативной связью. Связь между двумя факторами не проста, кроме того, не учтена еще одна существенная переменная, характеризующая финансовые и экономические условия жизни общества и определяющая его возможности нести расходы как по оплате преподавателей, так и по обучению в колледжах. Наряду с этим, экономическая и финансовая обстановка отчасти зависит от интеллектуальных возможностей населения, т.е. другой переменной, вносящей вклад и в более высокую оплату педагогов, и в посещаемость учащихся. Установлено, что процент учеников, исключенных из школ, отрицательно коррелирует с числом учебников, приходящихся на ученика в библиотеках этих школ. Но здравый смысл подсказывает нам, что нагромождение книг в библиотеке не больше повлияет на число исключенных, чем наем ленивого служащего на увеличение школьной библиотеки. Многие исследователи избегают поспешного и поверхностного вывода о том, что корреляция свидетельствует о причинной зависимости, а приходят к другому заключению. Они приписывают причинной связи определенное направление. Рассмотрим следующий пример. Предположим, что в большой группе учащихся коэффициент корреляции между тревожностью (X) и результатом теста на интеллект IQ (Y) равен 0,60. Означает ли это, что большое волнение, которое испытывала часть учеников, привело к тому, что они плохо выдержали испытание, а более спокойные ученики, оказались в состоянии успешно проявить свои способности? Некоторые исследователи сделали именно такой вывод. Но разве не столь же правдоподобно считать, что сам тест является фактором, вызывающим беспокойство? Не могли ли менее способные ученики испугаться испытания, а способные – найти его приятным и не беспокоиться? В данном случае вопрос в том, можно ли сказать, что Х вызывает Y или что Y вызывает X. Обычный коэффициент корреляции между Х и Y не может дать ответ на этот вопрос. Причинные связи часто трудно интерпретировать без экспериментальной проверки. Квалифицированный экспериментальный подход к этой задаче предполагал бы формирование группы тревожных учеников и сравнение их оценок с оценками контрольной группы. Хотя корреляция и не указывает прямо на причинную связь, она может стать ключом к разгадке причин. При благоприятных условиях на ее основе можно сформулировать гипотезы, проверяемые экспериментально, когда возможен контроль других влияний, помимо тех, которые подлежат исследованию. Существуют также хорошо разработанные процедуры, в частности в социологии, для вывода причин из связанных данных. Иногда отсутствие корреляции может более значительно повлиять на нашу гипотезу о причинной связи, чем наличие сильной корреляции. Нулевая корреляция двух переменных может свидетельствовать о том, что никакого влияния одной переменной на другую не существует. Существенная корреляция между двумя переменными – это факт, который в разных ситуациях можно объяснить по-разному. Некоторые корреляции – результат измерения причины и ее последствий, например, когда Х – пища, съеденная за месяц, а Y – вес, приобретенный за то же время. Другие корреляции возникают при измерениях двух переменных с общей причиной или влиянием, например, когда Х – успеваемость по английскому языку, а Y – по общественным наукам. Иногда возникают иные корреляции, например, когда объединяются две различные группы, в каждой из которых Х и Y не имеют связи. Предположим, что девочки проявляют большую тревожность, чем мальчики при проверке, например, по шкале выраженной тревожности Тейлора. Хорошо известно, что девочки, как правило, имеют более высокие оценки по английскому языку по сравнению с мальчиками, особенно в средних классах. Диаграмма рассеивания, представляющая показатели тревожности и успеваемости по английскому языку для 15 мальчиков и 15 девочек, могла показать довольно сильную положительную связь между тревогой и успехами в английском языке, когда объединяются оценки мальчиков и девочек. Свидетельствует ли это о том, что тревожность (напряжение) заставляет учащегося усерднее трудиться и тем самым стимулирует большие достижения? Вовсе нет. Если бы это было так, то почему никому не удалось установить какую-либо связь между двумя переменными отдельно для мальчиков и девочек.
|