Исследование взаимосвязей количественных показателей
Для оценки тесноты связей количественных признаков (измеряемых числами) используются различные показатели. Основными из них являются следующие. 1. Линейный коэффициент корреляции выражает степень тесноты линейной связи между двумя случайными величинами и (нормированный корреляционный момент). По выборочным данным линейный коэффициент корреляции вычисляется по формуле: .
где n – объем выборки; – выборочные средние. Свойства коэффициента корреляции: 1) . 2) . 3) Если , то и точно связаны линейной функциональной зависимостью. 4) Если , то между и нет линейной корреляционной зависимости, но равенство не исключает существования какого–либо другого вида корреляционной зависимости – криволинейной (например, параболической, показательной и др.). 5) Чем больше , тем теснее связь между и . При этом связь сильная, если ; связь умеренная, если ; связь слабая, если ; связь практически отсутствует при . 6) Если , то имеем прямую корреляционную связь; если , то имеем обратную корреляцию (если с увеличением значения возрастает и значение , то между и существует прямая связь; изменение значений признаков в противоположных направлениях свидетельствует об обратной связи между ними). Коэффициент корреляции не изменяется при линейных преобразованиях переменных. Если имеем уравнения регрессии в виде, ; , то коэффициент корреляции выражается через коэффициенты регрессии по соотношению: . Здесь – среднее значений величины при значении ; – среднее значений величины при значении . Проверка гипотезы о значимости выборочного парного линейного коэффициента корреляции осуществляется с использованием Т –критерия Стъюдента 2. Эмпирическое корреляционное отношение применяется для оценки тесноты нелинейной связи между случайными величинами и , представленными в виде сгруппированных статистических данных. Обычно исходные данные могут быть собраны в следующую таблицу значений системы двух случайных величин :
Здесь – частоты, показывающие сколько раз повторяются парные значения . При этом . По данной таблице можно вычислить следующие параметры: 1) средние значения величин и : , 2) дисперсии величин и :
3) средние значения при фиксированном , то есть средние по строкам (межгрупповые средние): ; 4) средние значения X при фиксированных : ; 5) межгрупповую дисперсию: ; 6) остаточную дисперсию: ; 7) общую дисперсию: . Здесь – такое число раз встречалось значение ; – такое число раз встречалось значение . Тогда статистическое корреляционное отношение вычисляется по формуле . Оно показывает какую часть общей изменчивости составляет межгрупповая изменчивость. Свойства эмпирического корреляционного отношения: 1) ; 2) если , то между и существует функциональная связь; если , то и являются независимыми величинами; 3) ; 4) если , то связь между и является линейной. Степень расхождения между и может служить основанием для принятия гипотезы о линейности связи между переменными и . При этом используется критерий ; , где – число наблюдений; – число сгруппированных интервалов для показателя . На практике часто при проверке возможности использования линейной функции в качестве формы уравнения регрессии определяют разность . Если эта разность менее 0.1, то считается возможным применять линейные уравнения для описания корреляционной зависимости. Следует отметить, что вычисление корреляционного отношения возможно при наличии достаточно большого числа данных, которые представлены либо в форме корреляционной таблицы, либо первичными данными. Вычисление корреляционного отношения при большом числе групп и малом числе наблюдений в каждой группе лишается смысла. Проверка значимости эмпирического корреляционного отношения осуществляется по критерию , где – число опытов, – число интервалов различных значений . 3. Теоретическое корреляционное отношение (индекс корреляции) (или просто ). Формулы расчета аналогичны формулам для за исключением того, что используются не групповые средние , а значения функции регрессии , то есть значения величины , вычисленные по некоторой кривой (функции) связи и при значении Фактически, оценивает степень близости кривой регрессии к имеющимся данным, то есть степень удачности выбора уравнения регрессии. Для и имеет место неравенство . Оно справедливо потому, что кривая регрессии не всегда проходит через групповые средние. Проверка значимости индекса корреляции (теоретического корреляционного отношения ) осуществляется по критерию 4. Коэффициент множественной корреляции характеризует тесноту линейной связи между одним зависимым и несколькими независимыми показателями. Если имеются показателей , то выборочный коэффициент множественной корреляции показателя характеризует тесноту линейной связи между этим зависимым и остальными независимыми показателями и вычисляется по формуле . Здесь определитель корреляционной матрицы ; алгебраическое дополнение элемента матрицы R. В случае зависимости результирующей величины от двух переменных коэффициент множественной корреляции вычисляется по формуле . 5. Частные (парциальные) коэффициенты корреляции используются для оценки тесноты связи между двумя показателями из нескольких при элиминированном (исключенном) влиянии других показателей. Если имеются показателей , то частный коэффициент корреляции показателей вычисляется по формуле . Пусть мы имеем три показателя , . Частный коэффициент корреляции между и при исключении определяется через парные коэффициенты корреляции соотношением: . Абсолютные величины частных (парциальных) коэффициентов корреляции не могут быть больше величины коэффициента множественной корреляции. 6. Коэффициент детерминации есть квадрат коэффициента корреляции (для линейной связи), или квадрат корреляционного отношения (для нелинейной зависимости) величин Х и Y, или квадрат коэффициента множественной корреляции: , , .
|