Корреляционный анализ
Различают: · парную корреляцию – это зависимость между результативным и факторным признаком; · частную корреляцию – это зависимость между результативным и одним факторным признаком при фиксированном значении других факторных признаков; · множественную – многофакторное влияние в статической модели . Теснота связи при линейной зависимости измеряется с помощью линейного коэффициента корреляции, который рассчитывается по одной из формул: (5.16) . (5.17) Оценка линейного коэффициента корреляции
Значимость линейного коэффициента корреляции проверяется на основе t- критерия Стьюдента. Для этого определяется фактическое значение критерия : , (5.18) Вычисленное по формуле (6.18) значение сравнивается с критическим , который получают по таблице Стьюдента с учетом принятого уровня значимости и числа степеней свободы ν. Коэффициент корреляции считается статистически значимым, если t расч превышает : t расч > . Универсальным показателем тесноты связи является теоретическое корреляционное отношение: , (5.19) где – общая дисперсия эмпирических значений y, характеризует вариацию результативного признака за счет всех факторов, включая х; – факторная дисперсия теоретических значений результативного признака, отражает влияние фактора х на вариацию у; – остаточная дисперсия эмпирических значений результативного признака, отражает влияние на вариацию у всех остальных факторов кроме х. По правилу сложения дисперсий: , т.е. . (5.19) Оценка связи на основе теоретического корреляционного отношения (шкала Чеддока)
Для линейной зависимости теоретическое корреляционное отношение тождественно линейному коэффициенту корреляции, т.е. η = | r|. Множественный коэффициент корреляции в случае зависимости результативного признака от двух факторов вычисляется по формуле: ,(5.20) где – парные коэффициенты корреляции между признаками. Множественный коэффициент корреляции изменяется в пределах от 0 до 1 и по определению положителен: . Значимость коэффициента множественной детерминации, а соответственно и адекватность всей модели и правильность выбора формы связи можно проверить с помощью критерия Фишера: , (5.21) где R 2 – коэффициент множественной детерминации (R 2 ); k – число факторных признаков, включенных в уравнение регрессии.
Связь считается существенной, если F расч > F табл – табличного значения F- критерия для заданного уровня значимости α и числе степеней свободы ν1 = k,ν2 = n – k – 1. Частные коэффициенты корреляции характеризуют степень тесноты связи результативного признака и фактора, при элиминировании его взаимосвязи с остальными факторами, включенными в анализ. Расчет частных коэффициентов корреляции в случае двухфакторной регрессии (в первом случае исключено влияние факторного признака х 2, во втором – х 1): ; , (5.22) где r – парные коэффициенты корреляции между указанными в индексе переменными. Для оценки сравнительной силы влияния факторов, по каждому фактору рассчитывают частные коэффициенты эластичности: , (5.23) где – среднее значение соответствующего факторного признака; – среднее значение результативного признака; – коэффициент регрессии при i -м факторном признаке. Данный коэффициент показывает, на сколько процентов следует ожидать изменения результативного показателя при изменении фактора на 1% и неизменном значении других факторов. Частный коэффициент детерминации показывает, на сколько процентов вариация результативного признака объясняется вариацией i -го признака, входящего в множественное уравнение регрессии, рассчитывается по формуле: , (5.24) где – парный коэффициент корреляции между результативным и i -м факторным признаком; – соответствующий стандартизованный коэффициент уравнения множественной регрессии: . (5.25) Пример 1. По данным о стоимости основных производственных фондов (СОПФ) и объеме валовой продукции (ВП) определить линейное уравнение связи.
; . Уравнение регрессии имеет вид: . Следовательно, с увеличением стоимости основных фондов на 1 млн.руб. объем валовой продукции увеличивается в среднем на 5,6 млн. руб. Проверим значимость полученных коэффициентов регрессии. Рассчитаем и : для параметра а 0: для параметра а 1: . По таблице Стьюдента с учетом уровня значимости =5% и числа степеней свободы ν =10-1-1=8 получаем =2,306. Фактические значения и превышают табличное критическое значение . Это позволяет признать вычисленные коэффициенты корреляции типичными. Пример2. По данным предыдущего примера оценить тесноту связи между признаками, оценить значимость найденного коэффициента корреляции. , или . Значение коэффициента корреляции свидетельствует о сильной прямой связи между рассматриваемыми признаками. Значение t расч превышает найденное по таблице значение =2.306, что позволяет сделать вывод о значимости рассчитанного коэффициента корреляции.
Пример3. Имеются некоторые данные о среднегодовой стоимости ОПФ (СОПФ), уровне затрат на реализацию продукции (ЗРП) и стоимости реализованной продукции (РП). Считая зависимость между этими показателями линейной, определить уравнение связи; вычислить множественный и частные коэффициенты корреляции, оценить значимость модели.
Решение. Составим систему нормальных уравнений МНК: Выразим из 1-го уравнения системы a 0 = 29,4 – 6,6· a 1 – 9· a 2. Подставив во 2-е уравнение это выражение, получим: . Далее подставляем в 3-е уравнение вместо a 0 и a 1 полученные выражения и решаем его относительно a 2 с точностью не менее 3-х знаков после запятой. Итак: a 0 = 12,508; a 1 = 2,672; a 2 = – 0,082; = 12,508 + 2,672· х 1 – 0,082· х 2. = = 0,884; = = 0,777; = = 0,893; =0,893. Проверим значимость r (α = 0,01 и ν = 7): = 5,00; = 3,27. =5,00 > t табл=3,50 – коэффициент корреляции x 1 значим; =3,27 < t табл=3,50 – коэффициент корреляции x 2 не значим. Произведенные расчеты подтверждают условие включения факторных признаков в регрессионную модель – между результативным и факторными признаками существует тесная связь ( = 0,884; = 0,777), однако между факторными признаками достаточно существенная связь ( = 0,893). Включение в модель фактора x 2 незначительно увеличивает коэффициент корреляции ( = 0,884; =0,893), поэтому включение в модель фактора x 2 нецелесообразно. Вычислим стандартизованные коэффициенты уравнения множественной регрессии:
Отсюда вычислим частные коэффициенты детерминации:
|