Корреляционный анализ. После выбора вида уравнения регрессии и нахождения его параметров выполняют второй этап КРА – корреляционный анализ
После выбора вида уравнения регрессии и нахождения его параметров выполняют второй этап КРА – корреляционный анализ, в рамках которого дают оценку тесноты и значимости связи. В понятие «теснота связи» вкладывается оценка влияния факторного признака на результативный и установление адекватности теоретической зависимости между признаками по фактическим данным. Тесноту связи между признаками оценивают по средствам таких характеристик: коэффициент детерминации; коэффициент корреляции (корреляционное отношение) и др. Коэффициент детерминации показывает, какая доля общей вариации результата, принятой за 1, формируется под влиянием данного фактора, а какая - за счет воздействия прочих причин. Он используется как при линейной, так и при нелинейной связи между признаками, и в случае парной регрессии рассчитывается по формуле: (9.6) Коэффициент детерминации принимает значения от 0 до 1. Понятно, что чем ближе коэффициент к 1, тем теснее выявленная зависимость и тем большую роль играет данный фактор в формировании изменений результата. При R2=0 отсутствует линейная связь между признаками. Коэффициент корреляции (корреляционное отношение) показывает, насколько значимым является влияние признака х на Y. Коэффициент корреляции рассчитывается по формуле: . Он находится в диапазоне ; чем более близок R к единице, тем теснее корреляционная связь между признаками. В случае линейной связи между Y и х величина линейного коэффициента корреляции определяется по формулам: ; (9.7) . (9.8) Можно использовать и другие формулы, но результат должен быть одинаковым для всех вариантов расчета. Коэффициент корреляции принимает значения в интервале от -1 до + 1. Принято считать, что если | r |< 0,30, то связь слабая; при | r |= (0,3÷0,7) – средняя; при |r |> 0,70 – сильная, или тесная. Когда | r |= 1 – связь функциональная. Если же r принимает значение около 0, то это дает основание говорить об отсутствии линейной связи между Y и х. Когда r >0, то связь между признаками прямая, при r <0 – обратная. После установления тесноты связи дают оценку значимости связи между признаками. Под термином «значимость связи» понимают оценку отклонения выборочных переменных от своих значений в генеральной совокупности посредством статистических критериев. Оценку значимости связи осуществляют с использованием F-критерия Фишера и t-критерия Стьюдента. Для парной регрессии (линейной и нелинейной) F-критерий Фишера рассчитывается по формуле: , (9.9) где - число степеней свободы числителя и знаменателя зависимости. Теоретическое значение F сравнивают с табличным (критическим) значением Fтабл.. Если F> Fтабл, то выборочная совокупность и связь между признаками является значимой. Для парной линейной регрессии при r=R расчетные критерии t-критерия Стьюдента вычисляются по формуле: , где (n-2) – число степеней свободы. (9.10) Критерий Стьюдента, рассчитанный по данной формуле, дает оценку значимости коэффициента корреляции R и существенности связи между признаками. Рассчитанное теоретическое значение t-критерия Стьюдента сравнивают с табличным tтабл, если t>tтабл, то линейный коэффициент корреляции является значимым при характеристики генеральной совокупности.
|