Множественная корреляция.
Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции R и его квадрата R2. Показатель множественной корреляции оценивает тесноту совместного влияния факторов на результат. Показатель множественной корреляции R находят как индекс множественной корреляции:
- общая дисперсия результативного признака - остаточная дисперсия R принадлежит отрезку [0,1]. Чем ближе R к 1, тем теснее связь результирующего признака со всем набором исходных факторов. При правильном включении в модель факторов величина индекса множественной корреляции будет существенно отличаться от индекса корреляции парной зависимости. Сравнивая индексы множественной парной корреляции, делают вывод о целесообразности включения в уравнение того или иного фактора. При линейной зависимости признаков формула индекса корреляции выглядит так: , - стандартизованные коэффициенты регрессии - парные коэффициенты корреляции результата с каждым фактором Эта формула называется линейный коэффициент множественной корреляции (совокупный коэффициент корреляции). Его можно определить через матрицу парных коэффициентов корреляции: - определитель матрицы парных коэффициентов корреляции - определитель матрицы межфакторной корреляции Пример: для линейной множественной регрессии имеем: получается из определителя вычёркиванием первого столбца и первой строки. Индекс множественной корреляции равен совокупному коэффициенту не только при множественной зависимости, но и для криволинейной зависимости, нелинейной по переменным и не равен совокупному коэффициенту корреляции для криволинейной зависимости, нелинейной по оцениваемым параметрам. Индекс детерминации – R2 – для нелинейных по оцениваемым параметрам функций принято называть квази- R2. Для его определения по формулам используются преобразования: логарифмирование и потенцирование, то есть сначала необходимо найти теоретические значения (ln y - теоретич), а затем транспонировать их через антилогарифмы (). И далее находят квази- R2, пользуясь формулой Величина квази- R2 не совпадает с совокупным коэффициентом корреляции. Чтобы не допустить возможного преувеличения тесноты связи, используют скорректированный индекс множественной корреляции. Он содержит поправку на число степеней свободы и вычисляется по формуле: ; m – число параметров при переменной х. n – число наблюдений. Так как , то скорректированный индекс равен: Чем больше m, тем больше различие между и . Низкое значение коэффициента множественной корреляции означает, что в модель не внесены существенные факторы и модель не отражает реальное соотношение между переменными включёнными в модель, следовательно требуется улучшение качества модели.
|