Оценивание значимости множественной регрессии
Как и в случае парной регрессии, для оценивания качества оценок уравнения множественной регрессии используют критерии, вычисляемые через остаточную, регрессионную и полную суммы квадратов (см. §1.5 работы №1). Коэффициент детерминации R 2 (см. формулу (12)) характеризует близость регрессионной модели к наблюдениям. Известно, что 0≤ R 2 ≤ 1. Чем ближе R 2 к 1, тем лучше уравнение регрессии соответствует наблюдениям. Если R 2=1, то все остатки равны нулю. Если R 2=0, то Известно, что коэффициент детерминации R 2 возрастает с увеличением числа факторов. С другой стороны, добавление факторов не всегда улучшает качество модели. Поэтому в модели множественной регрессии предпочтительней (вместо R 2) использовать нормированный (скорректированный, поправленный) коэффициент детерминации
При добавлении новых факторов, не оказывающих существенного влияния на отклик, Для множественной регрессии F -статистика Фишера вычисляется по следующей формуле, являющейся обобщением формулы (13) для парной регрессии:
Известно, что в условиях классической нормальной линейной регрессионной модели статистика (34) распределена по Фишеру со степенями свободы k 1= p и k 2= n - p -1. Обозначим через f (a; p; n-p- 1) квантиль F -распределения уровня 1-a. Если уравнение регрессии незначимо, то большие значения статистики F маловероятны. Поэтому гипотезу о незначимости уравнения регрессии следует отклонять, если F> f (a; p; n-p- 1). (35) Вероятность ошибки первого рода (отклонить гипотезу при условии, что она верна) при использовании правила (35) равна a.
|