Оценивание значимости уравнения регрессии
Для числового определения качества (значимости) оценок уравнения регрессии обычно используют критерии, вычисляемые через остаточную, регрессионную и полную суммы квадратов. Остаточная сумма Qe (см. формулу (3)) характеризует отклонение наблюдений зависимой переменной от линии регрессии. Чем меньше Qe, темлучше соотношение (1) описывает реально существующую зависимость Y (X). Регрессионная сумма QR вычисляется по формуле:
Величина QR показывает, насколько оценки Полная сумма квадратов Q определяется соотношением:
Величина полной суммы зависит только от наблюдений отклика и не зависит от оценок параметров уравнения линейной регрессии Q= QR + Qe. (11) Из равенства (11) следует, что если, например, изменение оценок Критерии качества уравнения регрессии обычно определяются через отношения рассмотренных выше сумм квадратов (тогда величина критерия не зависит от единиц измерения отклика). Например, используется коэффициент детерминации R 2:
Из (11) следует, что 0≤ R 2 ≤ 1. Чем ближе R 2 к 1, тем значимее уравнение регрессии. Если R 2=1, то уравнение регрессии идеально соответствует наблюдениям (все точки наблюдений лежат на линии регрессии). Если R 2=0, то R 2= r 2, (12а) где r – выборочный коэффициент корреляции X и Y. Для оценивания значимости оценок уравнения парной регрессии также используется статистика F Фишера:
Учитывая, что большое значение QR и малое значение Qe указывают на высокое качество уравнения регрессии, можно сделать вывод: чем больше F, тем значимее уравнение. Известно (см., например, [5]), что в условиях классической нормальной линейной регрессионной модели статистика (13) имеет распределение Фишера (F -распределение) со степенями свободы k 1=1 и k 2= n -2. Используя ее, можно проверить гипотезу о незначимости уравнения регрессии. Обозначим через f (a; 1; n- 2) квантиль F -распределения уровня 1-a(в эконометрике обычно a=0, 05). Если уравнение незначимо, то большие значения F маловероятны. Поэтому гипотезу о незначимости уравнения регрессии следует отклонять, если F> f (a; 1; n- 2). (14) Вероятность ошибки первого рода (отклонить гипотезу при условии, что она верна) при использовании правила (14) равна a. Упрощенно критерий Фишера можно сформулировать следующим образом: если неравенство (14) справедливо, то уравнение регрессии считается значимым, иначе – незначимым.
|