Проверка остатков на гомоскедастичность
Совершенно необходимым для получения по МНК состоятельных оценок параметров регрессии является соблюдение 3 и 4 предпосылок. Т.е. дисперсия остатков должна быть гомоскедастичной: для каждого значения фактора xi остатки ei имеют одинаковую дисперсию. Если это не соблюдается, присутствует гетероскедастичность. Такие случаи видны на графиках. При малом объеме выборки, что наиболее характерно для эконометрических исследований, для оценки гетероскедастичности может использоваться метод Гольдфельда—Квандта, разработанный в 1965 г. Гольдфельд и Квандт рассмотрели однофакторную линейную модель, для которой дисперсия остатков возрастает пропорционально квадрату фактора. Чтобы оценить нарушение гомоскедастичности, они предложили параметрический тест, который включает в себя следующие шаги. 1. Упорядочение n наблюдений по мере возрастания переменной x. 2. Исключение из рассмотрения С центральных наблюдений; при этом (n — C): 2 > р, где p — число оцениваемых параметров. 3. Разделение совокупности из (n — С) наблюдений на две группы (соответственно с малыми и большими значениями фактора х) и определение по каждой из групп уравнений регрессии. 4. Определение остаточной суммы квадратов для первой (S1) и второй (S2) групп и нахождение их отношения: R = S1: S2. При выполнении нулевой гипотезы о гомоскедастичности отношение R будет удовлетворять F-критерию с (n— С— 2р): 2 степенями свободы для каждой остаточной суммы квадратов. Чем больше величина R превышает табличное значение F-критерия, тем более нарушена предпосылка о равенстве дисперсий остаточных величин. Пример. Рассмотрим табл. 3.7. В соответствии с уравнением у^ = -4,565 + 1,178-х (г = 0,9828, F = 510,7) найдены теоретические значения y^ и отклонения от них фактических значений у, т. е. е,. Итак остаточные величины е, обнаруживают тенденцию к росту по мере увеличения х и у (рис. 3.11). Этот вывод подтверждается и по критерию Гольдфельда—Квандта. Для его применения необходимо определить сначала число исключаемых центральных наблюдений С. Из экспериментальных расчетов, проведенных авторами метода для случая одного фактора, рекомендовано при п = 30 принимать С = 8, а при п == 60— соответственно С == 16. В рассматриваемом примере при п = 20 было отобрано С == 4. Тогда в каждой группе будет по 8 наблюдений [(20 — 4): 2]. Результаты расчетов представлены в табл.3.8 файла Гетероскедастичность пример.DOC.
|