Тест на гетероскедастичностьКлассическая модель с постоянными дисперсиями ошибок называется гомоскедастичной (3-е условие Гаусса – Маркова). Гетеро-скедастичной называется модель с некоррелированными, но имеющими непостоянную дисперсию ошибками. Для проверки модели на гетероскедастичность существует ряд тестов. Рассмотрим один из них. Тест Голдфельда – Куандта: Данный тест применяется в том случае, когда есть предположение о прямой зависимости дисперсии ошибки от величины некоторой независимой переменной (регрессора). · Упорядочить данные по убыванию той независимой переменной, относительно которой есть подозрение на гетероскедастичность. · Исключить d средних наблюдений (d=1/4 от общего количества наблюдений). · Провести две независимые регрессии первых n/2–d/2 и последних n/2–d/2 наблюдений и построить соответствующие остатки e1 и e2. · Составить статистику F=e’1e1/e’2e2, где . Если верна гипотеза Н0: 12 = 22 = …= n2, то F имеет распределение Фишера с (n/2–d/2–k, n/2–d/2–k) степенями свободы. Большая величина этой статистики означает, что гипотезу Н0 надо отвергнуть. В случае подтверждения гетероскедастичности для поиска оценок коэффициентов регрессии применяются следующие методы: · обобщенный метод наименьших квадратов; · доступный обобщенный метод наименьших квадратов в случаях, когда ошибка пропорциональна одной из независимых переменных или дисперсии ошибок принимают только 2 различных значения; · обычный метод наименьших квадратов, если оценки ошибок представлены в форме Уайта или Невье – Веста. Указания: · Так как для проведения теста Голдфельда – Куандта необходимо провести упорядочение данных, то используем MS EXCEL для этой процедуры. Скопируйте исходные данные из табл. 1 на рабочий лист MS EXCEL. Поставьте курсор на поле H2 и выберите в меню Данные / Сортировка… В появившемся окне Сортировка диапазона укажите: Сортировать по H2, по убыванию. Нажмите OK. · Исключим d средних наблюдений (d=20/4=5). Так как число наблюдений четное, то и d должно быть четное. Пусть d=6. Удалите с рабочего листа MS EXCEL шесть средних значений. Установите в ячейках с числами четыре десятичных знака после запятой, для этого выделите числовые данные и выберите в меню Формат / Ячейки.… В появившемся окне установите Числовой формат ячеек и число десятичных знаков – 4. · Создайте ряды для построения двух независимых регрессий первых n/2-d/2 и последних n/2-d/2 наблюдений. Пусть это будут ряды G1, V1, V2 и G2, S1, S2 соответственно. Скопируйте данные из рабочего листа MS EXCEL в группу Heterosked. · Оцените регрессию G1=0+1V1+2V2+ методом наименьших квадратов, получим G1=C(1)+C(2)*V1+C(3)*V2.
· Создайте ряд для расчета остатков первой регрессии. Пусть это будет ряд E1. В строке формул введите E1=G1-C(1)-C(2)*V1-C(3)*V2, где С(1), С(2), С(3) – полученные оценки коэффициентов. · Повторите п.4 и п.5 для регрессии G2=0+1S1+2S2+. Ряд остатков назовите E2. · Создайте ряд для расчета F-статистики. Пусть это будет ряд F. В строке формул введите Fрасчет=суммкв(E1^2)/суммкв(E2^2). · Создайте ряд для расчета критического значения F-статистики. Пусть это будет ряд F1. В строке формул введите Fстат=Fраспобр(0,05;10-3-2;10-3-2). (n/2–d/2–k, n/2–d/2–k) N = 20, d=6, к=2 9.Сравните Fрасч и Fстат. Если Fрасчет<Fстат, то гипотеза о гетероскедастичности подтверждается, если Fрасч>Fстат, то отвергается. Сделайте соответствующие выводы.
Данные
В качестве задания можно предложить проверить наличие гетероскедастичности при предположении, что Н1 ее вызывает. То есть проделать аналогичную работу только для Н1.
|