Метод взвешенных наименьших квадратов
На первом этапе данного метода оценивается линейная регрессионная модель с помощью обычного МНК. Предполагается, что остатки еi независимы между собой, но имеют разные дисперсии. Поскольку теоретические отклонения нельзя рассчитать, их обычно заменяют фактическими отклонениями зависимой переменной от линии регрессии ε i. Предполагается, что ковариационная матрица вектора ошибок ε диагональна, Если величины σ i2 известны, то делением исходного регрессионного уравнения на σ i, получаем (выписав каждое уравнение): где ui = ε i / σ i, причем V(ui) = 1, Соv(ui, us) = 0 при i ≠ s. Применяя к полученному уравнению стандартный метод наименьших квадратов, оценку получаем минимизацией по b = (b1,..., bk) суммы: Содержательный смысл этого преобразования заключается в следующем. Используя обычный метод наименьших квадратов, мы минимизируем сумму квадратов отклонений, в которую, говоря не строго, разные слагаемые вносят разный статистический вклад из-за различных дисперсий, что в конечном итоге и приводит к неэффективности МНК-оценки. «Взвешивая» каждое наблюдение с помощью коэффициента 1 / σ i, мы устраняем такую неоднородность. Применение метода взвешенных наименьших квадратов приводит к уменьшению дисперсий оценок по сравнению с обычным методом наименьших квадратов. Таким образом, для учета гетероскедастичности в случае пропорциональности дисперсии одному или нескольким регрессорам можно использовать двухшаговую процедуру оценки. Такая двухшаговая процедура дает асимптотически несмещенные оценки стандартных ошибок коэффициентов регрессии. Предполагается, что дисперсия ошибки есть линейная функция от нескольких регрессоров. Допустим, например: σ i2 = a 0 + b1x1 + b2x2. На первом шаге процедуры оценивается регрессионное уравнение модели: у = а 0 + Σ biхi + ε. Устанавливаются остатки еi, которые подставляются в первое уравнение вместо σ i. По полученному уравнению находится состоятельная оценка вектора дисперсий σ i 2. На втором шаге полученные оценки σ i 2 используются в качестве весовых коэффициентов для взвешенного метода наименьших квадратов (i -е уравнение делится на σ i 2). Препятствием для этой процедуры является то, что на практике, как правило, неизвестны фактические значения σ i. Однако процедура будет применимой, если мы сможем подобрать некоторую величину, пропорциональную, по нашему мнению, σ в каждом наблюдении, и разделим на нее обе части уравнения. Например, можно предположить, что σ приблизительно пропорциональна х, как в критерии Голдфелда-Квандта. Если после этого мы разделим каждое наблюдение на соответствующее ему значение х, то исходное уравнение примет вид: и при этом, возможно, новый случайный член u / х будет иметь постоянную дисперсию. Затем необходимо оценить регрессионную зависимость у / х от 1/ х, включив в уравнение постоянный член. Коэффициент при 1/ х будет эффективной оценкой а, постоянный член - эффективной оценкой b. В предыдущем примере зависимой переменной будет доля расходов на образование в ВНП, а объясняющей переменной - обратная к ВНП величина. На рис. 29 приведены результаты расчетов для этого случая. Рис. 29. Коррекция на гетероскедастичность при ошибке пропорциональной независимой переменной
Как видно из рис. 2, RSS1 = 0, 0044 больше, чем RSS2 = 0, 0032; это показывает, что пересчет более чем компенсировал гетероскедастичность. Тестовая статистика в этом случае RSS1 / RSS2 = 1, 376 невысокая и указывает на статистическую незначимость гетероскедастичности. Иногда в нашем распоряжении может оказаться несколько переменных, каждую из которых можно использовать для масштабирования уравнения. В рассмотренном примере альтернативной переменной может быть численность населения страны (Н). Разделив обе части исходного уравнения на эту величину, получаем: и надеемся на то, что случайный член u / Н, будет иметь постоянную дисперсию для всех наблюдений. Таким образом, теперь оценивается регрессионная зависимость государственных расходов на образование на душу населения от ВНП на душу населения и обратной величины от численности населения, причем на этот раз без постоянного члена. Статистика численности населения приведена на рис. 30. Рис. 30. Данные по численности населения (Н) Данные для новой регрессии необходимо упорядочить по переменной ВНП / Н. Сортировку можно произвести с помощью функции Данные, Сортировка. Диалоговое окно этой опции приведено на рис. 31. К отсортированным данным применена указанная схема расчетов, а результаты представлены на рис. 32. В данном случае RSS2 / RSS1 равняется 4, 596, что указывает на то, что нулевая гипотеза о гомоскедастичности должна быть отклонена при уровне значимости в 5% (критическое значение F составляет 2, 978).
Рис. 31. Диалоговое окно Сортировка диапазона
Рис. 32. Коррекция на гетероскедастичность с использованием новой переменной
Отчет по работе должен содержать 1.Название и цель работы. 2.Основные теоретические и методические положения. 3.Исходные данные для расчета. 4.Результаты расчета. 5.Выводы по результатам моделирования.
|