Определение мультиколлинеарности
Точных количественных критериев для определения наличия (отсутствия) мультиколлинеарности не существует. Тем не менее, существуют некоторые рекомендации по выявлению мультиколлинеарности. 1. В первую очередь анализируют матрицу парных коэффициентов корреляции (50) точнее ту ее часть, которая относится к объясняющим переменным: . (51) Здесь - парный коэффициент корреляции между переменными ; - парный коэффициент корреляции между . Считается, что наличие коэффициентов превышающих по абсолютной величине 0,75-0,8, свидетельствует о наличии мультиколлинеарности. 2. Если определитель матрицы близок к нулю (например, одного порядка с накапливающимися ошибками вычислений), то это свидетельствует о наличии мультиколлинеарности. 3. Коэффициент детерминации достаточно высок, но некоторые из коэффициентов регрессии статистически незначимы, т.е. они имеют низкие -статистики. 4. Высокие частные коэффициенты корреляции свидетельствуют о наличии мультиколлинеарности. При изучении многомерных связей необходимо измерять действительную силу линейной связи между двумя переменными, очищенную от влияния на рассматриваемую пару переменных других факторов. Частные коэффициенты корреляции определяют силу линейной зависимости между двумя переменными без учета влияния на них других переменных. Выборочный частный коэффициент корреляции между переменными очищенный от влияния остальных объясняющих переменных, символически обозначается . Приведем формулу расчета данного коэффициента. Пусть - матрица обратная к матрице : (52) - алгебраическое дополнение к . Тогда . (53) При проверке статистически значимого отличия от нуля выборочного частного коэффициента корреляции и при построении для него доверительных интервалов следует пользоваться рекомендациями для парного коэффициента корреляции, но во всех формулах объем выборки полагать равным , где - остальные объясняющие переменные, т.е. переменные влияние которых исключается при расчете частных коэффициентов корреляции. 5. Более внимательное изучение вопроса мультиколлинеарности производится следующим образом. Строятся уравнения регрессии каждой из объясняющих переменных на оставшиеся объясняющие переменные . Вычисляются коэффициенты детерминации и рассчитывается их статистическая значимость на основе F -статистики: . Здесь — число наблюдений, — число объясняющих переменных в первоначальном уравнении регрессии. Статистика имеет распределение Фишера с степенями свободы. Если коэффициент статистически незначим, то не является линейной комбинацией других переменных и ее можно оставить в уравнении регрессии. В противном случае есть основания считать, что существенно зависит от других объясняющих переменных и имеет место мультиколлинеарность. 6. О присутствии мультиколлинеарности сигнализируют некоторые внешние признаки модели: · некоторые из оценок коэффициентов имеют неправильные с точки зрения экономической теории знаки или неоправданно большие значения; · небольшое изменение исходных данных (добавление или изъятие небольшой порции наблюдений) приводит к существенному изменению оценок коэффициентов; · большинство или даже все оценки коэффициентов регрессии оказываются статистически незначимо отличающимися от нуля (при проверке с помощью -критерия), в то время как многие из них в действительности имеют отличные от нуля значения, а модель в целом является значимой при проверке с помощью -статистики.
|