Студопедія
рос | укр

Головна сторінка Випадкова сторінка


КАТЕГОРІЇ:

АвтомобіліБіологіяБудівництвоВідпочинок і туризмГеографіяДім і садЕкологіяЕкономікаЕлектронікаІноземні мовиІнформатикаІншеІсторіяКультураЛітератураМатематикаМедицинаМеталлургіяМеханікаОсвітаОхорона праціПедагогікаПолітикаПравоПсихологіяРелігіяСоціологіяСпортФізикаФілософіяФінансиХімія






Героїчна боротьба іспанських республіканців тривала 32 місяці.


Дата добавления: 2015-08-31; просмотров: 648



Одним из условий регрессионной модели является предположение о линейной независимости объясняющих переменных, т. е., решение задачи возможно лишь тогда, когда столбцы матрицы ис­ходных данных линейно независимы. Для экономических показате­лей это условие выполняется не всегда.

Под мультиколлинеарностьюпонимается высокая взаимнаякоррелированность объясняющих переменных, которая приводит к линейной зависимости нормальных уравнений.

Мультиколлинеарность может возникать в силу разных причин. На­пример, несколько независимых переменных могут иметь одинаковый вре­менной тренд, относительно которого они совершают малые колебания.

Существует несколько способов для определения наличия или отсутствия мультиколлинеарности.

Один из подходов заключается в анализе матрицы коэффициентов парной корреляции. Считают явление мультиколлинеарности в исходных данных установленным, если коэффициент парной корреляции между двумя переменными больше 0,8.

Другой подход состоит в исследовании матрицы Х'Х.Если определитель матрицы Х'Хблизок к нулю, то это свидетельствует о наличии мультиколлинеарности.

Для устранения или уменьшения мультиколлинеарности ис­пользуется ряд методов.

Наиболее распространенные в таких случаях следующие приемы: исключение одного из двух силь­но связанных факторов, переход от первоначальных факторов к их главным компонентам, число которых быть может мень­ше, затем возвращение к первоначальным факторам.

Самый простой из них (но не всегда самый эффективный) состоит в том, что из двух объясняющих пере­менных, имеющих высокий коэффициент корреляции (больше 0,8), одну переменную исключают из рассмотрения. При этом какую пе­ременную оставить, а какую удалить из анализа, решают в первую очередь на основании экономических соображений. Если с эконо­мической точки зрения ни одной из переменных нельзя отдать предпочтение, то оставляют ту из двух переменных, которая имеет больший коэффициент корреляции с зависимой переменной.

Более сложным приемом в таких случаях является переход от первоначальных факторов к их главным компонентам, число которых быть может мень­ше, затем возвращение к первоначальным факторам

Еще одним из возможных методов устранения или уменьшения мультиколлинеарности является использование стратегии шагового отбора, реализованную в ряде алгоритмов пошаговой регрессии.

Наиболее широкое применение получили следующие схемы построения уравнения множественной регрессии: метод включения факторов и метод исключения – отсев факторов из полного его набора.

В соответствии с первой схемой признак включается в уравнение в том случае, если его включение существенно увеличивает значение множественного коэффициента корреляции, что позволяет последовательно отбирать факторы, оказывающие существенное влияние на результирующий признак даже в условиях мультиколлинеарности системы признаков, отобранных в качестве аргументов из содержательных соображений. При этом первым в уравнение включается фактор, наиболее тесно коррелирующий с Y, вторым в уравнение включается тот фактор, который в паре с первым из отобранных дает максимальное значение множественного коэффициента корреляции, и т.д. Существенно, что на каждом шаге получают новое значение множественного коэффициента (большее, чем на предыдущем шаге); тем самым определяется вклад каждого отобранного фактора в объясненную дисперсию Y.

Вторая схема пошаговой регрессии основана на последовательном исключении факторов с помощью t -критерия. Она заключается в том, что после построения уравнения регрессии и оценки значимости всех коэффициентов регрессии из модели исключают тот фактор, коэффициент при котором незначим и имеет наименьшее значение t - статистики . После этого получают новое уравнение множественной регрессии и снова производят оценку значимости всех оставшихся коэффициентов регрессии. Если среди них опять окажутся незначимые, то опять исключают фактор с наименьшим значением t -критерия. Процесс исключения факторов останавливается на том шаге, при котором все регрессионные коэффициенты значимы.

Ни одна их этих процедур не гарантирует получения оптимального набора переменных. Однако при практическом применении они позволяют получить достаточно хорошие наборы существенно влияющих факторов.

При отборе факторов также рекомендуется пользоваться следующим правилом: число включаемых факторов обычно в 6–7 раз меньше объема совокупности, по которой строится регрессия. Если это соотношение нарушено, то число степеней свободы остаточной дисперсии очень мало. Это приводит к тому, что параметры уравнения регрессии оказываются статистически незначимыми, а -критерий меньше табличного значения.

Особым случаем мультиколлинеарности при использова­нии временных выборок является наличие в составе перемен­ных линейных или нелинейных трендов. В этом случае рекомендуется сначала выделить и исключить тренды, а затем определить параметры регрессии по остаткам.

Игнорирование наличия трендов в зависимой и независи­мой переменных ведет к завышению степени влияния неза­висимых переменных на результирующий признак, что полу­чило название ложной корреляции.

Наиболее часто в практических исследованиях возникает вопрос: сколько надо наблюдений для надежного определе­ния параметров регрессии?

Выбор числа наблюдений определяется требованиями к точности и надежности оценок параметров. Из требований к точности прогноза и вытекает требование на число наблюдений. Обозначим требуемый размер половины доверительного интервала через , где — оценка дисперсий случайной составляющей. Достижение этой желаемой точности определяется как объемом выборки, так и расположением прогностических значений факторов. Чем более разнесены последние от сред­них выборочных значений, тем меньше точность прогноза .

Большим препятствием к применению регрессии является ограниченность исходной информации, при этом наряду с указанными выше затрудняющими обстоятельства­ми (мультиколлинеарность, зависимость остатков, небольшой объем выборки и т. п.) ценность информации может сни­жаться за счет ее «засоренности», т. е. проявления новых обстоятельств, которые ранее не были учтены.

Резко отклоняющиеся наблюдения могут быть результа­том либо действия большого числа сравнительно малых случайных факторов, которые в редких случаях приводят к большим отклонениям, либо это действительно случайные один или несколько выбросов, которые можно исключить как аномальные. Однако при наличии не менее трех аномальных отклонений на несколько десятков наблюдений их приписывают наличию одного или нескольких неучтенных факторов, которые проявляются только в виде аномальных на­блюдений.


[1] Термин "регрессия" (regression (лат.) – отступление, возврат к чему-либо) ввел английский статистик Ф. Гальтон. Он исследовал влияние роста родителей и более отдаленных предков на рост детей. По его модели рост ребенка определяется наполовину родителями, на четверть – дедом с бабкой, на одну восьмую прадедом и прабабкой и т.д. Другими словами, такая модель характеризует движение назад по генеалогическому дереву. Ф. Гальтон назвал это явление регрессией как противоположное движению вперед – прогрессу. В настоящее время термин "регрессия" применяется в более широком плане – для описания статистической связи между случайными величинами.

 

 

МНОЖЕСТВЕННОЕ УРАВНЕНИЕ РЕГРЕССИИ

Общий вид многофакторного уравнения регрессии имеет вид

yt=a+b1x1+b2x2+…+bkxk

где k – число факторов

a – константа

b1…bk – коэффициенты при x

x1…xk - факторы

Параметры множественного уравнения регрессии можно определить методом наименьших квадратов по формулам:

β=(X’X)-1X’Y (1)

где β – вектор, включающий в себя параметры уравнения регрессии a, b1, b2…bk

Y=(y1,y2,y3…yt)

(2)

(3)

Годовые доходности акций А, В,С, принадлежащих одной отрасли за период исследования приведены в таблице (ячейки А1:D16). Установить по результатам наблюдений зависимость доходности компании А от доходностей компаний В и С. Ячейки В18:Р18 отведены под матрицу Y, В20:D34 под матрицу Х.

Элементы матрицы X’X (ячейки В38:D40) рассчитываются по формулам

Ячейка Формула Комментарий
В38 =А16 количество наблюдений (периодов)
В39 =СУММ(C20:C34) сумма значений первого фактора
В40 =СУММ(D20:D34) сумма значений второго фактора
С38 =СУММ(C20:C34) сумма значений первого фактора
С39 =СУММКВ(C20:C34) сумма квадратов значений первого фактора
С40 =СУММПРОИЗВ(C20:C34;D20:D34) сумма произведений первого и второго факторов
D38 =СУММ(D20:D34) сумма значений второго фактора (в данном примере последнего)
D39 =СУММПРОИЗВ(C20:C34;D20:D34) сумма произведений первого и второго факторов (в данном примере последнего)
D40 =СУММКВ(D20:D34) сумма квадратов значений второго фактора (в данном примере последнего)

 

Элементы матрицы X’Y (ячейки В42:B44) рассчитываются по формулам

Ячейка Формула Комментарий
В42 =СУММ(B18:P18) сумма значений зависимой переменной y
В43 =СУММПРОИЗВ(B2:B16;C20:C34) сумма произведений зависимой переменной y на значения первого фактора х1
В44 =СУММПРОИЗВ(B2:B16;D20:D34) сумма произведений зависимой переменной y на значения второго фактора х2 (в данном примере последнего)

В ячейках G20:I22 вычисляется матрица (X’X)-1 – обратная матрица X’X: выделяются ячейки G20:I22, вводится формула =МОБР(B38:D40), нажимаются CTRL SHIFT ENTER.

В ячейках G22:G24 вычисляются параметры уравнения регрессии: выделяются ячейки G22:G24, вводится формула =МУМНОЖ(G20:I22;B42:B44), нажимаются CTRL SHIFT ENTER.

В ячейку F1 записывается уравнение регрессии.


<== предыдущая лекция | следующая лекция ==>
Quot;чорне дворіччя". | Едуард Бенеш
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | <== 19 ==> | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 |
Studopedia.info - Студопедия - 2014-2024 год . (0.319 сек.) російська версія | українська версія

Генерация страницы за: 0.319 сек.
Поможем в написании
> Курсовые, контрольные, дипломные и другие работы со скидкой до 25%
3 569 лучших специалисов, готовы оказать помощь 24/7