Оценки точности уравнения регрессии и его параметров

⇐ Предыдущая 1 2 3 4 567 8 9 10 Следующая ⇒

Стандартная ошибка оценки по регрессии. Как было отмечено, несмещённая оценка дисперсии остатков уравнения регрессии называется остаточной дисперсией

= = .

Корень квадратный из остаточной дисперсии называется стандартной ошибкой оценки по регрессии. Обозначается она обычно S_y_,_x и вычисляется по формуле

S_y_,_x = .

Стандартная ошибка оценки по регрессии показывает, насколько в среднем мы ошибаемся, оценивая значение зависимой переменной по найденному уравнению регрессии при фиксированном значении независимой переменной.

Оценка значимости уравнения регрессии (дисперсионный анализ регрессии). Для оценки значимости уравнения регрессии устанавливают, соответствует ли выбранная модель анализируемым данным. Для этого используется дисперсионный анализ регрессии. Основная его посылка – это разложение общей суммы квадратов отклонений на составляющие. Известно, что такое разложение имеет вид

= + ,

если в уравнении регрессии присутствует свободный член. В противном случае в правую часть надо добавить слагаемое 2 . Но как было показано, второй член этого слагаемого ( равен нулю, если в уравнении регрессии присутствует свободный член.

Второе слагаемое в правой части этого разложения уже встречалось и обсуждалось – это часть общей суммы квадратов отклонений, объясняемая действием случайных и неучтенных факторов. Первое слагаемое этого разложения – это часть общей суммы квадратов отклонений, объясняемая регрессионной зависимостью. Следовательно, если регрессионная зависимость между у и х отсутствует, то общая сумма квадратов отклонений объясняется действием только случайных факторов или ошибок, т.е. = . В случае функциональной зависимости между у и х действие случайных факторов и ошибок отсутствует и тогда = .

Будучи отнесёнными к соответствующему числу степеней свободы эти суммы называются средними квадратами отклонений и служат оценками дисперсии в разных предположениях. Одна из них рассчитывается в предположении отсутствия регрессионной зависимости, а другая – без такого предположения. Следовательно, если регрессионная зависимость отсутствует, то эти оценки должны быть близкими. Сравниваются они на основе F-отношения:

F = MSR/ MSE. Таким образом, F-статистика проверяет гипотезу о незначимости уравнения регрессии (H₀: = 0), т. е. о том, что зависимости между анализируемыми переменными нет. Если верна нулевая гипотеза, то F-статистика следует распределению Фишера и, зная уровень значимости и число степеней свободы числителя и знаменателя, можно определить критические значения этого распределения.

Расчётное значение F-статистики сравнивается с критическим значением (в нашем случае число степеней свободы числителя равно 1 (число регрессоров), а число степеней свободы знаменателя равно (n – 2)) с уровнем значимости . Если F < F, то гипотеза о незначимости уравнения регрессии не отклоняется, т. е. не отклоняется гипотеза о том, что = 0, и уравнение регрессии признаётся незначимым. В этом случае надо либо изменить вид зависимости, либо пересмотреть набор исходных данных.

При компьютерных расчётах в некоторых статистических пакетах программ оценка значимости уравнения регрессии осуществляется на основе дисперсионного анализа в таблицах вида:

Таблица 1.1 – Дисперсионный анализ регрессии

Источник вариации	Суммы квадратов	Степени свободы	Средние квадраты	F- отношение	p-value
Модель	SSR		MSR	MSR/ MSE	Уровень
Ошибки	SSE	n – 2	MSE		знач-ти
Общая	SST	n – 1

Здесь p-value – это вероятность выполнения неравенства F < F или расчётный уровень значимости. Если эта вероятность мала (меньше ), то нулевая гипотеза отклоняется.

В некоторых статистических пакетах программ значение F-статистики и вероятность для неё приводятся без показа процедуры их вычисления.

Если в уравнении регрессии нет константы, то в некоторых статистических пакетах F-статистика просто не вычисляется.

Интервальные оценки параметров уравнения регрессии. При использовании параметров уравнения регрессии в анализе и прогнозировании для них необходимо уметь строить интервальные оценки.

Доверительный интервал для коэффициента регрессии определяется из соотношения (b t S_b), где S_b – стандартная ошибка оценки коэффициента регрессии. Известно, что

S_b= .

Доверительный интервал для свободного члена уравнения регрессии определяется из соотношения (а t S_а), где S_а – стандартная ошибка оценки свободного члена уравнения регрессии. Известно, что

S_а= .

Интервальная оценка расчетных значений определяется доверительным интервалом ( ± ), где стандартная ошибка оценки , определяемая из соотношения

= .

Интервальная оценка прогнозных значений определяется из подобного же соотношения, только в стандартную ошибку добавляется ещё стандартное отклонение , характеризующее рассеяние прогнозных значений зависимой переменной вокруг линии регрессии.

Проверка значимости параметров уравнения регрессии. Кроме проверки значимости уравнения регрессии в целом необходимо уметь проверять значимость каждого параметра уравнения регрессии в отдельности. Осуществляется это на основе t-статистик. Значения этих статистик рассчитываются из соотношений: t_a = a /S_a, t_b = b /S_b. Для этих статистик определяются критические значения или расчётные уровни значимости, на основе которых и принимаются решения о значимости или незначимости соответствующих параметров.

В случае парной линейной регрессии проверка значимости уравнения регрессии в целом и проверка значимости коэффициента уравнения регрессии по сути дела одно и то же, т. к. в том и другом случае проверяется одна и та же гипотеза о том, что коэффициент уравнения регрессии равен нулю. Кроме того, можно показать, что для парной линейной регрессии F = .

Уравнение простой регрессии в компьютерных расчётах обычно выдаётся в виде следующей таблицы.

Таблица 1.2 – Уравнение простой регрессии

Параметр	Оценка	Ст. ошибка	t-статистика	р-value
Пересечение	а	S_a	t_a= a /S_a
Наклон	b	S_b	t_b= b /S_b

Пересечение и наклон – это другое название свободного члена уравнения регрессии и его коэффициента, основанное на геометрическом смысле этих величин, если рассматривать уравнение регрессии как уравнение прямой линии или линии регрессии. Смысл остальных столбцов понятен из их названия.

Кроме уже рассмотренных показателей точности уравнения регрессии обычно ещё используют коэффициент детерминации.

Коэффициент детерминации (R- квадрат) является удобной оценкой качества подгонки данных моделью. Выясним его смысл. В общем случае коэффициент детерминации определяется из соотношения

R² = ,

т. е. это доля выборочной дисперсии переменной y, которая объясняется моделью. Следует иметь в виду, что также соответствует выборочному среднему (см. соотношение (1.2)). Следовательно, коэффициент детерминации характеризует долю вариации зависимой переменной, обусловленную вариацией независимой переменной. Обычно он выражается в процентах, поэтому, например, если R² = 75%, то это значит, что 75% вариации зависимой переменной у объясняется вариацией независимой переменной х, а остальные 25% изменения у объясняются либо ошибками наблюдений, либо действием неучтенных факторов, либо тем и другим.

Известно, что если модель содержит свободный член, то справедливо соотношение (следует из ) () = () + (), откуда следует, что

= 1 – = 1 – .

Отсюда следует, что действительно определяет, какую долю выборочной вариации можно объяснить моделью.

Если уравнение регрессии содержит свободный член, то оба выражения для эквивалентны. Кроме того, в этом случае можно показать, что 0 все равны 0 и равен 1, если в уравнении регрессии содержится только константа).

Можно показать, что в случае парной линейной регрессии коэффициент детерминации равен квадрату коэффициента корреляции, т.е. R² = .

Следует иметь в виду, что измеряет только качество линейной аппроксимации, но не меру качества статистической модели. Кроме того, чувствителен к определению зависимой переменной и в случае её изменения разные модели по сравнивать нельзя.

⇐ Предыдущая 1 2 3 4 567 8 9 10 Следующая ⇒

Дата добавления: 2015-09-15; просмотров: 2984. Нарушение авторских прав; Мы поможем в написании вашей работы!

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при которых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Логические цифровые микросхемы Более сложные элементы цифровой схемотехники (триггеры, мультиплексоры, декодеры и т.д.) не имеют...

ОЧАГОВЫЕ ТЕНИ В ЛЕГКОМ Очаговыми легочными инфильтратами проявляют себя различные по этиологии заболевания, в основе которых лежит бронхо-нодулярный процесс, который при рентгенологическом исследовании дает очагового характера тень, размерами не более 1 см в диаметре...

Примеры решения типовых задач. Пример 1.Степень диссоциации уксусной кислоты в 0,1 М растворе равна 1,32∙10-2 Пример 1.Степень диссоциации уксусной кислоты в 0,1 М растворе равна 1,32∙10-2. Найдите константу диссоциации кислоты и значение рК. Решение. Подставим данные задачи в уравнение закона разбавления К = a2См/(1 –a) =...

Экспертная оценка как метод психологического исследования Экспертная оценка – диагностический метод измерения, с помощью которого качественные особенности психических явлений получают свое числовое выражение в форме количественных оценок...

Тема 5. Организационная структура управления гостиницей 1. Виды организационно – управленческих структур. 2. Организационно – управленческая структура современного ТГК...

Методы прогнозирования национальной экономики, их особенности, классификация В настоящее время по оценке специалистов насчитывается свыше 150 различных методов прогнозирования, но на практике, в качестве основных используется около 20 методов...

Методы анализа финансово-хозяйственной деятельности предприятия Содержанием анализа финансово-хозяйственной деятельности предприятия является глубокое и всестороннее изучение экономической информации о функционировании анализируемого субъекта хозяйствования с целью принятия оптимальных управленческих...

Studopedia.info - Студопедия - 2014-2025 год . (0.013 сек.) русская версия | украинская версия