Студопедия — Пример проверки адекватности регрессионной модели
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Пример проверки адекватности регрессионной модели






1. Шаг Оценим существенность влияния каждой объясняющей переменной (attend, termGPA, priGPAенка за итоговый экзаменпритавлены на рис 5.симость...вызывается функцией меню вадратов, в частности, 1МНК (), ACT, hwrte согласно приведённому выше примеру, формула (9), на зависимую переменную final, для этого необходимо оценить значимость полученных параметров (рисунок 2), используя t- критерий Стьюдента.

Сформулируем нулевую гипотезу о не значимости коэффициента ( =0, и лишь в силу случайных обстоятельств оказался равным проверяемой величине) и альтернативную – о значимости ( ¹0), а также выберем уровень значимость (1%, 5%, или 10% - максимально допустимая вероятность ошибочного принятия альтернативной гипотезы).

В оцениваемой модели (формула 9) (рисунок 2) существенные параметры при уровне значимости 1% обозначены ***, 5% - **, 10% - *. Обозначение звёздочками облегчает быстрое оценивание значимости параметров, в рассматриваемом примере существенными являются только константа const и коэффициенты при переменных termGPAенка за итоговый экзаменпритавлены на рис 5.симость...вызывается функцией меню вадратов, в частности, 1МНК () и ACT (во всех трёх случаях вероятность ошибки при принятии гипотезы об их значимости P-VALUE=0,001%)).

В последнем столбце представляется эмпирический уровень значимости P-VALUE (вероятность допустить ошибку при принятии альтернативной гипотезы, т.е. вероятность того, что значение t-критерия для генеральной совокупности превысит его расчётное значение по данной выборке), который позволяет проверить гипотезы о значимости каждого коэффициента и осуществить отбор существенных (P-value меньше выбранного уровня значимости) и наиболее слабых переменных модели (P-value больше выбранного уровня значимости). В рассмотренном примере самой слабой является переменная PriGPA - вероятность ошибки при принятии гипотезы о её значимости 86,5%, на которую также указывает сообщение в последней строке окна.

Значения столбца Т- Stat (рисунок 2), представляющие собой отношение соответствующих величин в столбцах COEFFICIENT и STDERROR, показывают расчётные значения t- критерий Стьюдента. Согласно методу отбора объясняющих переменных a posteriori предполагается исключение переменных с минимальными (по модулю) значением t- критерия, в рассматриваемом случае - переменных attend, priGPAенка за итоговый экзаменпритавлены на рис 5.симость...вызывается функцией меню вадратов, в частности, 1МНК (), и hwrte.

2 Шаг. Оценим значимость (пригодность) модели (формула 9) в целом, используя показатели: F-критерий Фишера, коэффициент детерминации (Unadjusted R2 и Adjusted R2), сумма квадратов остатков (RSS, Sum of squared residuals), стандартная ошибка регрессии (Standard error of residuals), информационные критерии (Akaike information criterion, Schwarz Bayesian criterion, Hannan-Quinn criterion).

В рассматриваемом примере F-критерий Фишера F-statistic (5, 668) = 66,6869 для p-value < 0,00001. Поскольку p-value меньше выбранного уровня значимости (p=1%) принимается решение о принятии альтернативной гипотезы, т.е. об адекватности модели в целом. Однако = 33,3%, что свидетельствует о невысоком уровне объяснения моделью фактических данных, однако согласно F-тесту, он может быть признан достаточно существенным.

Т.о. в результате анализа рассматриваемой модели на адекватность можно сделать вывод: модель по F-критерию Фишера адекватна, но три коэффициента регрессии (при переменных attend, priGPAенка за итоговый экзаменпритавлены на рис 5.симость...вызывается функцией меню вадратов, в частности, 1МНК (), и hwrte) незначимы. В этом случае модель пригодна для принятия некоторых решений относительно зависимости переменной final от переменных termgpa и ACT, но не для производства прогнозов.

 

Пример 2. Согласно вышеизложенным рекомендациям исключим из полученной в Примере 1. модели, формула (9), переменные attend, priGPAенка за итоговый экзаменпритавлены на рис 5.симость...вызывается функцией меню вадратов, в частности, 1МНК (), и hwrte и повторим рассмотренную последовательность действий для получения линейной регрессионной модели, устанавливающей зависимость переменной FINAL от ACT и termgpa. Получим скорректированную модель final= 10,8+0,339 ACT+ 2,87termgpa+u (рисунок 3), в которой все переменные существенны и модель в целом пригодна для практического использования (согласно рассмотренным выше критериям) для принятия решений и составления прогнозов.

 

 

Рисунок 3 - Окно результатов моделирования с применением 1МНК, скорректированная модель

 

Сохраним значения остатков данной модели как отдельную переменную RESIDUALS набора attend.gdt при помощи функции Save\Residuals окна результатов моделирования (рисунок 3). После нажатия кнопки ОК диалогового окна, данная переменная добавится в список переменных рассматриваемого набора данных attend.gdt. Аналогичным образом сохраним модельные значения результативного признака (final) как FITSfinal при помощи функции Save\Fitted Values.

 







Дата добавления: 2015-10-19; просмотров: 1560. Нарушение авторских прав; Мы поможем в написании вашей работы!



Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

Патристика и схоластика как этап в средневековой философии Основной задачей теологии является толкование Священного писания, доказательство существования Бога и формулировка догматов Церкви...

Основные симптомы при заболеваниях органов кровообращения При болезнях органов кровообращения больные могут предъявлять различные жалобы: боли в области сердца и за грудиной, одышка, сердцебиение, перебои в сердце, удушье, отеки, цианоз головная боль, увеличение печени, слабость...

Вопрос 1. Коллективные средства защиты: вентиляция, освещение, защита от шума и вибрации Коллективные средства защиты: вентиляция, освещение, защита от шума и вибрации К коллективным средствам защиты относятся: вентиляция, отопление, освещение, защита от шума и вибрации...

Классификация потерь населения в очагах поражения в военное время Ядерное, химическое и бактериологическое (биологическое) оружие является оружием массового поражения...

Факторы, влияющие на степень электролитической диссоциации Степень диссоциации зависит от природы электролита и растворителя, концентрации раствора, температуры, присутствия одноименного иона и других факторов...

Йодометрия. Характеристика метода Метод йодометрии основан на ОВ-реакциях, связанных с превращением I2 в ионы I- и обратно...

Studopedia.info - Студопедия - 2014-2024 год . (0.01 сек.) русская версия | украинская версия