Включающая фиктивные переменные
По данным опроса 15 женщин (табл.2.2), находящихся в роддоме, исследовать зависимость веса новорожденного (у) от среднего числа сигарет (х), выкуриваемых матерью в день, с учетом числа уже имеющихся у матери детей (z). Таблица 2.2.
Решение. Чтобы учесть при решении задачи число детей, уже имеющихся у матерей, нужно либо сгруппировать матерей по числу детей и построить для каждой группы свою модель, либо ввести фиктивные переменные. Предварительно сгруппируем матерей по количеству уже имеющихся у них детей:
Как видим, первый подход к построению регрессионной модели следует сразу отвергнуть из-за малого числа наблюдений в группах. Предположив, что модели могут различаться только свободным членом, т.е. наличие структурных сдвигов. Введем фиктивные переменные di, где i = 1, 2, 3 и пусть
Поясним, что в модель мы не включили фиктивную переменную d 0, т.к. в этом случае и фиктивные переменные становятся линейно зависимыми, а матрица Х Т Х - вырожденной. Предположив линейную зависимость веса новорожденного от х, d 1, d 2 и d 3, найдем МНК-оценку линейного уравнения регрессии: Ниже уравнения в скобках указаны оценки среднеквадратических отклонений коэффициентов регрессии . Можно легко убедиться, что коэффициенты при переменных d 2 и d 3 не значимы, т.к. статистика t -критерия для этих переменных меньше табличного значения t кр = 1, 812 при a=0, 05 и n=(n ‑ p ‑ 1)=10 (таблица П6). После реализации пошагового алгоритма регрессионного анализа получено уравнение регрессии со всеми значимыми коэффициентами: (2.6) Об адекватности модели свидетельствуют его параметры: множественный коэффициент детерминации , оценка остаточной дисперсии , средняя относительная ошибка аппроксимации и расчетное значение F-критерия (Fнабл=15, 378). Уравнение регрессии значимо, т.к. Fнабл больше табличного значения Fкр=2, 81, найденного при a=Q=0, 05 и числа степеней свободы n1=2 и n2=12 (таблица П5). Из модели (2.6) следует, что структурный сдвиг имеет место лишь для случая d 1 =1. Таким образом, у курящих женщин, рожающих второго ребенка, зависимость веса новорожденного (у) от числа выкуриваемых за день сигарет определяется регрессионной моделью (2.7) (свободный член получен как сумма: 3, 833=3, 681+0, 152), у остальных курящих женщин эта зависимость имеет вид: (2.8) Сопоставляя модели (2.7) и (2.8) можно отметить, что при рождении вес второго ребенка у курящих женщин будет в среднем на 0, 152 кг выше, чем вес детей у остальных женщин, выкуривающих в день те же (х) сигарет.
|