Пример выполнения лабораторной работы. Зададим значения величин и
Зададим значения величин и . > restart: X: =[-0.9, -0.8, -0.7, -0.6, -0.5, -0.4, -0.3, -0.2, -0.1, 0, 0.1, 0.2, 0.3, 0.4]: > Y: =[-5.32, -5.62, -5.51, -4.72, -4.68, -4.24, -3.74, -3.46, -2.84, -3.39, -3.08, -2.17, -1.69, -1.33]: Построим корреляционное поле. Нанесём точки с координатами , на координатную плоскость. > with(stats): statplots[scatterplot](X, Y, color=black); Замечание. В версии Maple V R 4 для построения корреляционного поля нужно вызывать функцию с именем scatter 2d.
Методом наименьших квадратов найдём прямую такую, что сумма квадратов отклонений заданных точек от прямой будет наименьшей. > fit[leastsquare[[x, y]]]([X, Y]); Результат, полученный на экране монитора: Для удобства определим найденную зависимость как функцию пользователя с именем : > F: =unapply(-2.888461538+3.243296703*x, x); Результат, полученный на экране монитора: Определим «значимость» полученной нами регрессионной зависимости. Вычислим значение коэффициента детерминации R2. Найдём среднее значение . Обозначим эту величину идентификатором Ysr. > n: =14: Ysr: =sum(Y[i], 'i'=1..n)/n; Результат, полученный на экране монитора: Вычислим значения , определяемые уравнением регрессии. Полученное множество значений обозначим идентификатором FL. > FL: =seq(F(X[i]), i=1..n): Определим – меру разброса, объяснённого с помощью регрессии, и – меру общего разброса (вариации) переменной : > SR2: =sum((FL[i]-Ysr)^2, 'i'=1..n); S2: =sum((Y[i]-Ysr)^2, 'i'=1..n); Результат, полученный на экране монитора: Вычислим значение статистического коэффициента детерминации R2: > R2: =SR2/S2; Результат, полученный на экране монитора: По величине коэффициента детерминации заключаем, что вариация исследуемой зависимой переменной на 95.13 % объясняется изменчивостью объясняющей переменной х. Определим значимость уравнения регрессии. Найдём Fst –зна-чение F-статистики: > Fst: =R2*(n-2)/(1-R2); Результат, полученный на экране монитора: Найденное значение Fst сравним с критическим значением критерия Фишера. Уровень значимости примем равным 0.05. По таблице определяем, что F кр=4.747. Так как Fst> Fкр, то уравнение регрессии значимо на уровне 0.05. Изобразим корреляционное поле и график полученной прямой на одном рисунке: > k: =statplots[scatterplot](X, Y, color=green): > l: =plot(F(x), x=-0.9..0.4): > plots[display]([k, l]); Результат, полученный на экране монитора:
Контрольные вопросы 1. Что такое парная регрессия? 2. Что такое парная линейная регрессия? 3. Какие классы нелинейных регрессий вы знаете? Приведите примеры. 4. Что такое корреляционное поле? 5. В чём заключается метод наименьших квадратов (МНК)? 6. Какие количественные характеристики степени зависимости случайных величин вам известны? 7. Как оценивается теснота связи между исследуемыми величинами? 8. Как оценивается качество построенной модели? 9. Как оценивается статистическая значимость и надёжность уравнения регрессии? 10. По совокупности 30 предприятий торговли строится модель вида между признаками: – цена на товар А, тыс. руб.; – прибыль торгового предприятия, млн руб. Рассчитаны величины , , , . Найдите коэффициенты и .
|