Определим методом наименьших квадратов параметры уравнения линейной регрессии
Параметры a и b линейной регрессии рассчитываем в результате решения системы нормальных уравнений относительно a и b.
(1.1) По исходным данным рассчитаем Таблица 1– Вспомогательная расчетная таблица
Система нормальных уравнений составит:
Получаем уравнение регрессии:
Величина коэффициента регрессии означает, что с ростом заработной платы на 1 тыс. руб. доля расходов на покупку продовольственных товаров снижается в среднем на 5, 5 %–х пункта. Подставив в уравнение значения , найдем теоретические значения (последняя графа таблицы 1). В данном случае величина параметра не имеет экономического смысла. 2. Найдем показатели тесноты связи линейной модели: Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции . Как известно, линейный коэффициент корреляции находится в границах:
–1 ≤ ≤ 1
Если коэффициент регрессии > 0, то 0 ≤ ≤ 1 Если коэффициент регрессии < 0, то –1 ≤ ≤ 0 Линейный коэффициент корреляции равен:
, (1.2) , (1.3)
, (1.4)
, (1.5)
, (1.6)
, (1.7)
Вывод: связь между признаками очень высокая обратная, так – 0, 9 < < –0, 99 Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции называемый коэффициентом детерминации. Коэффициент детерминации характеризует долю дисперсии результативного признака у, объясняемую регрессией, в общей дисперсии результативного признака:
, (1.8)
Соответственно величина характеризует долю дисперсии , вызванную влиянием остальных факторов, не учтенных в модели. Коэффициент детерминации –
То есть вариация на 88, 92 объясняется вариацией . На долю прочих факторов, не учитываемых в регрессии, приходится 11, 08 %. Величина коэффициента детерминации является одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов и, следовательно, линейная модель хорошо аппроксимирует исходные данные, и ею можно воспользоваться для прогноза значений результативного признака.
|