Задача №3. По 12 предприятиям отрасли изучается зависимость прибыли (тыс
По 12 предприятиям отрасли изучается зависимость прибыли (тыс. руб.) у от выработки продукции на одного человека (единиц) х по следующим данным: Таблица 1– Исходные данные
Требуется: 1. Построить линейное уравнение парной регрессии у = f(x). 2. Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации. 3.Оценить статистическую значимость параметров регрессии и корреляции. 4. Дать точечный и интервальный прогноз прибыли с вероятностью 0, 95, принимая уровень выработки равным 92 единицам. Решение: 1. Для расчета параметров уравнения линейной регрессии строим таблицу 2. Таблица 2– Расчетная таблица
Рассчитаем параметры и по формулам:
, (2.29)
, (2.30)
Получаем уравнение регрессии:
С увеличением выработки на 1 единицу прибыль возрастает в среднем на 0, 92 тыс. руб. 2. Тесноту линейной связи измеряет коэффициент корреляции:
, (2.31) Коэффициент корреляции можно также рассчитать по формуле:
, (2.7)
, (2.8)
, (2.9)
, (2.10)
, (2.11)
, (2.12)
Величина коэффициента корреляции означает достаточно тесную связь рассматриваемых признаков. Коэффициент детерминации показывает, что 52 % вариации прибыли связано с вариацией выработки продукции на одного работника. Качество модели оценивается как хорошее, так как не превышает 8–10 % (см. среднее значение в последней графе таблицы 2). 3. Оценку статистической значимости параметров регрессии проведем с помощью - статистики Стьюдента и вычислим доверительные интервалы для каждого из показателей. Выдвигаем гипотезу Но о статистически незначимых отличиях от нуля значений показателей: для числа степеней свободы Определим случайные ошибки параметров , и коэффициента корреляции :
, (2.32)
где – ошибка параметра а; – стандартная ошибка регрессии, определяемая как
, (2.33)
, (2.34)
, (2.35)
Далее вычисляем значения критерия Стьюдента:
, (2.36)
, (2.37)
, (2.38)
Фактические значения – статистики превосходят табличное значение на 5 %–м уровне значимости при числе степеней свободы : . Поэтому гипотеза Но отклоняется, то есть , и отличаются от нуля не случайно и их значения статистически значимы. Рассчитаем доверительный интервал для a и b, для чего определим предельную ошибку для каждого параметра: , (2.39)
, (2.40)
Доверительные интервалы: , (2.41)
, (2.42)
, (2.43)
, (2.44)
, (2.45)
, (2.46)
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры и , находясь в указанных границах, не принимают нулевых значений, то есть не являются статистически незначимыми и существенно отличны от нуля. 4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если примем прогнозное значение выработки , то точечный прогноз прибыли составит:
, (2.47)
тыс. руб. Чтобы получить интервальный прогноз, найдем стандартную ошибку предсказываемого значения прибыли : , (2.48)
тыс. руб. Предельная ошибка прогнозируемой прибыли составит: , (2.49)
тыс. руб. Доверительный интервал прогнозируемой прибыли составит:
то есть при выработке, равной 92 единицы, получим значение прибыли не меньше чем тыс. руб., и не больше чем тыс. руб.
|