ИНТЕРВАЛЫ ПРОГНОЗА
В прогнозных расчетах по уравнению регрессии определяется предсказываемое уp значение как точечный прогноз теоретического значения yxT при xp=xk: уp=а+b хp. Однако точечный прогноз явно не реален. Поэтому он дополняется расчетом стандартной ошибки уxТ, - myp,и интервальной оценки прогнозного значения – строится доверительный интервал прогноза. Выведём формулу для myp. Имеем уравнение линейной регрессии: уxT=а+bх.Подставим в это уравнение выражение параметра а: , тогда уравнение регрессии примет вид: Следовательно, стандартная ошибка myp зависит от ошибки и ошибки коэффициента регрессии b, т.е. Из теории выборки известно, что Используя в качестве оценки σ2 остаточную дисперсию на одну степень свободы Dост (), получим формулу расчета ошибки среднего значения переменной у: Ошибка коэффициента регрессии, как уже было показано, определяется формулой: Считая, что прогнозное значение фактора xp=xk, получим следующую формулу расчета стандартной ошибки предсказываемого по линии регрессии значения: Соответственно myp имеет выражение: Интервальная оценка прогнозного значения (у*): - y* +
Рассмотренная формула стандартной ошибки предсказываемого среднего значения у при заданном значении xk характеризует ошибку положения линии регрессии. Величина стандартной ошибки , как видно из формулы, достигает минимума при xk = и возрастает по мере того, как удаляется от в любом направлении. Иными словами, чем больше разность между xk и , тем больше ошибка , с которой предсказывается среднее значение у для заданного значения xk. Можно ожидать наилучшие результаты прогноза, если признак-фактор х находится в центре области наблюдений х и нельзя ожидать хороших результатов прогноза при удалении xk от . Если же значение xk оказывается за пределами наблюдаемых значений х, используемых при построении линейной регрессии, то результаты прогноза ухудшаются в зависимости от того, насколько xk отклоняется от области наблюдаемых значений фактора х. Для прогнозируемого значения 95% -ные доверительные интервалы при заданном xk определяются выражением: tα* ,
На графике доверительные границы для представляют собой гиперболы, расположенные по обе стороны от линии регрессии (рис.) Рис. показывает, как изменяются пределы в зависимости от изменения xk: a – верхняя доверительная граница; б – линия регрессии; в – доверительный интервал для при xк; г – нижняя доверительная граница.
Рис. Доверительный интервал линии регрессии. Две гиперболы по обе стороны от линии регрессии определяют 95%-ные доверительные интервалы для среднего значения у при заданном значении х. Однако фактические значения у варьируют около среднего значения . Индивидуальные значения у могут отклоняться от на величину случайной ошибки e, дисперсия которой оценивается как остаточная дисперсия на одну степень свободы Dост. Поэтому ошибка предсказываемого индивидуального значения у должна включать не только стандартную ошибку , но и случайную ошибку . Средняя ошибка прогнозируемого индивидуального значения у составит: = При прогнозировании на оcнове уравнения регрессии следует помнить, что величина прогноза зависит не только от стандартной ошибки индивидуального значения у, но и от точности прогноза значения фактора х. Его величина может задаваться на основе анализа других моделей исходя из конкретной ситуации, а также из анализа динамики данного фактора. Рассмотренная формула средней ошибки индивидуального значения может быть использована также для оценки существенности различия предсказываемого значения исходя из регрессионной модели и выдвинутой гипотезе развития событий.
|