Линейной регрессии
Для уравнения зависимости потребления хлеба и хлебопродуктов от располагаемых ресурсов на человека система нормальных уравнений составит:
Решаем ее: Рассмотрим вывод рабочих формул для расчета параметров
сократить на
Умножим уравнение (2.4) на
откуда Если в формулу (2.7) подставить
Формулы (2.5) и (2.8) удобны в том случае, если все средние уже вычислены. Рассчитаем параметры уравнения по нашим данным с помощью данных формул, имея в виду, что Итак, отсюда, Также существует следующая формула для расчета
Итак, уравнение парной линейной регрессии, описывающее зависимость потребления хлеба и хлебопродуктов от располагаемых ресурсов на человека, рассчитанное на основе выборочного обследования домохозяйств, сгруппированных по 10 децильным группам населения, имеет вид:
Параметр В среднем по изучаемой нами совокупности (10 децильным группам населения РБ за 2008 г.) отклонение уровня располагаемых ресурсов от средней величины на 1 тыс. руб. приводило к отклонению среднего потребления хлеба и хлебопродуктов на 0,097 кг в среднем. В практическом анализе обычно говорят, что с повышением располагаемых ресурсов на 1 тыс. руб. на человека в среднем потребление хлеба и хлебопродуктов на человека увеличивается на 0,097 кг на человека в среднем. Связь прямая. Параметр По полученному уравнению определим теоретические (расчетные) значения Рисунок 2.2 Линия регрессии зависимости потребления хлеба и хлебопродуктов на душу населения РБ от располагаемых ресурсов на человека
Показателем силы влияния фактора на результат является коэффициент эластичности: Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат
Для нашего примера коэффициент эластичности составит Практически всегда фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии. Чем меньше это отличие, тем ближе будут теоретические значения подходить к эмпирическим, следовательно, тем лучше подобрано уравнение регрессии. Аппроксимация (приближение) состоит в достаточно точном воспроизведении аналитической функцией фактических данных. Чтобы оценить качество модели в целом, можно определить среднюю ошибку аппроксимации:
Модель считается подобранной достаточно хорошо, если средняя ошибка аппроксимации не превышает 8 – 10%. Для нашего примера средняя ошибка аппроксимации составит (относительные ошибки аппроксимации для каждого наблюдения рассчитаны в таблице 2.2):
Показателем тесноты прямолинейной корреляционной зависимости является коэффициент парной корреляции, показывающий, на какую часть своего среднего квадратического отклонения изменяется в среднем результативный признак при изменении факторного признака на одно среднее квадратическое отклонение. Коэффициент парной корреляции
Коэффициент корреляции может принимать значения от 0 до -1 и от 0 до +1, т.е. Для характеристики силы связи используют шкалу Чеддока.
Оценим тесноту линейной связи располагаемых ресурсов и потребления хлеба и хлебопродуктов на душу населения с помощью коэффициента корреляции:
Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции – коэффициент детерминации Это означает, что 74,5% вариации потребления хлеба и хлебопродуктов обусловлены различиями в уровне располагаемых доходов населения по децильным группам, остальные 25,5% вызваны прочими факторами, которые в данном случае не рассматриваются (допустим, в нашем случае ими могут быть количество мужчин в домохозяйстве – известно, что мужчины потребляют больше хлеба, чем женщины; численность населения, принципиально не потребляющие хлеба (например, соблюдающих диету и т.д.). С помощью регрессионного анализа, когда построение функции регрессии осуществляется по данным выборки, можно получить оценки параметров зависимости. Однако они являются лишь оценками. Поэтому возникает вопрос о том, насколько они надежны, следовательно, оценки дополняются расчетом достоверности или значимости. Это объясняется возможной погрешностью, с которой определяются выборочные показатели относительно своих генеральных аналогов. Оценка значимости уравнения регрессии в целом дается с помощью F- критерия Фишера. При этом выдвигается нулевая гипотеза ( Критерий Фишера рассчитывается по следующей формуле:
Если гипотеза Фактическое значение Между критерием Фишера и коэффициентом детерминации в модели парной линейной зависимости существует связь:
В нашем примере расчет по данной формуле: В линейной регрессии оценивается не только значимость уравнения регрессии в целом, но и значимость его отдельных параметров, а также коэффициента корреляции с помощью статистического критерия Стьюдента.. Для того чтобы осуществить такую оценку, необходимо для параметров уравнения регрессии и коэффициента корреляции рассчитать стандартные ошибки (
Чтобы оценить существенность параметров, необходимо рассчитать для них фактические значения критериев Стьюдента
Фактические значения критерия Стьюдента сравниваются с критическими (табличными) при определенном уровне значимости В нашем примере t -критерий для числа степеней свободы
В парной линейной регрессии между критерием Фишера, критериями Стьюдента коэффициентов регрессии и корреляции существует связь:
В нашем примере Имея исчисленные параметры уравнения регрессии и коэффициент парной линейной корреляции, не представляется возможным точно рассчитать уровень этих показателей в генеральной совокупности. В этом случае может идти речь с определенной вероятностью только о границах, в которых находятся параметры уравнения регрессии и коэффициент корреляции. На основе стандартных ошибок параметров и табличных значений критерия Стьюдента можно рассчитать доверительные интервалы для параметров уравнения регрессии:
Поскольку коэффициент регрессии имеет четкую экономическую интерпретацию, то доверительные границы интервала для него не должны содержать противоречивых оценок (не должны содержать положительные и отрицательные величины одновременно). В нашем примере это требование выполняется, т. е. и в генеральной совокупности (во всех домохозяйствах республики) в 2008 г. наблюдалось увеличение потребления хлеба и хлебопродуктов в зависимости от уровня располагаемых ресурсов на человека. Коэффициент корреляции в любом случае должен находиться в пределах от -1 до +1. В нашем примере это требование нарушается, поэтому принимаем, что и в генеральной совокупности связь между изучаемыми признаками была высокой. Используя уравнение регрессии, можно получить предсказываемое значение результата ( Рассчитаем точечное ожидаемое потребление хлеба и хлебопродуктов на душу населения в РБ, имея построенную модель зависимости:
Однако, точечный прогноз практически нереален на практике, поскольку эконометрика изучает экономические явления и процессы, на которые могут воздействовать огромное количество различных причин. Поэтому дополнительно необходимо осуществлять определение ошибки прогнозирования Стандартная ошибка прогнозирования рассчитывается по формуле:
Доверительный интервал прогноза:
|