Решение типовой задачи

12 Следующая ⇒

Лабораторная работа

"Построение эконометрической линейной модели уравнения парной регрессии "

1. Цель работы

2. Порядок выполнения работы

3. Содержание отчета

4. Контрольные вопросы

5. Варианты заданий

Цель работы

1) Изучить методику построения линейного уравнения парной регрессии способы оценки её адекватности и точности.

2) Рассчитать конкретный типовой пример.

Порядок выполнения работы

1) Ознакомиться с методологией построения моделей парной регрессии и правилами оценки их точности и адекватности.

2) Получить исходные данные у преподавателя.

3) Выполнить расчет на ЭВМ (расчеты рекомендуется проводить при помощи ППП Microsoft Excel)

4) Оформить отчет, включающий выводы по проделанной работе.

Содержание отчета

1) Исходные данные.

2) Результаты расчета с анализом полученных данных.

3) Выводы.

Контрольные вопросы

1) Этапы построения модели регрессии.

2) Коэффициент линейной парной корреляции.

3) Сущность метода наименьших квадратов.

4) Объясните, чем вызвано появление в модели парной регрессии стохастической переменной ε?

5) Почему перед построением модели парной линейной регрессии необходимо рассчитывать коэффициент корреляции?

6) Объясните смысл понятия «число степеней свободы».

7) По каким вычислениям можно судить о значимости модели в целом?

8) Зачем необходимо рассчитывать t-критерий Стьюдента?

9) Зачем необходимо оценивать интервалы прогноза по линейному уравнению регрессии?

10) В каких пределах должна находиться ошибка аппроксимации, чтобы можно было сделать вывод о хорошем подборе модели к исходным данным?

Требуется:

1. Построить линейное уравнение парной регрессии y по x.

2. Рассчитать линейный коэффициент парной корреляции, коэффициент детерминации и среднюю ошибку аппроксимации.

3. Оценить статистическую значимость уравнения регрессии в целом и отдельных параметров регрессии и корреляции с помощью F критерия Фишера и t -критерия Стьюдента.

4. Выполнить прогноз заработной платы y при прогнозном значении среднедушевого прожиточного минимума x, составляющем 107% от среднего уровня.

5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

6. На одном графике отложить исходные данные и теоретическую прямую.

Построение уравнения регрессии сводится к оценке ее параметров.

Для оценки параметров регрессий, линейных по параметрам, используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака y от теоретических y. x минимальна, т.е.

Σ(y - ŷ)² → min (2.3)

Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно a и b:

.na + bΣx = Σ y, (2.4)

a Σx + b Σ x² = Σ xy.

Можно воспользоваться готовыми формулами, которые вытекают непосредственно из решения этой системы:

(Ковариация – числовая характеристика совместного распределения двух случайных величин, равная математическому ожиданию произведения отклонений этих случайных величин от их математических ожиданий. Дисперсия – характеристика случайной величины, определяемая как математическое ожидание квадрата отклонения случайной величины от ее математического ожидания. Математическое ожидание – сумма произведений значений случайной величины на соответствующие вероятности.)

Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции r_xy для линейной регрессии (-1≤ r_xy ≤1):

Оценку качества построенной модели даст коэффициент (индекс) детерминации

r_xy² (для линейной регрессии) либо r_xy ²(для нелинейной регрессии), а также средняя ошибка аппроксимации.

Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:

(2.7)

Допустимый предел значений Ā – не более 10%.

Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения:

После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.

Проверить значимость уравнения регрессии – значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной.

Оценка значимости уравнения регрессии в целом производится на основе
F-критерия Фишера, которому предшествует дисперсионный анализ. Согласно основной идее дисперсионного анализа, общая сумма квадратов отклонений переменной y от среднего значения y раскладывается на две части –«объясненную» и «необъясненную»:

где общая сумма квадратов отклонений; – сумма квадратов отклонений, объясненная регрессией (или факторная сумма квадратов отклонений);

– остаточная сумма квадратов отклонений, характеризующая влияние неучтенных в модели факторов.

Схема дисперсионного анализа имеет вид, представленный в таблице

Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду (напомним, что степени свободы – это числа, показывающие количество элементов варьирования, которые могут принимать произвольные значения, не изменяющие заданных характеристик). Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F -критерия Фишера:

Фактическое значение F -критерия Фишера сравнивается с табличным значением при уровне значимости α и степенях свободы k₁= m и k₂ = n - m -1. При этом, если фактическое значение F- критерия больше табличного, то признается статистическая значимость уравнения в целом.

Для парной линейной регрессии m = 1, поэтому

Величина F -критерия связана с коэффициентом детерминации r²_xy, и её можно рассчитать по формуле:

Для оценки статистической значимости параметров регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Оценка значимости коэффициентов регрессии и корреляции с помощью t -критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки:

b ar

Стандартные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:

Сравнивая фактическое и критическое (табличное) значения t статистики – t_табл и t_факт– делаем вывод о значимости параметров регрессии и корреляции. Если t_табл < t_факт то параметры a, b и r_xy не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора x. Если t_табл > t_факт, то признается случайная природа формирования a, b или r_xy.

Для расчета доверительного интервала определяем предельную ошибку Δ для каждого показателя:

Δ_a = t_таблm_a, Δ_b = t_таблm_b.

Формулы для расчета доверительных интервалов имеют следующий вид:

γ_a = a ± Δ_a; γ_amin = a - Δ_a; γ_amax = a + Δ_a;

γ_b = a ± Δ_b; γ_bmin = a - Δ_b; γ_bmax = a + Δ_b;

Если в границы доверительного интервала попадает ноль, т.е. нижняя граница отрицательна, а верхняя положительна, то оцениваемый параметр принимается нулевым, так как он не может одновременно принимать и положительное, и отрицательное значения.

Существует связь между t -критерием Стьюдента и F –критерием Фишера:

В прогнозных расчетах по уравнению регрессии определяется предсказываемое индивидуальное значение y₀ как точечный прогноз при x = x₀, т.е. путем подстановки в линейное уравнение ŷ_x = a + b.x соответствующего значения x. Однако точечный прогноз явно нереален, поэтому он дополняется расчетом стандартной ошибки

где , и построением доверительного интервала прогнозного значения y^*₀:

Решение типовой задачи

Пример. По территориям региона приводятся данные за 199X г.

Таблица 2.2

Номер региона	Среднедушевой прожиточный минимум в день одного трудоспособного, руб., x	Среднедневная заработная плата, руб., y

Требуется:

1. Построить линейное уравнение парной регрессии y по x.

5. Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.

6. На одном графике отложить исходные данные и теоретическую прямую.

Решение

1. Для расчёта параметров уравнения регрессии заполняем столбцы 7–10 таблицы 2.3.

№	x	y	y*x	x²	y²	y_x	y-y_x	(y-y_x)²	Ā

						148,770	-15,770	248,695	11,86%
						152,452	-4,452	19,818	3,01%
						157,054	-23,054	531,484	17,20%
						149,690	4,310	18,572	2,80%
						158,895	3,105	9,642	1,92%
						174,542	20,458	418,525	10,49%
						138,645	0,355	0,126	0,26%
						157,974	0,026	0,001	0,02%
						144,168	7,832	61,342	5,15%
						157,054	4,946	24,463	3,05%
						146,929	12,071	145,704	7,59%
						182,826	-9,826	96,550	5,68%
Итого						1869,000	0,000	1583,922	69,02%
Ср.знач	85,583	155,750		7492,25	24531,42	155,750		131,994	5,75%
σ	12,952	16,533
σ²	167,743	273,354
r_xy	0,7210
r_xy²	0,5199

1.Для определения эмпирических коэффициентов регрессии вызываем функции aа=ОТРЕЗОК b=НАКЛОН.

эмпирические коэффициенты регрессии соответственно равны:

a = 76,976

b = 0,9204

Находим уравнение парной линейной регрессии, связывающей величину ежемесячной пенсии y с величиной прожиточного минимума x, которое имеет вид .y_x = 76,9765 + 0,9204 x.

Параметр регрессии позволяет сделать вывод, что с увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.(или 92 коп.).

2. Расчёт тесноты статистической связи между результатом и фактором

Тесноту линейной связи оценит коэффициент корреляции r _xy:

Коэффициент корреляции: r_xy = b*σ _x /σ _y= 0,92 *12,952 / 6,533 =0,721;

Т.к. значение коэффициента корреляции больше 0,7, то это говорит о наличии весьма тесной линейной связи между признаками.

r_xy	0,7210
r_xy²	0,5199
Ā	5,752%

Параметр R-квадрат, представляет собой квадрат коэффициента корреляции r_xy² и называется коэффициентом детерминации. Величина данного коэффициента характеризует долю дисперсии зависимой переменной y, объясненную регрессией (объясняющей переменной x). Соответственно величина 1 - r_xy² характеризует долю дисперсии переменной y, вызванную влиянием всех остальных, неучтенных в эконометрической модели объясняющих переменных

Коэффициент детерминации: r²_xy = 0,5199.

Это означает, что 52% вариации заработной платы (y) объясняется вариацией фактора x – среднедушевого прожиточного минимума.

Качество модели определяет средняя ошибка аппроксимации (2,7):

Ā =(1/n)*Σ Ā _i *100%=(1/12)* 69,02%= 5,752%

Качество построенной модели оценивается как хорошее, так как A не превышает 10%.

3. Оценку статистической значимости уравнения регрессии в целом проведем с помощью F -критерия Фишера. Фактическое значение F критерия по формуле (2.9) составит
F _факт= {r_xy/(1- r_xy²)} *(n-2)= 0,7210/(1-0,52)}*10= 10,8280

Fфакт	10,83	>4,96 k₁=1,k_2=12-2
S²ост	157,49	Остаточная дисперсия на одну степень свободы
S_ост	12,55	Корень квадратный из остаточной дисперсии (стандартная ошибка): S_ост = 12,5496
m_a	24,212	Стандартные ошибки для параметров регрессии:
m_b	0,2805
m_rxy	0,2191
t_a	3,170	Фактические значения t_at -критерия Стьюдента
t_b	3,281	Фактические значения t_b t -критерия Стьюдента
t_rxy	3,290	t_rxy больше tтабл=2,2281
Δa=tтабл*ma	54,14583
Δb=tтабл*mb	0,625545
γ_a	130,92	23,03 Доверительные интервалы: 76,98±24,21 23,03≤a*≤130,92
γ_b	1,54	0,30 Доверительные интервалы: 0,92±4,17, -3,24≤b*≤5,09
	75,6474+0,8978*97,55=y0	161,26
	m_y0	13,56	Ошибка прогноза =13,56
	Δ _y0	30,2	Предельная ошибка прогноза, которая в 95% случаев не будет превышена =30,2

Табличное значение критерия при пятипроцентном уровне значимости и степенях свободы k1 = 1 и k2 = 12 - 2 = 10 составляет Fтабл = 4,96. (cм. Критерий Стьюдента).

Так как Fфакт =10,41 > Fтабл = 4,96, то уравнение регрессии признается статистически значимым.

Оценку статистической значимости параметров регрессии и корреляции проведем с помощью t -статистики Стьюдента и путем расчета доверительного интервала каждого из параметров.

Табличное значение t -критерия для числа степеней свободы

df = n - 2 = 12 - 2 = 10 и уровня значимости a= 0,05 составит tтабл = 2,23.

Определим стандартные ошибки m_a, m_b, m_{r xy} (остаточная дисперсия на одну степень свободы S²_ост = 157,49):

Фактические значения t -статистики превосходят табличное значение:

t_a = 3,17 > t_табл = 2,3; t_b = 3,28 > t_табл = 2,3; t_r_xy = 3,29 > t_табл = 2,3,

поэтому параметры a, b и r_xy не случайно отличаются от нуля, а статистически значимы.

Рассчитаем доверительные интервалы для параметров регрессии a и b. Для этого определим предельную ошибку для каждого показателя:

Δa=tтабл*ma=54,14583

Δb=tтабл*mb=0,625545

Доверительные интервалы γ_a =a ±Δa=76,98±24,21 23,03≤a*≤130,92

γ_b = b±Δb=0,92±4,17 = -3,24≤b*≤5,09

Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью p = 1-a = 0,95 параметры a и b, находясь в указанных границах, не принимают нулевых значений, т.е. являются статистически значимыми и существенно отличны от нуля.

4. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит: руб., тогда. индивидуальное прогнозное значение заработной платы составит:

5. Ошибка прогноза составит:

13,56

Предельная ошибка прогноза, которая в 95% случаев не будет превышена, составит:

30,2

Доверительный интервал прогноза:

Выполненный прогноз среднемесячной заработной платы является надежным
(p = 1-a = 1- 0,05 = 0,95) и находится в пределах от 131,92 руб. до 190,66 руб.

6. В заключение решения задачи построим на одном графике исходные данные (рис. 2.1):

12 Следующая ⇒

Дата добавления: 2015-08-12; просмотров: 6076. Нарушение авторских прав; Мы поможем в написании вашей работы!

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при которых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Логические цифровые микросхемы Более сложные элементы цифровой схемотехники (триггеры, мультиплексоры, декодеры и т.д.) не имеют...

Конституционно-правовые нормы, их особенности и виды Характеристика отрасли права немыслима без уяснения особенностей составляющих ее норм...

Толкование Конституции Российской Федерации: виды, способы, юридическое значение Толкование права – это специальный вид юридической деятельности по раскрытию смыслового содержания правовых норм, необходимый в процессе как законотворчества, так и реализации права...

Значення творчості Г.Сковороди для розвитку української культури Важливий внесок в історію всієї духовної культури українського народу та її барокової літературно-філософської традиції зробив, зокрема, Григорій Савич Сковорода (1722—1794 pp...

ТЕРМОДИНАМИКА БИОЛОГИЧЕСКИХ СИСТЕМ. 1. Особенности термодинамического метода изучения биологических систем. Основные понятия термодинамики. Термодинамикой называется раздел физики...

Травматическая окклюзия и ее клинические признаки При пародонтите и парадонтозе резистентность тканей пародонта падает...

Подкожное введение сывороток по методу Безредки. С целью предупреждения развития анафилактического шока и других аллергических реакций при введении иммунных сывороток используют метод Безредки для определения реакции больного на введение сыворотки...

Studopedia.info - Студопедия - 2014-2025 год . (0.01 сек.) русская версия | украинская версия