Студопедия — Линейной регрессии
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Линейной регрессии






  8,3 2,56 21,248 6,5536 68,89 9,18 10,6 82,2649 3,0976 0,7750
  8,9 3,70 32,930 13,6900 79,21 9,29 4,4 62,8849 1,3456 0,1528
  9,3 4,60 42,780 21,1600 86,49 9,38 0,8 49,4209 0,5776 0,0061
  9,9 5,74 56,826 32,9476 98,01 9,49 4,2 34,6921 0,0256 0,1691
  10,0 6,84 68,400 46,7856 100,00 9,60 4,0 22,9441 0,0036 0,1636
  11,1 8,30 92,130 68,8900 123,21 9,74 12,3 11,0889 1,0816 1,8575
  10,0 10,39 103,900 107,9521 100,00 9,94 0,6 1,5376 0,0036 0,0036
  10,0 14,31 143,100 204,7761 100,00 10,32 3,2 7,1824 0,0036 0,1024
  10,1 19,00 191,900 361,0000 102,01 10,78 6,7 54,3169 0,0016 0,4556
  13,0 40,82 530,660 1666,2724 169,00 12,89 0,8 852,0561 8,6436 0,0118
Итого 100,6 116,26 1283,874 2530,0274 1026,82 100,60 47,6 1178,3888 14,7840 3,6976
Среднее 10,06 11,63 128,39 253,00 102,68 10,06 4,76 117,84 1,48 0,37

 

Для уравнения зависимости потребления хлеба и хлебопродуктов от располагаемых ресурсов на человека система нормальных уравнений составит:

.

Решаем ее:

Рассмотрим вывод рабочих формул для расчета параметров и , имея в виду, что Тогда первое уравнение системы нормальных уравнений (2.3) можно записать в виде:

, (2.4)

сократить на : откуда получаем формулу

(2.5)

Умножим уравнение (2.4) на и вычтем из второго уравнения системы (2.3):

(2.6)

откуда (2.7)

Если в формулу (2.7) подставить то имеем

(2.8)

Формулы (2.5) и (2.8) удобны в том случае, если все средние уже вычислены.

Рассчитаем параметры уравнения по нашим данным с помощью данных формул, имея в виду, что

Итак,

отсюда, .

Также существует следующая формула для расчета :

(2.9)

Итак, уравнение парной линейной регрессии, описывающее зависимость потребления хлеба и хлебопродуктов от располагаемых ресурсов на человека, рассчитанное на основе выборочного обследования домохозяйств, сгруппированных по 10 децильным группам населения, имеет вид:

.

Параметр называется коэффициентом регрессии и показывает среднее изменение результата с изменением фактора на одну единицу его измерения. При - связь прямая (при увеличении фактора результат повышается, линия регрессии является возрастающей), при - обратная (при увеличении фактора результат уменьшается, линия регрессии имеет отрицательный наклон), при связь отсутствует. Коэффициент регрессии является именованной величиной, его значения не имеют ограничений.

В среднем по изучаемой нами совокупности (10 децильным группам населения РБ за 2008 г.) отклонение уровня располагаемых ресурсов от средней величины на 1 тыс. руб. приводило к отклонению среднего потребления хлеба и хлебопродуктов на 0,097 кг в среднем. В практическом анализе обычно говорят, что с повышением располагаемых ресурсов на 1 тыс. руб. на человека в среднем потребление хлеба и хлебопродуктов на человека увеличивается на 0,097 кг на человека в среднем. Связь прямая.

Параметр показывает значение результативного признака , если факторный признак . Он именуется свободным членом, в нем определенным образом отражается среднее влияние неучтенных факторов. В том случае, если признак-фактор не имеет или не может иметь нулевого значения, то такая трактовка свободного члена бессмысленна. Тогда говорят, что параметр экономического смысла не имеет.

По полученному уравнению определим теоретические (расчетные) значения и запишем их в таблице 2.2. Правильность расчета параметров уравнения регрессии может быть проверена с помощью сравнения сумм Изобразим полученное уравнение на графике – построим линию регрессии (рисунок 2.2).

Рисунок 2.2 Линия регрессии зависимости потребления хлеба и хлебопродуктов на душу населения РБ от располагаемых ресурсов на человека

 

Показателем силы влияния фактора на результат является коэффициент эластичности:

Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат от своей средней величины при изменении фактора на 1% от своего среднего значения. Для прямолинейной зависимости коэффициент эластичности рассчитывается по формуле

(2.10)

Для нашего примера коэффициент эластичности составит , т.е. при повышении располагаемых ресурсов на 1 человека в среднем на 1% потребление хлеба и хлебопродуктов на 1 человека увеличивается на 0,112%.

Практически всегда фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии. Чем меньше это отличие, тем ближе будут теоретические значения подходить к эмпирическим, следовательно, тем лучше подобрано уравнение регрессии. Аппроксимация (приближение) состоит в достаточно точном воспроизведении аналитической функцией фактических данных.

Чтобы оценить качество модели в целом, можно определить среднюю ошибку аппроксимации:

(2.11)

Модель считается подобранной достаточно хорошо, если средняя ошибка аппроксимации не превышает 8 – 10%.

Для нашего примера средняя ошибка аппроксимации составит (относительные ошибки аппроксимации для каждого наблюдения рассчитаны в таблице 2.2):

уравнение прямой линии достаточно хорошо отражает зависимость между изучаемыми явлениями.

Показателем тесноты прямолинейной корреляционной зависимости является коэффициент парной корреляции, показывающий, на какую часть своего среднего квадратического отклонения изменяется в среднем результативный признак при изменении факторного признака на одно среднее квадратическое отклонение. Коэффициент парной корреляции может рассчитываться по следующим тождественным формулам:

(2.12 – 2.14).

и могут быть определены так:

(2.15 – 2.16)

Коэффициент корреляции может принимать значения от 0 до -1 и от 0 до +1, т.е. Если коэффициент корреляции , то это означает полное отсутствие связи. Чем ближе коэффициент корреляции к 1, тем теснее связь между изучаемыми признаками. Если , то это максимально тесная связь, т.е. зависимость функциональная. Отрицательное значение коэффициента корреляции свидетельствует об обратной зависимости между фактором и результатом.

Для характеристики силы связи используют шкалу Чеддока.

Теснота связи Значение коэффициента корреляции при наличии:
прямой связи обратной связи
Слабая 0,1 – 0,3 (0,1) – (0,3)
Умеренная 0,3 – 0,5 (0,3) – (0,5)
Заметная 0,5 – 0,7 (0,5) – (0,7)
Высокая 0,7 – 0,9 (0,7) – (0,9)
Весьма высокая 0,9 – 0,99 (0,9) – (0,99)

Оценим тесноту линейной связи располагаемых ресурсов и потребления хлеба и хлебопродуктов на душу населения с помощью коэффициента корреляции:

- связь между уровнем располагаемых ресурсов и потреблением хлеба и хлебопродуктов высокая, прямая.

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции – коэффициент детерминации или 74,5%.

Это означает, что 74,5% вариации потребления хлеба и хлебопродуктов обусловлены различиями в уровне располагаемых доходов населения по децильным группам, остальные 25,5% вызваны прочими факторами, которые в данном случае не рассматриваются (допустим, в нашем случае ими могут быть количество мужчин в домохозяйстве – известно, что мужчины потребляют больше хлеба, чем женщины; численность населения, принципиально не потребляющие хлеба (например, соблюдающих диету и т.д.).

С помощью регрессионного анализа, когда построение функции регрессии осуществляется по данным выборки, можно получить оценки параметров зависимости. Однако они являются лишь оценками. Поэтому возникает вопрос о том, насколько они надежны, следовательно, оценки дополняются расчетом достоверности или значимости. Это объясняется возможной погрешностью, с которой определяются выборочные показатели относительно своих генеральных аналогов.

Оценка значимости уравнения регрессии в целом дается с помощью F- критерия Фишера. При этом выдвигается нулевая гипотеза (), что коэффициент регрессии равен нулю () и, следовательно, фактор не оказывает влияния на результат, и линия регрессии параллельна оси абсцисс.

Критерий Фишера рассчитывается по следующей формуле:

(2.17)

Если гипотеза подтверждается, то уравнение регрессии незначимо. Значение критерия Фишера для конкретного случая сравнивается с критическим (табличным). Если , тогда гипотеза отклоняется и делается вывод, что связь между и существенна и уравнение регрессии статистически значимо, т.е. фактор оказывает существенное влияние на результат. Если , тогда нулевая гипотеза принимается и делается вывод, что уравнение регрессии статистически незначимо, так как существует риск сделать неправильный вывод о наличии связи между и .

Фактическое значение критерия Фишера, равное 23,99, больше табличного, равного 5,32, следовательно, гипотеза о случайности различий факторной и остаточной дисперсии отклоняется. Эти различия существенны, статистически значимы, уравнение надежно, значимо, показатель тесноты связи надежен и отражает устойчивую зависимость потребления хлеба и хлебопродуктов на душу населения от уровня располагаемых душевых ресурсов на человека в 10 децильных группах населения РБ в 2008 г.

Между критерием Фишера и коэффициентом детерминации в модели парной линейной зависимости существует связь:

(2.18)

В нашем примере расчет по данной формуле:

В линейной регрессии оценивается не только значимость уравнения регрессии в целом, но и значимость его отдельных параметров, а также коэффициента корреляции с помощью статистического критерия Стьюдента..

Для того чтобы осуществить такую оценку, необходимо для параметров уравнения регрессии и коэффициента корреляции рассчитать стандартные ошибки (). Эти ошибки показывают, насколько достоверно данные выборки характеризуют всю генеральную совокупность.

(2.19)

(2.20–2.21)

Чтобы оценить существенность параметров, необходимо рассчитать для них фактические значения критериев Стьюдента . Для параметров и коэффициента корреляции критерий Стьюдента определяет соотношение между абсолютным значением параметра и его ошибкой:

(2.22 – 2.24)

Фактические значения критерия Стьюдента сравниваются с критическими (табличными) при определенном уровне значимости и числе степеней свободы По результатам этого сравнения принимаются или отвергаются нулевые гипотезы о незначимости параметров или коэффициента корреляции. Если фактическое значение критерия Стьюдента больше табличного, тогда гипотеза о незначимости отвергается. Подтверждение значимости коэффициента регрессии равнозначно подтверждению значимости уравнения регрессии в целом.

В нашем примере t -критерий для числа степеней свободы составит 2,3060.

следовательно, , являются статистически значимыми.

В парной линейной регрессии между критерием Фишера, критериями Стьюдента коэффициентов регрессии и корреляции существует связь:

(2.25)

В нашем примере

Имея исчисленные параметры уравнения регрессии и коэффициент парной линейной корреляции, не представляется возможным точно рассчитать уровень этих показателей в генеральной совокупности. В этом случае может идти речь с определенной вероятностью только о границах, в которых находятся параметры уравнения регрессии и коэффициент корреляции.

На основе стандартных ошибок параметров и табличных значений критерия Стьюдента можно рассчитать доверительные интервалы для параметров уравнения регрессии: где предельная ошибка параметра ;

предельная ошибка коэффициента регрессии ;

предельная ошибка коэффициента корреляции .

; или

;

Поскольку коэффициент регрессии имеет четкую экономическую интерпретацию, то доверительные границы интервала для него не должны содержать противоречивых оценок (не должны содержать положительные и отрицательные величины одновременно). В нашем примере это требование выполняется, т. е. и в генеральной совокупности (во всех домохозяйствах республики) в 2008 г. наблюдалось увеличение потребления хлеба и хлебопродуктов в зависимости от уровня располагаемых ресурсов на человека.

Коэффициент корреляции в любом случае должен находиться в пределах от -1 до +1. В нашем примере это требование нарушается, поэтому принимаем, что и в генеральной совокупности связь между изучаемыми признаками была высокой.

Используя уравнение регрессии, можно получить предсказываемое значение результата () с помощью точечного прогноза при заданном значении фактора , для этого надо просто подставить в уравнение соответствующее значение . Например, найдем потребление хлеба и хлебопродуктов в домохозяйстве, уровень располагаемых ресурсов на человека в котором на 5% больше среднего уровня по исследуемой совокупности: тыс. рублей на человека.

Рассчитаем точечное ожидаемое потребление хлеба и хлебопродуктов на душу населения в РБ, имея построенную модель зависимости:

кг на душу населения.

Однако, точечный прогноз практически нереален на практике, поскольку эконометрика изучает экономические явления и процессы, на которые могут воздействовать огромное количество различных причин. Поэтому дополнительно необходимо осуществлять определение ошибки прогнозирования , т.е. вероятные отклонения от точечного прогноза, рассчитанного по уравнению регрессии, и интервальную оценку прогнозного значения.

Стандартная ошибка прогнозирования рассчитывается по формуле:

Доверительный интервал для прогнозируемого значения рассчитывается:

, где предельная ошибка прогноза, которая в 95% случаев не будет превышена.

Доверительный интервал прогноза: , т.е. прогнозное значение потребления хлеба и хлебопродуктов человека, располагающего 12,21 тыс. руб. ресурсов в месяц, будет находиться в интервале кг. Это то интервальное значение потребления хлеба и хлебопродуктов при заданном прогнозном значении уровня располагаемых душевых ресурсов, который в 95 случаях из 100 подтвердится.

 







Дата добавления: 2015-08-12; просмотров: 1062. Нарушение авторских прав; Мы поможем в написании вашей работы!



Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...

Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...

Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

СПИД: морально-этические проблемы Среди тысяч заболеваний совершенно особое, даже исключительное, место занимает ВИЧ-инфекция...

Понятие массовых мероприятий, их виды Под массовыми мероприятиями следует понимать совокупность действий или явлений социальной жизни с участием большого количества граждан...

Тактика действий нарядов полиции по предупреждению и пресечению правонарушений при проведении массовых мероприятий К особенностям проведения массовых мероприятий и факторам, влияющим на охрану общественного порядка и обеспечение общественной безопасности, можно отнести значительное количество субъектов, принимающих участие в их подготовке и проведении...

Ученые, внесшие большой вклад в развитие науки биологии Краткая история развития биологии. Чарльз Дарвин (1809 -1882)- основной труд « О происхождении видов путем естественного отбора или Сохранение благоприятствующих пород в борьбе за жизнь»...

Этапы трансляции и их характеристика Трансляция (от лат. translatio — перевод) — процесс синтеза белка из аминокислот на матрице информационной (матричной) РНК (иРНК...

Условия, необходимые для появления жизни История жизни и история Земли неотделимы друг от друга, так как именно в процессах развития нашей планеты как космического тела закладывались определенные физические и химические условия, необходимые для появления и развития жизни...

Studopedia.info - Студопедия - 2014-2024 год . (0.009 сек.) русская версия | украинская версия