Студопедия — Линейной регрессии
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Линейной регрессии






  8,3 2,56 21,248 6,5536 68,89 9,18 10,6 82,2649 3,0976 0,7750
  8,9 3,70 32,930 13,6900 79,21 9,29 4,4 62,8849 1,3456 0,1528
  9,3 4,60 42,780 21,1600 86,49 9,38 0,8 49,4209 0,5776 0,0061
  9,9 5,74 56,826 32,9476 98,01 9,49 4,2 34,6921 0,0256 0,1691
  10,0 6,84 68,400 46,7856 100,00 9,60 4,0 22,9441 0,0036 0,1636
  11,1 8,30 92,130 68,8900 123,21 9,74 12,3 11,0889 1,0816 1,8575
  10,0 10,39 103,900 107,9521 100,00 9,94 0,6 1,5376 0,0036 0,0036
  10,0 14,31 143,100 204,7761 100,00 10,32 3,2 7,1824 0,0036 0,1024
  10,1 19,00 191,900 361,0000 102,01 10,78 6,7 54,3169 0,0016 0,4556
  13,0 40,82 530,660 1666,2724 169,00 12,89 0,8 852,0561 8,6436 0,0118
Итого 100,6 116,26 1283,874 2530,0274 1026,82 100,60 47,6 1178,3888 14,7840 3,6976
Среднее 10,06 11,63 128,39 253,00 102,68 10,06 4,76 117,84 1,48 0,37

 

Для уравнения зависимости потребления хлеба и хлебопродуктов от располагаемых ресурсов на человека система нормальных уравнений составит:

.

Решаем ее:

Рассмотрим вывод рабочих формул для расчета параметров и , имея в виду, что Тогда первое уравнение системы нормальных уравнений (2.3) можно записать в виде:

, (2.4)

сократить на : откуда получаем формулу

(2.5)

Умножим уравнение (2.4) на и вычтем из второго уравнения системы (2.3):

(2.6)

откуда (2.7)

Если в формулу (2.7) подставить то имеем

(2.8)

Формулы (2.5) и (2.8) удобны в том случае, если все средние уже вычислены.

Рассчитаем параметры уравнения по нашим данным с помощью данных формул, имея в виду, что

Итак,

отсюда, .

Также существует следующая формула для расчета :

(2.9)

Итак, уравнение парной линейной регрессии, описывающее зависимость потребления хлеба и хлебопродуктов от располагаемых ресурсов на человека, рассчитанное на основе выборочного обследования домохозяйств, сгруппированных по 10 децильным группам населения, имеет вид:

.

Параметр называется коэффициентом регрессии и показывает среднее изменение результата с изменением фактора на одну единицу его измерения. При - связь прямая (при увеличении фактора результат повышается, линия регрессии является возрастающей), при - обратная (при увеличении фактора результат уменьшается, линия регрессии имеет отрицательный наклон), при связь отсутствует. Коэффициент регрессии является именованной величиной, его значения не имеют ограничений.

В среднем по изучаемой нами совокупности (10 децильным группам населения РБ за 2008 г.) отклонение уровня располагаемых ресурсов от средней величины на 1 тыс. руб. приводило к отклонению среднего потребления хлеба и хлебопродуктов на 0,097 кг в среднем. В практическом анализе обычно говорят, что с повышением располагаемых ресурсов на 1 тыс. руб. на человека в среднем потребление хлеба и хлебопродуктов на человека увеличивается на 0,097 кг на человека в среднем. Связь прямая.

Параметр показывает значение результативного признака , если факторный признак . Он именуется свободным членом, в нем определенным образом отражается среднее влияние неучтенных факторов. В том случае, если признак-фактор не имеет или не может иметь нулевого значения, то такая трактовка свободного члена бессмысленна. Тогда говорят, что параметр экономического смысла не имеет.

По полученному уравнению определим теоретические (расчетные) значения и запишем их в таблице 2.2. Правильность расчета параметров уравнения регрессии может быть проверена с помощью сравнения сумм Изобразим полученное уравнение на графике – построим линию регрессии (рисунок 2.2).

Рисунок 2.2 Линия регрессии зависимости потребления хлеба и хлебопродуктов на душу населения РБ от располагаемых ресурсов на человека

 

Показателем силы влияния фактора на результат является коэффициент эластичности:

Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат от своей средней величины при изменении фактора на 1% от своего среднего значения. Для прямолинейной зависимости коэффициент эластичности рассчитывается по формуле

(2.10)

Для нашего примера коэффициент эластичности составит , т.е. при повышении располагаемых ресурсов на 1 человека в среднем на 1% потребление хлеба и хлебопродуктов на 1 человека увеличивается на 0,112%.

Практически всегда фактические значения результативного признака отличаются от теоретических, рассчитанных по уравнению регрессии. Чем меньше это отличие, тем ближе будут теоретические значения подходить к эмпирическим, следовательно, тем лучше подобрано уравнение регрессии. Аппроксимация (приближение) состоит в достаточно точном воспроизведении аналитической функцией фактических данных.

Чтобы оценить качество модели в целом, можно определить среднюю ошибку аппроксимации:

(2.11)

Модель считается подобранной достаточно хорошо, если средняя ошибка аппроксимации не превышает 8 – 10%.

Для нашего примера средняя ошибка аппроксимации составит (относительные ошибки аппроксимации для каждого наблюдения рассчитаны в таблице 2.2):

уравнение прямой линии достаточно хорошо отражает зависимость между изучаемыми явлениями.

Показателем тесноты прямолинейной корреляционной зависимости является коэффициент парной корреляции, показывающий, на какую часть своего среднего квадратического отклонения изменяется в среднем результативный признак при изменении факторного признака на одно среднее квадратическое отклонение. Коэффициент парной корреляции может рассчитываться по следующим тождественным формулам:

(2.12 – 2.14).

и могут быть определены так:

(2.15 – 2.16)

Коэффициент корреляции может принимать значения от 0 до -1 и от 0 до +1, т.е. Если коэффициент корреляции , то это означает полное отсутствие связи. Чем ближе коэффициент корреляции к 1, тем теснее связь между изучаемыми признаками. Если , то это максимально тесная связь, т.е. зависимость функциональная. Отрицательное значение коэффициента корреляции свидетельствует об обратной зависимости между фактором и результатом.

Для характеристики силы связи используют шкалу Чеддока.

Теснота связи Значение коэффициента корреляции при наличии:
прямой связи обратной связи
Слабая 0,1 – 0,3 (0,1) – (0,3)
Умеренная 0,3 – 0,5 (0,3) – (0,5)
Заметная 0,5 – 0,7 (0,5) – (0,7)
Высокая 0,7 – 0,9 (0,7) – (0,9)
Весьма высокая 0,9 – 0,99 (0,9) – (0,99)

Оценим тесноту линейной связи располагаемых ресурсов и потребления хлеба и хлебопродуктов на душу населения с помощью коэффициента корреляции:

- связь между уровнем располагаемых ресурсов и потреблением хлеба и хлебопродуктов высокая, прямая.

Для оценки качества подбора линейной функции рассчитывается квадрат линейного коэффициента корреляции – коэффициент детерминации или 74,5%.

Это означает, что 74,5% вариации потребления хлеба и хлебопродуктов обусловлены различиями в уровне располагаемых доходов населения по децильным группам, остальные 25,5% вызваны прочими факторами, которые в данном случае не рассматриваются (допустим, в нашем случае ими могут быть количество мужчин в домохозяйстве – известно, что мужчины потребляют больше хлеба, чем женщины; численность населения, принципиально не потребляющие хлеба (например, соблюдающих диету и т.д.).

С помощью регрессионного анализа, когда построение функции регрессии осуществляется по данным выборки, можно получить оценки параметров зависимости. Однако они являются лишь оценками. Поэтому возникает вопрос о том, насколько они надежны, следовательно, оценки дополняются расчетом достоверности или значимости. Это объясняется возможной погрешностью, с которой определяются выборочные показатели относительно своих генеральных аналогов.

Оценка значимости уравнения регрессии в целом дается с помощью F- критерия Фишера. При этом выдвигается нулевая гипотеза (), что коэффициент регрессии равен нулю () и, следовательно, фактор не оказывает влияния на результат, и линия регрессии параллельна оси абсцисс.

Критерий Фишера рассчитывается по следующей формуле:

(2.17)

Если гипотеза подтверждается, то уравнение регрессии незначимо. Значение критерия Фишера для конкретного случая сравнивается с критическим (табличным). Если , тогда гипотеза отклоняется и делается вывод, что связь между и существенна и уравнение регрессии статистически значимо, т.е. фактор оказывает существенное влияние на результат. Если , тогда нулевая гипотеза принимается и делается вывод, что уравнение регрессии статистически незначимо, так как существует риск сделать неправильный вывод о наличии связи между и .

Фактическое значение критерия Фишера, равное 23,99, больше табличного, равного 5,32, следовательно, гипотеза о случайности различий факторной и остаточной дисперсии отклоняется. Эти различия существенны, статистически значимы, уравнение надежно, значимо, показатель тесноты связи надежен и отражает устойчивую зависимость потребления хлеба и хлебопродуктов на душу населения от уровня располагаемых душевых ресурсов на человека в 10 децильных группах населения РБ в 2008 г.

Между критерием Фишера и коэффициентом детерминации в модели парной линейной зависимости существует связь:

(2.18)

В нашем примере расчет по данной формуле:

В линейной регрессии оценивается не только значимость уравнения регрессии в целом, но и значимость его отдельных параметров, а также коэффициента корреляции с помощью статистического критерия Стьюдента..

Для того чтобы осуществить такую оценку, необходимо для параметров уравнения регрессии и коэффициента корреляции рассчитать стандартные ошибки (). Эти ошибки показывают, насколько достоверно данные выборки характеризуют всю генеральную совокупность.

(2.19)

(2.20–2.21)

Чтобы оценить существенность параметров, необходимо рассчитать для них фактические значения критериев Стьюдента . Для параметров и коэффициента корреляции критерий Стьюдента определяет соотношение между абсолютным значением параметра и его ошибкой:

(2.22 – 2.24)

Фактические значения критерия Стьюдента сравниваются с критическими (табличными) при определенном уровне значимости и числе степеней свободы По результатам этого сравнения принимаются или отвергаются нулевые гипотезы о незначимости параметров или коэффициента корреляции. Если фактическое значение критерия Стьюдента больше табличного, тогда гипотеза о незначимости отвергается. Подтверждение значимости коэффициента регрессии равнозначно подтверждению значимости уравнения регрессии в целом.

В нашем примере t -критерий для числа степеней свободы составит 2,3060.

следовательно, , являются статистически значимыми.

В парной линейной регрессии между критерием Фишера, критериями Стьюдента коэффициентов регрессии и корреляции существует связь:

(2.25)

В нашем примере

Имея исчисленные параметры уравнения регрессии и коэффициент парной линейной корреляции, не представляется возможным точно рассчитать уровень этих показателей в генеральной совокупности. В этом случае может идти речь с определенной вероятностью только о границах, в которых находятся параметры уравнения регрессии и коэффициент корреляции.

На основе стандартных ошибок параметров и табличных значений критерия Стьюдента можно рассчитать доверительные интервалы для параметров уравнения регрессии: где предельная ошибка параметра ;

предельная ошибка коэффициента регрессии ;

предельная ошибка коэффициента корреляции .

; или

;

Поскольку коэффициент регрессии имеет четкую экономическую интерпретацию, то доверительные границы интервала для него не должны содержать противоречивых оценок (не должны содержать положительные и отрицательные величины одновременно). В нашем примере это требование выполняется, т. е. и в генеральной совокупности (во всех домохозяйствах республики) в 2008 г. наблюдалось увеличение потребления хлеба и хлебопродуктов в зависимости от уровня располагаемых ресурсов на человека.

Коэффициент корреляции в любом случае должен находиться в пределах от -1 до +1. В нашем примере это требование нарушается, поэтому принимаем, что и в генеральной совокупности связь между изучаемыми признаками была высокой.

Используя уравнение регрессии, можно получить предсказываемое значение результата () с помощью точечного прогноза при заданном значении фактора , для этого надо просто подставить в уравнение соответствующее значение . Например, найдем потребление хлеба и хлебопродуктов в домохозяйстве, уровень располагаемых ресурсов на человека в котором на 5% больше среднего уровня по исследуемой совокупности: тыс. рублей на человека.

Рассчитаем точечное ожидаемое потребление хлеба и хлебопродуктов на душу населения в РБ, имея построенную модель зависимости:

кг на душу населения.

Однако, точечный прогноз практически нереален на практике, поскольку эконометрика изучает экономические явления и процессы, на которые могут воздействовать огромное количество различных причин. Поэтому дополнительно необходимо осуществлять определение ошибки прогнозирования , т.е. вероятные отклонения от точечного прогноза, рассчитанного по уравнению регрессии, и интервальную оценку прогнозного значения.

Стандартная ошибка прогнозирования рассчитывается по формуле:

Доверительный интервал для прогнозируемого значения рассчитывается:

, где предельная ошибка прогноза, которая в 95% случаев не будет превышена.

Доверительный интервал прогноза: , т.е. прогнозное значение потребления хлеба и хлебопродуктов человека, располагающего 12,21 тыс. руб. ресурсов в месяц, будет находиться в интервале кг. Это то интервальное значение потребления хлеба и хлебопродуктов при заданном прогнозном значении уровня располагаемых душевых ресурсов, который в 95 случаях из 100 подтвердится.

 







Дата добавления: 2015-08-12; просмотров: 1055. Нарушение авторских прав; Мы поможем в написании вашей работы!



Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Вопрос 1. Коллективные средства защиты: вентиляция, освещение, защита от шума и вибрации Коллективные средства защиты: вентиляция, освещение, защита от шума и вибрации К коллективным средствам защиты относятся: вентиляция, отопление, освещение, защита от шума и вибрации...

Задержки и неисправности пистолета Макарова 1.Что может произойти при стрельбе из пистолета, если загрязнятся пазы на рамке...

Вопрос. Отличие деятельности человека от поведения животных главные отличия деятельности человека от активности животных сводятся к следующему: 1...

Оценка качества Анализ документации. Имеющийся рецепт, паспорт письменного контроля и номер лекарственной формы соответствуют друг другу. Ингредиенты совместимы, расчеты сделаны верно, паспорт письменного контроля выписан верно. Правильность упаковки и оформления....

БИОХИМИЯ ТКАНЕЙ ЗУБА В составе зуба выделяют минерализованные и неминерализованные ткани...

Типология суицида. Феномен суицида (самоубийство или попытка самоубийства) чаще всего связывается с представлением о психологическом кризисе личности...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия