Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Методические указания. Множественная регрессия — уравнение связи с несколькими независимыми переменными:





Множественная регрессия — уравнение связи с несколькими независимыми переменными:

,

где у — зависимая переменная (результативный фактор);

, — независимые, или объясняющие, переменные (факторы).

Наиболее распространенной в эконометрике является линейная модель множественной регрессии:

,

где — параметры уравнения регрессии;

— случайная ошибка.

По выборке ограниченного объема оценивается выборочное уравнение регрессии:

(1)

где — оценки параметров соответственно.

Данные выборки можно представить в матричной форме:

— вектор значений зависимой переменной размерности ;

— значение переменной в наблюдении , ;

матрица значений независимых переменных размерности , — значения переменных в наблюдении . Первый столбец этой матрицы является единичным, так как в уравнении (1) присутствует свободный член;  

вектор оценок параметров модели размерности .  

Для оценки параметров модели применяется метод наименьших квадратов (МНК). Для линейных и нелинейных уравнений, приводимых к линейным, получают систему из линейного уравнения с неизвестными. Количество уравнений равняется количеству неизвестных переменных, поэтому решение системы можно найти, например, с помощью метода Крамера.

Для двухфакторной модели данная система будет иметь вид:

(2)

Формулы Крамера:

(3)

где — определитель системы;

— частные определители, которые получают путем замены соответствующего столбца матрицы определителя системы столбцом свободных членов.

Решением системы нормальных уравнений в матричной форме будет вектор оценок:

. (4)

По уравнению регрессии могут быть найдены средние коэффициенты эластичности

, (5)

которые показывают, на сколько процентов в среднем изменится результат при изменении соответствующего фактора на 1% при фиксированном значении других факторов.

Адекватность построенной модели в целом оценивает коэффициент множественной детерминации R 2, который измеряет долю дисперсии, совместно объясненной независимыми переменными, и определяется по формуле

, (6)

где — общая дисперсия результативного фактора;

var (e) = — остаточная дисперсия.

Скорректированный коэффициент множественной детерминации содержит поправку на число степеней свободы и дает такую оценку тесноты связи, которая не зависит от числа факторов в модели. Он рассчитывается по формулам (7) или (8)

(7)

(8)

где m — число независимых факторов;

n — число наблюдений.

Чем больше величина m, тем сильнее различия и .

Оценивание качества уравнения регрессии в целом состоит в проверке гипотезы Н0 остатистической незначимости уравнения регрессии. Для этого выполняется сравнение фактического Fфакт и критического Fкрит значений критерия Фишера. Fфакт рассчитывается по формуле

, (9)

где m — число параметров при переменных х (в линейной регрессии совпадает с числом включенных в модель факторов); n — число наблюдений.

Вычисленный критерий Fфакт сравнивается с критическим значением Fкрит, найденным по двум степеням свободы: ν 1 = m, ν 2 = n – m – 1, уровню значимости a.

Если Fфакт < Fкрит, то гипотеза Н0 принимается и признается статистическая незначимость, ненадежность уравнения регрессии.

Если Fфакт > Fкрит, то гипотеза Н0 о случайной природе оцениваемых характеристик отвергается, признается статистическая значимость уравнения, оно может быть использовано для объяснения изменения переменной y под влиянием изменения переменной x.

Квадратный корень из коэффициента множественной детерминации называется коэффициентом множественной корреляции.

Границы изменения коэффициента множественной корреляции – от 0 до 1. Чем ближе его значение к 1, тем теснее связь результативного признака со всем набором исследуемых факторов.

Несмещенной оценкой дисперсии случайной ошибки является величина (остаточная дисперсия на одну степень свободы):

. (10)

Величина называется стандартной ошибкой регрессии.

Для расчета стандартных ошибок коэффициентов регрессии применяются формулы:

, (11)

где индексом обозначен элемент матрицы , стоящий на главной диагонали (нумерацию строк начинают с 0). Значимость коэффициента регрессии оценивается с помощью -критерия Стьюдента:

. (12)

Найденные значения затем сравниваются с табличными значениями при заданном уровне значимости и числе степеней свободы . Если , то коэффициент признаётся незначимым, если , то коэффициент регрессии является статистически значимым, надежным.

При линейной зависимости коэффициент множественной корреляции можно определить через матрицу парных коэффициентов корреляции:

, (13)

где

(14)

— определитель матрицы парных коэффициентов корреляции;

(15)

— определитель матрицы межфакторной корреляции. В случае двух факторов формулы (14) и (15) примут вид:

; (16)

. (17)

При построении уравнения множественной регрессии может возникнуть проблема мультиколлинеарности факторов. Для оценки ее наличия может использоваться определитель матрицы коэффициентов межфакторной корреляции (15). Чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И наоборот, чем ближе к 1 определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов.

Ранжирование факторов, участвующих во множественной линейной регрессии, может быть достигнуто с помощью частных коэффициентов корреляции (для линейных связей), которые характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии.

При двух факторах формулы для расчета частных коэффициентов корреляции примут вид:

; . (18)

Мерой для оценки включения фактора в модель служит частный
-критерий, т.е. .

Фактическое значение частного F- критерия сравнивается с критическим при уровне значимости a и числе степеней свободы: ν 1 = 1 и ν 2 =
= n – m – 1. Если фактическое значение превышает , то дополнительное включение фактора в модель статистически оправдано и коэффициент чистой регрессии при факторе статистически значим. Если же фактическое значение меньше табличного, то дополнительное включение в модель фактора не увеличивает существенно долю объясненной дисперсии признака у, следовательно, нецелесообразно его включение в модель; коэффициент регрессии при данном факторе в этом случае статистически незначим.

Для двухфакторного уравнения частные F -критерии имеют вид:

, . (19)

С помощью частного F- критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор вводился в уравнение множественной регрессии последним.

 

 







Дата добавления: 2014-11-10; просмотров: 828. Нарушение авторских прав; Мы поможем в написании вашей работы!




Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...


Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...


Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...


ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Различие эмпиризма и рационализма Родоначальником эмпиризма стал английский философ Ф. Бэкон. Основной тезис эмпиризма гласит: в разуме нет ничего такого...

Индекс гингивита (PMA) (Schour, Massler, 1948) Для оценки тяжести гингивита (а в последующем и ре­гистрации динамики процесса) используют папиллярно-маргинально-альвеолярный индекс (РМА)...

Методика исследования периферических лимфатических узлов. Исследование периферических лимфатических узлов производится с помощью осмотра и пальпации...

Понятие и структура педагогической техники Педагогическая техника представляет собой важнейший инструмент педагогической технологии, поскольку обеспечивает учителю и воспитателю возможность добиться гармонии между содержанием профессиональной деятельности и ее внешним проявлением...

Репродуктивное здоровье, как составляющая часть здоровья человека и общества   Репродуктивное здоровье – это состояние полного физического, умственного и социального благополучия при отсутствии заболеваний репродуктивной системы на всех этапах жизни человека...

Случайной величины Плотностью распределения вероятностей непрерывной случайной величины Х называют функцию f(x) – первую производную от функции распределения F(x): Понятие плотность распределения вероятностей случайной величины Х для дискретной величины неприменима...

Studopedia.info - Студопедия - 2014-2025 год . (0.009 сек.) русская версия | украинская версия