Студопедия — КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

КОРРЕЛЯЦИОННО-РЕГРЕССИОННЫЙ АНАЛИЗ






Корреляционный анализ изучает стохастические связи между случайными величинами в экономике. Метод корреляции применяется для того, чтобы при сложном взаимодействии посторонних влияний выявить зависимость между результатом и факторами в том случае, если посторонние факторы не изменялись и не искажали основную зависимость. При этом число наблюдений должно быть достаточно велико, так как малое число наблюдений не позволяет обнаружить закономерность связи. Укрупненно можно рекомендовать: число наблюдений равно восьмикратному числу факторов, включенных в модель.

Качественно теснота связи определяется с помощью линейного коэффициента корреляции (при линейной форме связи) и индекса корреляции (при нелинейной). Линейный коэффициент корреляции может быть определен по формуле:

или

.

Он изменяется в диапазоне от -1 до +1. положительный коэффициент характеризует прямую связь, отрицательный – обратную. Связь между факторным и результативным признаком можно признать тесной, если r>0,7.

Индекс корреляции может рассчитываться по формуле:

,

Индекс корреляции изменяется от 0 до 1.

Использование метода корреляционного анализа направлено на решение таких задач, как установление количественной меры тесноты связи между двумя случайными величинами, близости этой связи к линейной, оценки достоверности и точности планов; выяснение внутренних взаимосвязей между переменными комплекса; построение многомерных функций связи переменных; выделение минимального числа характеристик, описывающих объект с достаточной степенью точности.

Регрессионный анализ тесно связан с корреляционным анализом. В то же время регрессионный анализ предъявляет менее жесткие требования к исходной информации. В качестве зависимой переменной в регрессионном анализе используется случайная переменная, а в качестве независимой – неслучайная. Этот анализ дает возможность установить, как, в среднем, изменяется результативный признак под влиянием одного или нескольких факторных. При изучении влияния одних признаков явлений на другие из цепи признаков, характеризующих данное явление, выделяются факторные и результативные. Предварительно устанавливается, какие из признаков факторные, а какие результативные, их выделение ведется прежде всего логическим анализом. Самое общее представление о связи двух или нескольких признаков дает группировка, в которой факторный признак кладется в основу группировки и рассчитывается, как факторный признак влияет на результативный.

Независимо от того, как выполняется корреляционно-регрессионный анализ (вручную или на ПЭВМ) расчеты его должны быть описаны и представлены в следующей последовательности:

а) отбор факторных признаков;

б) логический анализ факторных признаков;

в) определение существенности связи между результативным признаком и факторными (парная корреляция). Для линейной модели коэффициенты корреляции находятся по любой из формул линейного коэффициента корреляции, для криволинейных моделей используется индекс корреляции;

г) оценка существенности связи на основе t – критерия Стьюдента (при оценке параметров) или F – критерия Фишера (при оценке уравнения регрессии).

для линейной формы связи,

для криволинейной формы связи,

где k – число параметров.

Рассчитанные критерии сравниваются с теоретическими их значениями для t -критерия Стьюдента при V = n -2 числе степеней свободы и выбранном уровне значимости, для F -критерия-при числе степеней свободы V1 = n - k, V2 = k -1.

В результате данной процедуры студент делает заключение о том, какие факторы следует исключить, а какие использовать в дальнейшем исследовании;

д) определение зависимости между факторными признаками и результативным (парная регрессия), при этом должны быть рассмотрены как линейные, так и криволинейные зависимости:

линейная ,

парабола ,

гипербола ,

степенная ,

показательная ,

экспоненциальная ,

и др.;

е) нахождение аппроксимирующего уравнения, для чего определяется средняя ошибка аппроксимации

.

По наименьшей средней ошибке отбирается для дальнейшего исследования та или иная модель;

ж) установление зависимости между оставшимися парами факторов (х1 и х2; х2 и х3 и др.) аналогично пункту «в». Это необходимо для того чтобы установить форму связи для множественной регрессии. Если между парами факторов аппроксимирующим уравнением будет линейное, то и уравнение множественной регрессии будет линейным.

з) определение существенности связи между парами факторов аналогично пункту «е». Этот этап необходим для определения мультиколлинеарности между факторами. Если между парами факторов связь будет существенной, то это означает, что влияние одного фактора выражается через другой, поэтому один из них следует исключить из дальнейших расчетов. Например, рассматриваются факторы фондовооруженности труда и механовооруженности труда. Оба фактора оказались существенны и при их рассмотрении в пункте е были включены дальнейшее исследование, а на данном этапе они оказались мультиколлинеарны. Следовательно, один из них следует исключить. Какой? Тот, у которого меньше коэффициент парной корреляции с результативным признаком. Таким образом, данный этап позволяет окончательно отсеять факторные признаки;

и) найти уравнение множественной регрессии, в случае линейной связи:

у = а + b1 х1 + b2 х2 +……+bnxn

к) оценить среднюю ошибку аппроксимации и достоверность параметров уравнения;

л) найти существенность связи между результативным признаком и факторными, включенными в модель, на основе совокупного коэффициента множественной корреляции R;

м) оценить существенность совокупного коэффициента множественной корреляции на основе F -критерия Фишера:

При выполнении расчетов на ПЭВМ студент обязан интерпретировать компьютерный расчет.

Пример.

На основе результатов регрессионного анализа, выполненного с помощью MS Excel (Приложение Ж) сделаем следующие выводы.

Параметризованное уравнение

у = 9,3872 + 0,1285 х1 + 0, 6117 х2

Параметр а = 9,3872 - начальная точка отсчета, обусловленная влиянием других факторов, не учтенных в данной модели, параметр b1 = 0,1285 показывает, что если фактор х1 увеличить на единицу, то у увеличится на 0,1285, знак плюс при параметре свидетельствует о наличии прямой связи.

Параметр b2 = 0,6117 показывает, что если фактор х2 увеличить на единицу, то у увеличится на 0,6117.

Оценка параметров уравнения регрессии показала, что расчетное значение t -критерия Стьюдента tb при семи степенях свободы и 5% уровня значимости, составило 4,448.

Табличное значение t -критерия, для семи степеней свободы и 5% уровня значимости составило tтабл =2,36 tрасчет = 4,448 > tтабл =2,36, что свидетельствует о существенности фактора х1. Оценка параметра b2 показала, что расчетное значение t -критерия - tc = 3,0356. При сравнении этой величины с табличной видно, что tрасчет = 3,0356> tтабл = 2,36 при семи степенях свободы и 5% уровня значимости, следовательно и параметр b2 так же является существенным.

Расчетное значение параметра a так же больше табличного 3,718>2,36, следовательно, параметр а является существенным.

Выявление недостаточной существенности факторов х1 и х2 , сделанный на основе t -критерия и частных коэффициентов детерминации приводит к необходимости ввода дополнительных факторов в аппроксимирующую модель.

Еще одним показателем качества подобранной модели традиционно считается коэффициент множественной корреляции. В нашем случае он равен 0,9384, что характеризует тесную связь между y и двумя факторными признаками. Чтобы оценить степень совокупного влияния факторов х1 и х2 на у воспользуемся коэффициентом детерминации (R2) измеряемым в процентах (R-квадрат), он равен 0,8806, что означает что 88,06% вариации у обусловлено факторами, отобранными в модель. Чем ближе R2 к 100%, тем лучше подобранная модель описывает данные эксперимента.

В нашем случае влияние этих факторов значительно, но не приближено к 100%, что подтверждает вывод: во-первых, можно рассматривать включение в модель еще одного - двух факторов, а во-вторых, необходимо проверить данные эксперимента. Для проверки гипотезы о равенстве коэффициента b нулю (об адекватности предлагаемой модели) в программе имеется дисперсионный анализ.

Назначение таблицы дисперсионного анализа - дать ответ о наличии значимого влияния уровней факторов на исследуемый отклик (результативный признак).

SS - сумма квадратов;

d.f. - степени свободы;

MS - средние квадраты;

F - отношение, рассматривается как частное от деления средних квадратов, обусловленных факторами на средние квадраты остатков;

Значимость F - в данном случае минимальный уровень значимости соответствующего F - отношения.

Таким образом, факторный и остаточный анализ дисперсий показал, что при уровне значимости = 0,05, числе степеней свободы числителя V = 2 и знаменателя V =7 F = 25,819 > Fтабл = 4,74, следовательно, гипотеза об отсутствии влияния фактора на результативный признак должна быть отвергнута т. е. связь имеется, что и подтверждается значением 0,0005877, т. к. обычно, если эта величина близка к нулю, есть основание отвергнуть нулевую гипотезу и делаем окончательный вывод от адекватности полученной модели экспериментальным данным.







Дата добавления: 2015-09-18; просмотров: 526. Нарушение авторских прав; Мы поможем в написании вашей работы!



Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Виды и жанры театрализованных представлений   Проживание бронируется и оплачивается слушателями самостоятельно...

Что происходит при встрече с близнецовым пламенем   Если встреча с родственной душой может произойти достаточно спокойно – то встреча с близнецовым пламенем всегда подобна вспышке...

Реостаты и резисторы силовой цепи. Реостаты и резисторы силовой цепи. Резисторы и реостаты предназначены для ограничения тока в электрических цепях. В зависимости от назначения различают пусковые...

Ситуация 26. ПРОВЕРЕНО МИНЗДРАВОМ   Станислав Свердлов закончил российско-американский факультет менеджмента Томского государственного университета...

Различия в философии античности, средневековья и Возрождения ♦Венцом античной философии было: Единое Благо, Мировой Ум, Мировая Душа, Космос...

Характерные черты немецкой классической философии 1. Особое понимание роли философии в истории человечества, в развитии мировой культуры. Классические немецкие философы полагали, что философия призвана быть критической совестью культуры, «душой» культуры. 2. Исследовались не только человеческая...

Studopedia.info - Студопедия - 2014-2024 год . (0.008 сек.) русская версия | украинская версия