Студопедия — Корреляционно-регрессионный анализ
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Корреляционно-регрессионный анализ






Условиями правильного использования методов теории кор­реляции являются следующие:

а) наличие однородности тех единиц, которые подлежат ис­следованию (например, отбор предприятий, которые выпускают однотипную продукцию, имеют одинаковый характер техноло­гии и тип оборудования и т. п.);

б) достаточно большое количество наблюдений, при которых мы погашаем влияние случайностей на результативный признак и имеет силу закон больших чисел;

в) нормальный характер распределения результативного при­знака, на котором построены все положения теории корреляции.

 

 

СХЕМА ПОСТРОЕНИЯ УРАВНЕНИЯ ПАРНОЙ РЕГРЕССИИ

Рисунок 9.2. Построение парной регрессии.

 

В основе теории корреляции лежит корреляционно-регресси­онный анализ (КРА), суть которого заключается в выборе вида уравнения регрессии

Y=f(x) (1)

В вычислении его параметров и уста­новлении адекватности (соответствия) теоретической зависимос­ти фактическим данным, представленным в табличном фор­ме. Наличие такой теоретической зависимости значительно об­легчает анализ экономических явлений, дает возможность уста­новления прогноза на будущее.

 

Наиболее часто для характеристики корреляционной связи между признаками применяют такие виды уравнений парной рег­рессии, или корреляционных уравнений:

а) линейный Y = а0 + a1 х; (2)

б) параболический Y= a0 + atx2 (3)

в) гиперболический Y = а0 + а1 /x (4)

г) степенной, Y = а0 хn и др. (5)
где ао, a1— параметры уравнений регрессии, которые подлежат определению.

Параметры aj. (j=l m) в уравнениях регрессии определя­ются методом наименьших квадратов Уравнение (2) является линейным относительно факторного признака.х и линия регрессии, которая отвечает функции такого вида, будет прямой; уравнения (3) —- (5) — нелинейные и линии регрессии будут соответственно параболой (3), гиперболой (4), степенной линией (5). Соответствующими преобразованиями не­линейные уравнения можно свести к линейной форме, так как клас­сическая теория корреляции является по своей сути линейной.

Этот метод наи­лучшим образом отвечает корреляционной таблице и допускает нахождение таких значений параметров уравнения регрессии, при которых сумма квадратов отклонений табличных (фактических) значений результативного признака у от теоретических значений У по линии регрессии была бы минимальной:

S = ∑ (y-Y)2 =min,

Функция S параметров уравнения регрессии аi будет минималь­ной тогда, когда выполняются необходимые условия нахождения экстремума этой функции — равенство нулю первых производ­ных функции по разыскиваемым параметрам:

∂ S / ∂ a0 = 0 ∂ S / ∂ a1 = 0

Из этих условий формируется система нормальных уравне­ний для нахождения параметров аа и аг

В случае линейного вида уравнения регрессии (2), которое отвечает линейной зависимости между признаками, а система нормальных уравнений записывается в виде:

na0 + a1∑ x =∑ y:

a0 ∑ xi + a1∑ x2 = ∑ xy

где n — количество единиц совокупности (то есть заданных пар значений.v и у).

Решив эту систему, находим такие значения параметров:

a0 = (∑ y∑ x2 - ∑ xy∑ x) / (n∑ x2 - ∑ x∑ x);

a1 = (n∑ yx - ∑ y∑ x) / (n∑ x2 - ∑ x∑ x);

или а0 = yср – a1xср; a1 = ((xy)ср – xср yср) / (xср 2-(xср)2)

 

Параметр а1 называется коэффициентом регрессии и показывает изменение результативного признака У при изменении факторного признака х на единицу; геометрически параметр а, отвечает углу наклона (в радианах) прямой линии регрессии к горизонтальной оси.

Для оценки влияния факторного признака на результативный может рассчитываться коэффициент эластичности в среднем для всей совокупности:

Ке = а1хср /y

где х, у - средние величины фактических данных соответствен­но по факторному и результативному признаку в целом для сово­купности.

 

Ø Коэффициент эластичности показывает, на сколько процен­тов в среднем изменится результативный признак при изменении факторного признака на 1%.

Эх = аi хi ср/ yср

где аi – коэффициент регрессии при соответствующем факторном признаке

хi ср = среднее значение соответствующего факторного признака

yср – среднее значение результативного признака.

 

Теснота связи количественно выражается величиной коэффициентов корреляции.. Коэффициенты корреляции, представляя количественную характеристику тесноты связи между признаками, дают возможность определить «полезность» факторных признаков при построении уравнений множественной регрессии. Величина коэффициента корреляции служит также оценкой соответствия уравнения регрессии выявленным причинно-следственным связям.

Ø Коэффициент корреляции (корреляционное отношение) пока­зывает, насколько значительным является влияние признака х на Y. Коэффициент корреляции рассчитывается по формуле:

R =√ R2

Он находится в диапазоне 0 < R < 1; чем более близок R к единице, тем теснее корреляционная связь между признаками.

Иногда коэффициент корреляции рассчитывают по формуле, которую можно представить в виде:

R1 =√ ∑ (1- (y-Y)2 / (∑ y-ÿ)2 )

В случае линейной связи между Y и х величина линейного ко­эффициента корреляции определяется по формуле:

rxy = ((∑ xy - ∑ x∑ y/n) /√ [∑ х2-(∑ х)2/n] [∑ y2-(∑ y)2/n].

или rxy = (σ 2x + σ 2y + σ 2x-y) / 2 σ x σ y

Значение r лежит в диапазоне -1 = r = +1. При г = 0 не суще­ствует линейной корреляционной связи. Степень тесноты их ли­нейной зависимости растет при приближении к ±1. Когда r > О связь между признаками прямая (при росте х растет У), при r < 0— обратная (при росте х уменьшается Y).

Принято считать, если коэффициент корреляции:

 

до ±0, 3 – практически отсутствует ±0, 3 - ±0, 5 - связь слабая ±0, 5 до ±0, 7 – связь средней силы (умеренная) ± 0, 7 - ±1 связь сильная

 

Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость:

rxy = аi σ xi / σ y

После установления тесноты связи дают оценку з начимости связи между признаками. Под термином «значимость связи» по­нимают оценку отклонения выборочных переменных от своих зна­чений в генеральной совокупности посредством статистических критериев. Оценку значимости связи осуществляют с использо­ванием F-критерия. Для парной регрессии (линейной и нелинейной) F-критерий Фишера рассчитывается по формуле:

F =∑ (Y - ÿ)2 /1: (∑ y-Y)2 /(n-2)

где [l, (п - 2)] — число степеней свободы числителя и знаменате­ля зависимости.

Если F > Fтабл., то выборочная совокупность и связь между признаками является значимой

 

Построение модели множественной регрессии

1. Выбор формы связи (уравнения регрессии)

2. Отбор факторных признаков для включения в модель

(Матрица парных коэффициентов корреляции

Проверка значимости парных коэффициентов корреляции на основе t-критерия Стьюдента

Анализ матрицы парных коэффициентов корреляции на наличие мультиколлениарности)

3. Построение уравнения многофакторной регрессии (Метод наименьших квадратов или Пошаговый регрессионный анализ)

4. Проверка значимости коэффициентов регрессии на основе t-критерия Стьюдента

5. Проверка значимости уравнения регрессии по F-критерию Фишера-Снедекора

6. Статистически значимое уравнение регрессии, содержащее статистически значимые параметры

7. Экономическая интерпретация, формулировка выводов и предложений

 

Cистема нормальных уравнений записывается в виде:

na0 + a1∑ x1 + a2∑ x2 =∑ Y:

a0 ∑ xi + a1∑ x12 + a2∑ x1x2 = ∑ x1Y

a0 ∑ x2 + a1∑ x1x2 + a2∑ x22 = ∑ x2Y

Множественный коэффициент корреляции по определению положителен

0≤ R≤ 1

 

Ø t-критерия Стьюдента tp = /ai/: √ σ 2ai

σ 2ai – дисперсия коэффициента регрессии

Для парной линейной регрессии при г = R вычисляются по формуле:

t = √ (n-2)/(1-R2)

где (n-2) — число степеней свободы.

Если t> tтабл, то линейный коэффициент корреляции является значимым при характеристике генеральной совокупности

 

Ø Коэффициент взаимной сопряженности Крамера (при mx ≠ my)

C = √ χ 2 / n√ (m min -1)

где mmin— минимальное число групп (mx или my).

 

Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп применяются коэффициента ассоциации Д. Юлаи коэффициента контингенции К. Пирсона

 

а b а +b
с d c+d
а + с b+d a+b + с + d

Ø Коэффициент ассоциации (Д.Юла):

Ø Коэффициент контингенции (К.Пирсона):

Коэффициент контингенции всегда меньше коэффициента ассоциации. вязь считается подтвержденной, если Ка≥ 0, 5 или Кк≥ 0, 3.

Ранжирорвание – это процедура упорядочения объектов изучения, которая выполняется на основе предпочтения.

Ранг – это порядковый номер значений признака, расположенных в порядке возрастания или убывания величин.

Если значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической от соответствующих номеров мест, которые определяют. Данные ранги называют связными.

Ø Коэффициент ранговой корреляции Спирмена:

где di2 - квадрат разности рангов величин X и Y; n - число наблюдений (пар рангов).

Ø Ранговый коэффициент корреляции Кендалла (τ)

τ xy = 2S / n(n-1)

n – число наблюдений;

S – сумма разностей между числом последовательностей и числом инверсий по второму признаку.

Связь можно признать статистически значимой, если значения коэффициентов ранговой корреляции > 0, 5.

 

Ø Коэффициент конкордации (множественный коэффициент ранговой корреляции)

W = 12S / m2(n3 – n)

m – количество факторов, n - число наблюдений; S – отклонение суммы квадратов рангов от средней квадратов рангов.

 







Дата добавления: 2014-11-12; просмотров: 1133. Нарушение авторских прав; Мы поможем в написании вашей работы!



Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Понятие массовых мероприятий, их виды Под массовыми мероприятиями следует понимать совокупность действий или явлений социальной жизни с участием большого количества граждан...

Тактика действий нарядов полиции по предупреждению и пресечению правонарушений при проведении массовых мероприятий К особенностям проведения массовых мероприятий и факторам, влияющим на охрану общественного порядка и обеспечение общественной безопасности, можно отнести значительное количество субъектов, принимающих участие в их подготовке и проведении...

Тактические действия нарядов полиции по предупреждению и пресечению групповых нарушений общественного порядка и массовых беспорядков В целях предупреждения разрастания групповых нарушений общественного порядка (далееГНОП) в массовые беспорядки подразделения (наряды) полиции осуществляют следующие мероприятия...

Гносеологический оптимизм, скептицизм, агностицизм.разновидности агностицизма Позицию Агностицизм защищает и критический реализм. Один из главных представителей этого направления...

Функциональные обязанности медсестры отделения реанимации · Медсестра отделения реанимации обязана осуществлять лечебно-профилактический и гигиенический уход за пациентами...

Определение трудоемкости работ и затрат машинного времени На основании ведомости объемов работ по объекту и норм времени ГЭСН составляется ведомость подсчёта трудоёмкости, затрат машинного времени, потребности в конструкциях, изделиях и материалах (табл...

Studopedia.info - Студопедия - 2014-2024 год . (0.008 сек.) русская версия | украинская версия