Студопедия — Корреляционно-регрессионный анализ
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Корреляционно-регрессионный анализ






Условиями правильного использования методов теории кор­реляции являются следующие:

а) наличие однородности тех единиц, которые подлежат ис­следованию (например, отбор предприятий, которые выпускают однотипную продукцию, имеют одинаковый характер техноло­гии и тип оборудования и т. п.);

б) достаточно большое количество наблюдений, при которых мы погашаем влияние случайностей на результативный признак и имеет силу закон больших чисел;

в) нормальный характер распределения результативного при­знака, на котором построены все положения теории корреляции.

 

 

СХЕМА ПОСТРОЕНИЯ УРАВНЕНИЯ ПАРНОЙ РЕГРЕССИИ

Рисунок 9.2. Построение парной регрессии.

 

В основе теории корреляции лежит корреляционно-регресси­онный анализ (КРА), суть которого заключается в выборе вида уравнения регрессии

Y=f(x) (1)

В вычислении его параметров и уста­новлении адекватности (соответствия) теоретической зависимос­ти фактическим данным, представленным в табличном фор­ме. Наличие такой теоретической зависимости значительно об­легчает анализ экономических явлений, дает возможность уста­новления прогноза на будущее.

 

Наиболее часто для характеристики корреляционной связи между признаками применяют такие виды уравнений парной рег­рессии, или корреляционных уравнений:

а) линейный Y = а0 + a1 х; (2)

б) параболический Y= a0 + atx2 (3)

в) гиперболический Y = а0 + а1 /x (4)

г) степенной, Y = а0 хn и др. (5)
где ао, a1— параметры уравнений регрессии, которые подлежат определению.

Параметры aj. (j=l m) в уравнениях регрессии определя­ются методом наименьших квадратов Уравнение (2) является линейным относительно факторного признака.х и линия регрессии, которая отвечает функции такого вида, будет прямой; уравнения (3) —- (5) — нелинейные и линии регрессии будут соответственно параболой (3), гиперболой (4), степенной линией (5). Соответствующими преобразованиями не­линейные уравнения можно свести к линейной форме, так как клас­сическая теория корреляции является по своей сути линейной.

Этот метод наи­лучшим образом отвечает корреляционной таблице и допускает нахождение таких значений параметров уравнения регрессии, при которых сумма квадратов отклонений табличных (фактических) значений результативного признака у от теоретических значений У по линии регрессии была бы минимальной:

S = ∑ (y-Y)2 =min,

Функция S параметров уравнения регрессии аi будет минималь­ной тогда, когда выполняются необходимые условия нахождения экстремума этой функции — равенство нулю первых производ­ных функции по разыскиваемым параметрам:

∂ S / ∂ a0 = 0 ∂ S / ∂ a1 = 0

Из этих условий формируется система нормальных уравне­ний для нахождения параметров аа и аг

В случае линейного вида уравнения регрессии (2), которое отвечает линейной зависимости между признаками, а система нормальных уравнений записывается в виде:

na0 + a1∑ x =∑ y:

a0 ∑ xi + a1∑ x2 = ∑ xy

где n — количество единиц совокупности (то есть заданных пар значений.v и у).

Решив эту систему, находим такие значения параметров:

a0 = (∑ y∑ x2 - ∑ xy∑ x) / (n∑ x2 - ∑ x∑ x);

a1 = (n∑ yx - ∑ y∑ x) / (n∑ x2 - ∑ x∑ x);

или а0 = yср – a1xср; a1 = ((xy)ср – xср yср) / (xср 2-(xср)2)

 

Параметр а1 называется коэффициентом регрессии и показывает изменение результативного признака У при изменении факторного признака х на единицу; геометрически параметр а, отвечает углу наклона (в радианах) прямой линии регрессии к горизонтальной оси.

Для оценки влияния факторного признака на результативный может рассчитываться коэффициент эластичности в среднем для всей совокупности:

Ке = а1хср /y

где х, у - средние величины фактических данных соответствен­но по факторному и результативному признаку в целом для сово­купности.

 

Ø Коэффициент эластичности показывает, на сколько процен­тов в среднем изменится результативный признак при изменении факторного признака на 1%.

Эх = аi хi ср/ yср

где аi – коэффициент регрессии при соответствующем факторном признаке

хi ср = среднее значение соответствующего факторного признака

yср – среднее значение результативного признака.

 

Теснота связи количественно выражается величиной коэффициентов корреляции.. Коэффициенты корреляции, представляя количественную характеристику тесноты связи между признаками, дают возможность определить «полезность» факторных признаков при построении уравнений множественной регрессии. Величина коэффициента корреляции служит также оценкой соответствия уравнения регрессии выявленным причинно-следственным связям.

Ø Коэффициент корреляции (корреляционное отношение) пока­зывает, насколько значительным является влияние признака х на Y. Коэффициент корреляции рассчитывается по формуле:

R =√ R2

Он находится в диапазоне 0 < R < 1; чем более близок R к единице, тем теснее корреляционная связь между признаками.

Иногда коэффициент корреляции рассчитывают по формуле, которую можно представить в виде:

R1 =√ ∑ (1- (y-Y)2 / (∑ y-ÿ)2 )

В случае линейной связи между Y и х величина линейного ко­эффициента корреляции определяется по формуле:

rxy = ((∑ xy - ∑ x∑ y/n) /√ [∑ х2-(∑ х)2/n] [∑ y2-(∑ y)2/n].

или rxy = (σ 2x + σ 2y + σ 2x-y) / 2 σ x σ y

Значение r лежит в диапазоне -1 = r = +1. При г = 0 не суще­ствует линейной корреляционной связи. Степень тесноты их ли­нейной зависимости растет при приближении к ±1. Когда r > О связь между признаками прямая (при росте х растет У), при r < 0— обратная (при росте х уменьшается Y).

Принято считать, если коэффициент корреляции:

 

до ±0, 3 – практически отсутствует ±0, 3 - ±0, 5 - связь слабая ±0, 5 до ±0, 7 – связь средней силы (умеренная) ± 0, 7 - ±1 связь сильная

 

Между линейным коэффициентом корреляции и коэффициентом регрессии существует определенная зависимость:

rxy = аi σ xi / σ y

После установления тесноты связи дают оценку з начимости связи между признаками. Под термином «значимость связи» по­нимают оценку отклонения выборочных переменных от своих зна­чений в генеральной совокупности посредством статистических критериев. Оценку значимости связи осуществляют с использо­ванием F-критерия. Для парной регрессии (линейной и нелинейной) F-критерий Фишера рассчитывается по формуле:

F =∑ (Y - ÿ)2 /1: (∑ y-Y)2 /(n-2)

где [l, (п - 2)] — число степеней свободы числителя и знаменате­ля зависимости.

Если F > Fтабл., то выборочная совокупность и связь между признаками является значимой

 

Построение модели множественной регрессии

1. Выбор формы связи (уравнения регрессии)

2. Отбор факторных признаков для включения в модель

(Матрица парных коэффициентов корреляции

Проверка значимости парных коэффициентов корреляции на основе t-критерия Стьюдента

Анализ матрицы парных коэффициентов корреляции на наличие мультиколлениарности)

3. Построение уравнения многофакторной регрессии (Метод наименьших квадратов или Пошаговый регрессионный анализ)

4. Проверка значимости коэффициентов регрессии на основе t-критерия Стьюдента

5. Проверка значимости уравнения регрессии по F-критерию Фишера-Снедекора

6. Статистически значимое уравнение регрессии, содержащее статистически значимые параметры

7. Экономическая интерпретация, формулировка выводов и предложений

 

Cистема нормальных уравнений записывается в виде:

na0 + a1∑ x1 + a2∑ x2 =∑ Y:

a0 ∑ xi + a1∑ x12 + a2∑ x1x2 = ∑ x1Y

a0 ∑ x2 + a1∑ x1x2 + a2∑ x22 = ∑ x2Y

Множественный коэффициент корреляции по определению положителен

0≤ R≤ 1

 

Ø t-критерия Стьюдента tp = /ai/: √ σ 2ai

σ 2ai – дисперсия коэффициента регрессии

Для парной линейной регрессии при г = R вычисляются по формуле:

t = √ (n-2)/(1-R2)

где (n-2) — число степеней свободы.

Если t> tтабл, то линейный коэффициент корреляции является значимым при характеристике генеральной совокупности

 

Ø Коэффициент взаимной сопряженности Крамера (при mx ≠ my)

C = √ χ 2 / n√ (m min -1)

где mmin— минимальное число групп (mx или my).

 

Для определения тесноты связи двух качественных признаков, каждый из которых состоит только из двух групп применяются коэффициента ассоциации Д. Юлаи коэффициента контингенции К. Пирсона

 

а b а +b
с d c+d
а + с b+d a+b + с + d

Ø Коэффициент ассоциации (Д.Юла):

Ø Коэффициент контингенции (К.Пирсона):

Коэффициент контингенции всегда меньше коэффициента ассоциации. вязь считается подтвержденной, если Ка≥ 0, 5 или Кк≥ 0, 3.

Ранжирорвание – это процедура упорядочения объектов изучения, которая выполняется на основе предпочтения.

Ранг – это порядковый номер значений признака, расположенных в порядке возрастания или убывания величин.

Если значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической от соответствующих номеров мест, которые определяют. Данные ранги называют связными.

Ø Коэффициент ранговой корреляции Спирмена:

где di2 - квадрат разности рангов величин X и Y; n - число наблюдений (пар рангов).

Ø Ранговый коэффициент корреляции Кендалла (τ)

τ xy = 2S / n(n-1)

n – число наблюдений;

S – сумма разностей между числом последовательностей и числом инверсий по второму признаку.

Связь можно признать статистически значимой, если значения коэффициентов ранговой корреляции > 0, 5.

 

Ø Коэффициент конкордации (множественный коэффициент ранговой корреляции)

W = 12S / m2(n3 – n)

m – количество факторов, n - число наблюдений; S – отклонение суммы квадратов рангов от средней квадратов рангов.

 







Дата добавления: 2014-11-12; просмотров: 1135. Нарушение авторских прав; Мы поможем в написании вашей работы!



Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

Оценка качества Анализ документации. Имеющийся рецепт, паспорт письменного контроля и номер лекарственной формы соответствуют друг другу. Ингредиенты совместимы, расчеты сделаны верно, паспорт письменного контроля выписан верно. Правильность упаковки и оформления....

БИОХИМИЯ ТКАНЕЙ ЗУБА В составе зуба выделяют минерализованные и неминерализованные ткани...

Типология суицида. Феномен суицида (самоубийство или попытка самоубийства) чаще всего связывается с представлением о психологическом кризисе личности...

РЕВМАТИЧЕСКИЕ БОЛЕЗНИ Ревматические болезни(или диффузные болезни соединительно ткани(ДБСТ))— это группа заболеваний, характеризующихся первичным системным поражением соединительной ткани в связи с нарушением иммунного гомеостаза...

Решение Постоянные издержки (FC) не зависят от изменения объёма производства, существуют постоянно...

ТРАНСПОРТНАЯ ИММОБИЛИЗАЦИЯ   Под транспортной иммобилизацией понимают мероприятия, направленные на обеспечение покоя в поврежденном участке тела и близлежащих к нему суставах на период перевозки пострадавшего в лечебное учреждение...

Studopedia.info - Студопедия - 2014-2024 год . (0.012 сек.) русская версия | украинская версия