Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Корреляционно-регрессионный анализ.





Изучение корреляционных связей сводится в основном к решению следующих задач:

• выявление наличия (или отсутствия) корреляционной связи между изучаемыми признаками. Эта задача может быть решена на основе параллельного сопоставления (сравнения) значений х и у у п единиц совокупности;

• измерение тесноты связи между двумя (и более) признаками с помощью специальных коэффициентов. Эта часть исследования именуется корреляционным анализом;

• определение уравнения регрессии — математической модели, в которой среднее значение результативного признака у рассматривается как функция одной или нескольких переменных — факторных признаков. Эта часть исследования именуется регрессионным анализом.

Последовательность рассмотрения перечисленных задач, естественно, может меняться в каждом конкретном исследовании.

Общий термин «корреляционно-регрессионный анализ» подразумевает всестороннее исследование корреляционных связей, в том числе нахождение уравнений регрессии, измерение тесноты и направления связи, а также определение возможных ошибок, как параметров уравнений регрессии, так и показателей тесноты связи.

Измерить корреляционную связь между признаками х и у и найти форму этой связи, ее аналитическое выражение (математическую модель) — две важные, неразрывные и дополняющие друг друга задачи корреляционно-регрессионного анализа. Найти уравнение регрессии — значит по эмпирическим (фактическим) данным математически описать изменения взаимно коррелируемых величин.

Уравнение регрессии должно определить, каким будет среднее значение результативного признака у при том или ином значении факторного признака х, если остальные факторы, влияющие на у и не связанные с х, не учитывать, т.е. абстрагироваться от них. Другими словами, уравнение регрессии можно рассматривать как связь средней величины результативного признака у со значениями факторного признака х.

Уравнение регрессии можно также назвать теоретической линией регрессии. Рассчитанные по уравнению регрессии значения результативного признака называются теоретическими, обычно обозначаются (читается: «игрек, выравненный по х») и рассматриваются как функция от х, т.е. ух = f(x).

Найти в каждом конкретном случае тип функции, с помощью которой можно наиболее адекватно отразить ту или иную зависимость между признаками х и у, — одна из основных задач регрессионного анализа.

Выбор теоретической линии регрессии часто обусловлен формой эмпирической линии регрессии; теоретическая линия как бы сглаживает изломы эмпирической линии регрессии. Кроме того, необходимо учитывать природу изучаемых показателей и специфику их взаимосвязей.

Для аналитической связи между х и у могут использоваться сле­дующие простые виды уравнений:

а) yх = a0+a1 x (прямая);

б) ух = а0 + а1 х + а2x2 (парабола 2-го порядка);

в) ух= a0 + a1 * 1/x (гипербола);

г) ух = а0а1x (показательная функция);

д) yx=a + a1 lgx (логарифмическая функция) и др.

Обычно зависимость, выражаемую уравнением прямой, называют линейной (или прямолинейной),а все остальные — криволинейными.

Выбрав тип функции, по эмпирическим данным определяют параметры уравнения. При этом отыскиваемые параметры должны быть такими, при которых рассчитанные по уравнению теоретические значения результативного признака ух были бы максимально близки к эмпирическим данным.

Существует несколько методов нахождения параметров уравнения регрессии. Наиболее часто используется метод наименьших квадратов (МНК). Его суть заключается в следующем требовании: искомые теоретические значения результативного признака ух должны быть такими, при которых бы обеспечивалась минимальная сумма квадратов их отклонений от эмпирических значений, т.е. (минимизируются квадраты отклонений, поскольку ).

Если данное требование соблюдается, легко определить, при каких значениях а0, а1, и т.д. для каждой аналитической кривой эта сумма квадратов отклонений будет минимальной.

Линейная зависимость — наиболее часто используемая форма связи между двумя коррелируемыми признаками, и выражается она при парной корреляции уравнением прямой:

ух = а0 + а1х.

Гипотеза именно о линейной зависимости между х и у выдвигается в том случае, если результативный и факторный признаки возрастают (или убывают) примерно одинаково.

Параметры а0 и а1, отыскиваются по МНК следующим образом.

Согласно требованию МНК при линейной зависимости в формуле вместо записываем его конкретное выражение: а0 + а1х. Тогда

Дальнейшее решение сводится к задаче на экстремум, т.е. к определению того, при каком значении а0 и а1, функция двух переменных S может достигнуть минимума. Для этого надо найти частные производные S по а0 и а1, приравнять их к нулю и после элементарных преобразова­ний решить систему двух уравнений с двумя неизвестными.

Найдем частные производные:

Сократив каждое уравнение на (-2), раскрыв скобки и перенеся члены с х в одну сторону, а с у — в другую, получим:

Эта система называется системой нормальных уравнений МНК для линейного уравнения регрессии.

Для решения системы по эмпирическим (наблюдаемым) данным определяется число единиц наблюдения п, и входящие в систему суммы. Подставив вычисленные суммы в систему нормальных уравнений, находятся параметры искомой прямой (линейного уравнения регрессии).

Пример. Рассчитать параметры уравнения регрессии между экспортом х и валовым внутренним продуктом у за последние девять лет по следующим данным:

Таблица 5. Расчетная таблица для нахождения параметров уравнения регрессии.

    № Экспорт, млн. руб. х ВВП, млн. руб. у Расчетные показатели
  х2   ху  
 
418,4
523,5
579,3
 
2084,6
3218,9
3298,9
3800,1
4599,3

 

1428,5
2007,8
2342,5
2629,6
4823,2
7305,6
8943,6
10834,2
13304,7

 

175058,56
274052,25
335588,49
 
4345557,16
10361317,2
10882741,2
 
21153560,5

 

597684,4
1051083,3
1357010,25
2158901,6
10054442,72
23515995,84
29504042,04
41171043,42
61192306,71

 

1409,301
1685,477
1832,105
2467,229
5787,642
8768,287
8978,506
10295,53
12395,62

 

  Сумма

Параметры уравнения регрессии найдем, решив систему нормальных равнений, предварительно подставив в нее необходимые суммы, рассчитанные в таблице:

Решением данной системы будет: а0 = 309,85, а1 =2,628. Отсюда искомое уравнение регрессии: .

Подставляя в данное уравнение последовательно значения х, находим теоретические (выравненные) значения результативного признака у, которые показывают, каким теоретически должен быть объем валового выпуска продукции при данной стоимости основных фондов хi (при прочих равных условиях для всех предприятий).

Параметр а1 в уравнении линейной регрессии называется коэффициентом регрессии, который показывает, на сколько (в абсолютном выражении) изменяется значение результативного признака у при изменении факторного признака х на единицу.

 







Дата добавления: 2015-12-04; просмотров: 267. Нарушение авторских прав; Мы поможем в написании вашей работы!




Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...


ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...


Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...


Логические цифровые микросхемы Более сложные элементы цифровой схемотехники (триггеры, мультиплексоры, декодеры и т.д.) не имеют...

ТРАНСПОРТНАЯ ИММОБИЛИЗАЦИЯ   Под транспортной иммобилизацией понимают мероприятия, направленные на обеспечение покоя в поврежденном участке тела и близлежащих к нему суставах на период перевозки пострадавшего в лечебное учреждение...

Кишечный шов (Ламбера, Альберта, Шмидена, Матешука) Кишечный шов– это способ соединения кишечной стенки. В основе кишечного шва лежит принцип футлярного строения кишечной стенки...

Принципы резекции желудка по типу Бильрот 1, Бильрот 2; операция Гофмейстера-Финстерера. Гастрэктомия Резекция желудка – удаление части желудка: а) дистальная – удаляют 2/3 желудка б) проксимальная – удаляют 95% желудка. Показания...

Устройство рабочих органов мясорубки Независимо от марки мясорубки и её технических характеристик, все они имеют принципиально одинаковые устройства...

Ведение учета результатов боевой подготовки в роте и во взводе Содержание журнала учета боевой подготовки во взводе. Учет результатов боевой подготовки - есть отражение количественных и качественных показателей выполнения планов подготовки соединений...

Сравнительно-исторический метод в языкознании сравнительно-исторический метод в языкознании является одним из основных и представляет собой совокупность приёмов...

Studopedia.info - Студопедия - 2014-2024 год . (0.007 сек.) русская версия | украинская версия