Глава 7. Корреляционный и регрессионный анализ. Выявление связи между величинами
Корреляционный метод позволяет получить числовые показатели, характеризующие степень (тесноту) связи между двумя или несколькими признаками.
Для характеристики количественной связи между явлениями и отдельными признаками следует различать функциональную (полную) и статистическую (неполную) связь между признаками.
Статистической называют зависимость случайной величины Y от X, при которой изменение одной из величин (X) влечет изменение другой (Y).
Возникновение понятия статистической связи обуславливается тем, что зависимая переменная подвержена влиянию ряда контролируемых или неучтенных факторов, а также тем, что изменение значений переменных неизбежно сопровождается некоторыми случайными ошибками.
Корреляционная зависимость между двумя переменными величинами – это зависимость между значениями одной из них и условным математическим ожиданием другой.
Сравнивая различные виды зависимости между Х и Y, можно сказать, что с изменением значений переменной Х при функциональной зависимости однозначно изменяется определенное значение переменной Y, при корреляционной – определенное среднее значение Y, при статистической – определенное распределение переменной Y.
Статистические связи между переменными можно изучать методами корреляционного и регрессионного анализа. Основной задачей регрессионного анализа является установление формы и изучение зависимости между переменными. Основной задачей корреляционного анализа является выявление связи между случайными переменными и оценка ее тесноты.
Установление форм связи и подбор математического уравнения в большинстве случаев решается на основе логического анализа предыдущих исследований, данных статистических группировок, графического метода.
Линейная парная связь выражается уравнением прямой регрессии:

где а – угловой коэффициент прямой регрессии Y на Х, называемый выборочным коэффициентом регрессии.
При малых выборках данные не группируются. Параметры а и b находятся по методу наименьших квадратов из нормальной системы уравнений
(7.1)
где n – число наблюдаемых значений пар взаимосвязанных величин (xi; yi).
Выборочные уравнения прямой линии регрессии имеют вид:
- уравнение прямой регрессии Y на Х; (7.2)
- уравнение прямой регрессии Х на Y. (7.3)
Выборочный линейный коэффициент корреляции характеризует тесноту связи между Х и Y. Коэффициент корреляции находится по формуле:
(8)
где и - выборочные средние случайных величин Х и Y;
- среднее значение произведений 
и - выборочные средние квадратические отклонения, 

Свойства коэффициента корреляции :
1) Если =0, то Х и Y не связаны корреляционной зависимостью;
2) Если то Х и Y связаны функциональной зависимостью;
3) Если коэффициент корреляции положителен, то связь прямая; если коэффициент корреляции отрицателен, то связь обратная;
4) Связь тем теснее, чем ближе к единице:
|
|
|
| связь практически
отсутствует
| связь
слабая
| связь
умеренная
| связь
высокая
| Примеры
100. Найти коэффициент корреляции между производительностью труда Y (тыс. руб.) и энерговооруженностью труда Х (кВт) (в расчете на одного работающего) для 14 предприятий региона по следующим данным:
xi
| 2, 8
| 2, 2
| 3, 0
| 3, 5
| 3, 2
| 3, 7
| 4, 0
| 4, 8
| 6, 0
| 5, 4
| 5, 2
| 5, 4
| 6, 0
| 9, 0
| yi
| 6, 7
| 6, 9
| 7, 2
| 7, 3
| 8, 4
| 8, 8
| 9, 1
| 9, 8
| 10, 6
| 10, 7
| 11, 1
| 11, 8
| 12, 1
| 12, 4
| Найти коэффициент корреляции и построить уравнение регрессии.
Решение. Для вычисления коэффициента корреляции воспользуемся формулой (8) и сведем все вычисления в расчетную таблицу:
№ п/п
|
|
|
|
|
|
|
| 2, 8
| 6, 7
| 7, 84
| 44, 89
| 18, 76
| 7, 686
|
| 2, 2
| 6, 9
| 4, 84
| 47, 61
| 15, 18
| 7, 074
|
| 3, 0
| 7, 2
|
| 51, 84
| 21, 6
| 7, 89
|
| 3, 5
| 7, 3
| 12, 25
| 53, 29
| 25, 55
| 8, 4
|
| 3, 2
| 8, 4
| 10, 24
| 70, 56
| 26, 88
| 8, 094
|
| 3, 7
| 8, 8
| 13, 64
| 77, 44
| 32, 56
| 8, 604
|
| 4, 0
| 9, 1
|
| 82, 81
| 36, 4
| 8, 91
|
| 4, 8
| 9, 8
| 23, 04
| 96, 04
| 47, 04
| 9, 726
|
| 6, 0
| 10, 6
|
| 112, 36
| 63, 6
| 10, 95
|
| 5, 4
| 10, 7
| 29, 16
| 114, 49
| 57, 78
| 10, 338
|
| 5, 2
| 11, 1
| 27, 04
| 123, 21
| 57, 72
| 10, 134
|
| 5, 4
| 11, 8
| 29, 16
| 139, 24
| 63, 72
| 10, 338
|
| 6, 0
| 12, 1
|
| 146, 41
| 72, 6
| 10, 95
|
| 9, 0
| 12, 4
|
| 153, 76
| 111, 6
| 14, 01
|
| 64, 2
| 132, 9
| 335, 26
| 1313, 95
| 650, 99
| 133, 104
| Средние
значения
| 4, 59
| 9, 49
| 23, 95
| 93, 85
| 46, 5
| | = = = 
= = = 

Связь сильная, прямая.
Для получения уравнения регрессии составим и решим систему уравнений:



101. Распределение 100 предприятий по объему выпускаемой продукции Х (в тыс. руб.) и по себестоимости единицы продукции Y (тыс. руб.) дано в корреляционной таблице.
y
x
| 3, 5
| 4, 0
| 4, 5
| 5, 0
| 5, 5
| 6, 0
| 6, 5
| ∑
| 4, 1
| -
| -
| -
| -
| -
|
| -
|
| 4, 3
| -
| -
| -
|
|
|
|
|
| 4, 5
| -
| -
|
|
|
|
| -
|
| 4, 7
| -
| -
|
|
|
|
| -
|
| 4, 9
| -
|
|
|
|
| -
| -
|
| 5, 1
| -
|
|
|
|
| -
| -
|
| 5, 3
|
|
|
| -
| -
| -
| -
|
| 5, 5
|
| -
| -
| -
| -
| -
| -
|
| ∑
|
|
|
|
|
|
|
|
| Предполагая, что между переменными Х и Y существует корреляционная зависимость, определить выборочный коэффициент корреляции; найти уравнение прямой регрессии Y на Х; сделать вывод о тесноте и направлении связи; оценить среднюю себестоимость продукции (тыс. руб.) при объеме выпускаемой продукции в 5, 0 тыс. руб.
Решение. 1. Найдем средние значения , и вычислим 








Так как коэффициент корреляции отрицателен, то связь между величинами Х и Y обратная. Теснота связи высокая.
2. Для получения уравнения прямой линии регрессии Y на Х воспользуемся уравнением 

3. Оценим среднюю себестоимость продукции при объеме выпускаемой продукции в 5, 0 тыс.руб.

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...
|
Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...
|
Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...
|
Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...
|
Педагогическая структура процесса социализации Характеризуя социализацию как педагогический процессе, следует рассмотреть ее основные компоненты: цель, содержание, средства, функции субъекта и объекта...
Типовые ситуационные задачи. Задача 1. Больной К., 38 лет, шахтер по профессии, во время планового медицинского осмотра предъявил жалобы на появление одышки при значительной физической
Задача 1. Больной К., 38 лет, шахтер по профессии, во время планового медицинского осмотра предъявил жалобы на появление одышки при значительной физической нагрузке. Из медицинской книжки установлено, что он страдает врожденным пороком сердца....
Типовые ситуационные задачи. Задача 1.У больного А., 20 лет, с детства отмечается повышенное АД, уровень которого в настоящее время составляет 180-200/110-120 мм рт Задача 1.У больного А., 20 лет, с детства отмечается повышенное АД, уровень которого в настоящее время составляет 180-200/110-120 мм рт. ст. Влияние психоэмоциональных факторов отсутствует. Колебаний АД практически нет. Головной боли нет. Нормализовать...
|
Подкожное введение сывороток по методу Безредки. С целью предупреждения развития анафилактического шока и других аллергических реакций при введении иммунных сывороток используют метод Безредки для определения реакции больного на введение сыворотки...
Принципы и методы управления в таможенных органах Под принципами управления понимаются идеи, правила, основные положения и нормы поведения, которыми руководствуются общие, частные и организационно-технологические принципы...
ПРОФЕССИОНАЛЬНОЕ САМОВОСПИТАНИЕ И САМООБРАЗОВАНИЕ ПЕДАГОГА Воспитывать сегодня подрастающее поколение на современном уровне требований общества нельзя без постоянного обновления и обогащения своего профессионального педагогического потенциала...
|
|