Студопедия — Глава 7. Корреляционный и регрессионный анализ. Выявление связи между величинами
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Глава 7. Корреляционный и регрессионный анализ. Выявление связи между величинами






Корреляционный метод позволяет получить числовые показатели, характеризующие степень (тесноту) связи между двумя или несколькими признаками.

Для характеристики количественной связи между явлениями и отдельными признаками следует различать функциональную (полную) и статистическую (неполную) связь между признаками.

Статистической называют зависимость случайной величины Y от X, при которой изменение одной из величин (X) влечет изменение другой (Y).

Возникновение понятия статистической связи обуславливается тем, что зависимая переменная подвержена влиянию ряда контролируемых или неучтенных факторов, а также тем, что изменение значений переменных неизбежно сопровождается некоторыми случайными ошибками.

Корреляционная зависимость между двумя переменными величинами – это зависимость между значениями одной из них и условным математическим ожиданием другой.

Сравнивая различные виды зависимости между Х и Y, можно сказать, что с изменением значений переменной Х при функциональной зависимости однозначно изменяется определенное значение переменной Y, при корреляционной – определенное среднее значение Y, при статистической – определенное распределение переменной Y.

Статистические связи между переменными можно изучать методами корреляционного и регрессионного анализа. Основной задачей регрессионного анализа является установление формы и изучение зависимости между переменными. Основной задачей корреляционного анализа является выявление связи между случайными переменными и оценка ее тесноты.

Установление форм связи и подбор математического уравнения в большинстве случаев решается на основе логического анализа предыдущих исследований, данных статистических группировок, графического метода.

Линейная парная связь выражается уравнением прямой регрессии:

где а – угловой коэффициент прямой регрессии Y на Х, называемый выборочным коэффициентом регрессии.

При малых выборках данные не группируются. Параметры а и b находятся по методу наименьших квадратов из нормальной системы уравнений

(7.1)

где n – число наблюдаемых значений пар взаимосвязанных величин (xi; yi).

Выборочные уравнения прямой линии регрессии имеют вид:

- уравнение прямой регрессии Y на Х; (7.2)

- уравнение прямой регрессии Х на Y. (7.3)

Выборочный линейный коэффициент корреляции характеризует тесноту связи между Х и Y. Коэффициент корреляции находится по формуле:

(8)

где и - выборочные средние случайных величин Х и Y;

- среднее значение произведений

и - выборочные средние квадратические отклонения,

Свойства коэффициента корреляции :

1) Если =0, то Х и Y не связаны корреляционной зависимостью;

2) Если то Х и Y связаны функциональной зависимостью;

3) Если коэффициент корреляции положителен, то связь прямая; если коэффициент корреляции отрицателен, то связь обратная;

4) Связь тем теснее, чем ближе к единице:

связь практически отсутствует связь слабая связь умеренная связь высокая

Примеры

100. Найти коэффициент корреляции между производительностью труда Y (тыс. руб.) и энерговооруженностью труда Х (кВт) (в расчете на одного работающего) для 14 предприятий региона по следующим данным:

xi 2, 8 2, 2 3, 0 3, 5 3, 2 3, 7 4, 0 4, 8 6, 0 5, 4 5, 2 5, 4 6, 0 9, 0
yi 6, 7 6, 9 7, 2 7, 3 8, 4 8, 8 9, 1 9, 8 10, 6 10, 7 11, 1 11, 8 12, 1 12, 4

Найти коэффициент корреляции и построить уравнение регрессии.

Решение. Для вычисления коэффициента корреляции воспользуемся формулой (8) и сведем все вычисления в расчетную таблицу:

№ п/п
  2, 8 6, 7 7, 84 44, 89 18, 76 7, 686
  2, 2 6, 9 4, 84 47, 61 15, 18 7, 074
  3, 0 7, 2   51, 84 21, 6 7, 89
  3, 5 7, 3 12, 25 53, 29 25, 55 8, 4
  3, 2 8, 4 10, 24 70, 56 26, 88 8, 094
  3, 7 8, 8 13, 64 77, 44 32, 56 8, 604
  4, 0 9, 1   82, 81 36, 4 8, 91
  4, 8 9, 8 23, 04 96, 04 47, 04 9, 726
  6, 0 10, 6   112, 36 63, 6 10, 95
  5, 4 10, 7 29, 16 114, 49 57, 78 10, 338
  5, 2 11, 1 27, 04 123, 21 57, 72 10, 134
  5, 4 11, 8 29, 16 139, 24 63, 72 10, 338
  6, 0 12, 1   146, 41 72, 6 10, 95
  9, 0 12, 4   153, 76 111, 6 14, 01
64, 2 132, 9 335, 26 1313, 95 650, 99 133, 104
Средние значения 4, 59 9, 49 23, 95 93, 85 46, 5  

= = =

= = =

Связь сильная, прямая.

Для получения уравнения регрессии составим и решим систему уравнений:

101. Распределение 100 предприятий по объему выпускаемой продукции Х (в тыс. руб.) и по себестоимости единицы продукции Y (тыс. руб.) дано в корреляционной таблице.

y x 3, 5 4, 0 4, 5 5, 0 5, 5 6, 0 6, 5
4, 1 - - - - -   -  
4, 3 - - -          
4, 5 - -         -  
4, 7 - -         -  
4, 9 -         - -  
5, 1 -         - -  
5, 3       - - - -  
5, 5   - - - - - -  
               

Предполагая, что между переменными Х и Y существует корреляционная зависимость, определить выборочный коэффициент корреляции; найти уравнение прямой регрессии Y на Х; сделать вывод о тесноте и направлении связи; оценить среднюю себестоимость продукции (тыс. руб.) при объеме выпускаемой продукции в 5, 0 тыс. руб.

Решение. 1. Найдем средние значения , и вычислим

Так как коэффициент корреляции отрицателен, то связь между величинами Х и Y обратная. Теснота связи высокая.

2. Для получения уравнения прямой линии регрессии Y на Х воспользуемся уравнением

3. Оценим среднюю себестоимость продукции при объеме выпускаемой продукции в 5, 0 тыс.руб.








Дата добавления: 2014-11-10; просмотров: 1282. Нарушение авторских прав; Мы поможем в написании вашей работы!



Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Факторы, влияющие на степень электролитической диссоциации Степень диссоциации зависит от природы электролита и растворителя, концентрации раствора, температуры, присутствия одноименного иона и других факторов...

Йодометрия. Характеристика метода Метод йодометрии основан на ОВ-реакциях, связанных с превращением I2 в ионы I- и обратно...

Броматометрия и бромометрия Броматометрический метод основан на окислении вос­становителей броматом калия в кислой среде...

Тема: Изучение фенотипов местных сортов растений Цель: расширить знания о задачах современной селекции. Оборудование:пакетики семян различных сортов томатов...

Тема: Составление цепи питания Цель: расширить знания о биотических факторах среды. Оборудование:гербарные растения...

В эволюции растений и животных. Цель: выявить ароморфозы и идиоадаптации у растений Цель: выявить ароморфозы и идиоадаптации у растений. Оборудование: гербарные растения, чучела хордовых (рыб, земноводных, птиц, пресмыкающихся, млекопитающих), коллекции насекомых, влажные препараты паразитических червей, мох, хвощ, папоротник...

Studopedia.info - Студопедия - 2014-2024 год . (0.011 сек.) русская версия | украинская версия