Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Глава 7. Корреляционный и регрессионный анализ. Выявление связи между величинами





Корреляционный метод позволяет получить числовые показатели, характеризующие степень (тесноту) связи между двумя или несколькими признаками.

Для характеристики количественной связи между явлениями и отдельными признаками следует различать функциональную (полную) и статистическую (неполную) связь между признаками.

Статистической называют зависимость случайной величины Y от X, при которой изменение одной из величин (X) влечет изменение другой (Y).

Возникновение понятия статистической связи обуславливается тем, что зависимая переменная подвержена влиянию ряда контролируемых или неучтенных факторов, а также тем, что изменение значений переменных неизбежно сопровождается некоторыми случайными ошибками.

Корреляционная зависимость между двумя переменными величинами – это зависимость между значениями одной из них и условным математическим ожиданием другой.

Сравнивая различные виды зависимости между Х и Y, можно сказать, что с изменением значений переменной Х при функциональной зависимости однозначно изменяется определенное значение переменной Y, при корреляционной – определенное среднее значение Y, при статистической – определенное распределение переменной Y.

Статистические связи между переменными можно изучать методами корреляционного и регрессионного анализа. Основной задачей регрессионного анализа является установление формы и изучение зависимости между переменными. Основной задачей корреляционного анализа является выявление связи между случайными переменными и оценка ее тесноты.

Установление форм связи и подбор математического уравнения в большинстве случаев решается на основе логического анализа предыдущих исследований, данных статистических группировок, графического метода.

Линейная парная связь выражается уравнением прямой регрессии:

где а – угловой коэффициент прямой регрессии Y на Х, называемый выборочным коэффициентом регрессии.

При малых выборках данные не группируются. Параметры а и b находятся по методу наименьших квадратов из нормальной системы уравнений

(7.1)

где n – число наблюдаемых значений пар взаимосвязанных величин (xi; yi).

Выборочные уравнения прямой линии регрессии имеют вид:

- уравнение прямой регрессии Y на Х; (7.2)

- уравнение прямой регрессии Х на Y. (7.3)

Выборочный линейный коэффициент корреляции характеризует тесноту связи между Х и Y. Коэффициент корреляции находится по формуле:

(8)

где и - выборочные средние случайных величин Х и Y;

- среднее значение произведений

и - выборочные средние квадратические отклонения,

Свойства коэффициента корреляции :

1) Если =0, то Х и Y не связаны корреляционной зависимостью;

2) Если то Х и Y связаны функциональной зависимостью;

3) Если коэффициент корреляции положителен, то связь прямая; если коэффициент корреляции отрицателен, то связь обратная;

4) Связь тем теснее, чем ближе к единице:

связь практически отсутствует связь слабая связь умеренная связь высокая

Примеры

100. Найти коэффициент корреляции между производительностью труда Y (тыс. руб.) и энерговооруженностью труда Х (кВт) (в расчете на одного работающего) для 14 предприятий региона по следующим данным:

xi 2, 8 2, 2 3, 0 3, 5 3, 2 3, 7 4, 0 4, 8 6, 0 5, 4 5, 2 5, 4 6, 0 9, 0
yi 6, 7 6, 9 7, 2 7, 3 8, 4 8, 8 9, 1 9, 8 10, 6 10, 7 11, 1 11, 8 12, 1 12, 4

Найти коэффициент корреляции и построить уравнение регрессии.

Решение. Для вычисления коэффициента корреляции воспользуемся формулой (8) и сведем все вычисления в расчетную таблицу:

№ п/п
  2, 8 6, 7 7, 84 44, 89 18, 76 7, 686
  2, 2 6, 9 4, 84 47, 61 15, 18 7, 074
  3, 0 7, 2   51, 84 21, 6 7, 89
  3, 5 7, 3 12, 25 53, 29 25, 55 8, 4
  3, 2 8, 4 10, 24 70, 56 26, 88 8, 094
  3, 7 8, 8 13, 64 77, 44 32, 56 8, 604
  4, 0 9, 1   82, 81 36, 4 8, 91
  4, 8 9, 8 23, 04 96, 04 47, 04 9, 726
  6, 0 10, 6   112, 36 63, 6 10, 95
  5, 4 10, 7 29, 16 114, 49 57, 78 10, 338
  5, 2 11, 1 27, 04 123, 21 57, 72 10, 134
  5, 4 11, 8 29, 16 139, 24 63, 72 10, 338
  6, 0 12, 1   146, 41 72, 6 10, 95
  9, 0 12, 4   153, 76 111, 6 14, 01
64, 2 132, 9 335, 26 1313, 95 650, 99 133, 104
Средние значения 4, 59 9, 49 23, 95 93, 85 46, 5  

= = =

= = =

Связь сильная, прямая.

Для получения уравнения регрессии составим и решим систему уравнений:

101. Распределение 100 предприятий по объему выпускаемой продукции Х (в тыс. руб.) и по себестоимости единицы продукции Y (тыс. руб.) дано в корреляционной таблице.

y x 3, 5 4, 0 4, 5 5, 0 5, 5 6, 0 6, 5
4, 1 - - - - -   -  
4, 3 - - -          
4, 5 - -         -  
4, 7 - -         -  
4, 9 -         - -  
5, 1 -         - -  
5, 3       - - - -  
5, 5   - - - - - -  
               

Предполагая, что между переменными Х и Y существует корреляционная зависимость, определить выборочный коэффициент корреляции; найти уравнение прямой регрессии Y на Х; сделать вывод о тесноте и направлении связи; оценить среднюю себестоимость продукции (тыс. руб.) при объеме выпускаемой продукции в 5, 0 тыс. руб.

Решение. 1. Найдем средние значения , и вычислим

Так как коэффициент корреляции отрицателен, то связь между величинами Х и Y обратная. Теснота связи высокая.

2. Для получения уравнения прямой линии регрессии Y на Х воспользуемся уравнением

3. Оценим среднюю себестоимость продукции при объеме выпускаемой продукции в 5, 0 тыс.руб.








Дата добавления: 2014-11-10; просмотров: 1364. Нарушение авторских прав; Мы поможем в написании вашей работы!




Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...


Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...


Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...


Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

Броматометрия и бромометрия Броматометрический метод основан на окислении вос­становителей броматом калия в кислой среде...

Метод Фольгарда (роданометрия или тиоцианатометрия) Метод Фольгарда основан на применении в качестве осадителя титрованного раствора, содержащего роданид-ионы SCN...

Потенциометрия. Потенциометрическое определение рН растворов Потенциометрия - это электрохимический метод иссле­дования и анализа веществ, основанный на зависимости равновесного электродного потенциала Е от активности (концентрации) определяемого вещества в исследуемом рас­творе...

Индекс гингивита (PMA) (Schour, Massler, 1948) Для оценки тяжести гингивита (а в последующем и ре­гистрации динамики процесса) используют папиллярно-маргинально-альвеолярный индекс (РМА)...

Методика исследования периферических лимфатических узлов. Исследование периферических лимфатических узлов производится с помощью осмотра и пальпации...

Роль органов чувств в ориентировке слепых Процесс ориентации протекает на основе совместной, интегративной деятельности сохранных анализаторов, каждый из которых при определенных объективных условиях может выступать как ведущий...

Studopedia.info - Студопедия - 2014-2026 год . (0.008 сек.) русская версия | украинская версия