Студопедия — Корреляционный анализ. Между социально-экономическими явлениями и процессами возможны два вида зависимости: функциональная и стохастическая
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Корреляционный анализ. Между социально-экономическими явлениями и процессами возможны два вида зависимости: функциональная и стохастическая






Между социально-экономическими явлениями и процессами возможны два вида зависимости: функциональная и стохастическая. При функциональной зависимости имеется однозначное соответствие тех или иных параметров, характеризующих различные явления. Примеры такого рода зависимостей в социальной среде практически не встречаются.

При стохастической (вероятностной) зависимости конкретному значению зависимой переменной соответствует набор значений объясняющей переменной. Это связано, прежде всего, с тем, что на зависимую переменную оказывает влияние ряд неучтенных факторов. Кроме того, сказываются ошибки измерения переменных: вследствие случайного разброса их значения могут быть указаны лишь с определенной вероятностью.

В социально-экономической сфере приходится сталкиваться со многими явлениями, имеющими вероятностную природу. Так, число совершенных и раскрытых преступлений за фиксированный отрезок времени, число дорожно-транспортных происшествий в каком-либо регионе за определенное время - все это случайные величины. Для изучения стохастических взаимосвязей существуют специальные методы, в частности, корреляционный анализ («корреляция» - соотношение, связь между имеющимися явлениями и процессами).

Статистической (стохастической) зависимостью величины Y от нескольких переменных x1, x2,..., хn называется связь, в соответствии с которой при изменением значения факторных переменных x1, x2,..., хn результативная переменная Y может принимать любые значения с некоторыми вероятностями, но ее среднее значение или иные статистические (массовые) характеристики изменяются по определенному закону. Статистическая связь между различными показателями предполагает, чтокаждый из них имеет случайную вариацию индивидуальных значений относительно средней величины.

Корреляционной связью двух переменных называют частный случай статистической связи, состоящий в том, что разным значениям факторной переменной X соответствуют различные средние значения результативной переменной Y. Слово «корреляция» ввел в употребление Ф.Гальтон в конце XIXв. обозначая им соответствие (correlation), в отличие от обычной функциональной связи (relation).

Если рассматривается взаимосвязь двух переменных, в которой случайную вариацию имеет лишь один из признаков, а значения другого являются жестко детерминированными, то говорят о регрессии, а не о статистической связи. Например, при анализе динамических рядов можно измерять регрессию уровня преступности на номера лет, но нельзя говорить о корреляции между ними и применять показатели корреляции с соответствующей им интерпретацией.

Корреляционная связь между признаками может возникать тремя путями. Во‑первых, она может проявиться как причинная зависимость результативного признака (его вариации) от вариации факторного признака. Например, признак X - уровень безработицы, признак Y - уровень преступности.

Во-вторых, она может проявиться между двумя следствиями общей причины. Известен пример[1], приведенный А.А.Чупровым: если в качестве признака X взять число пожарных команд в городе, а за признак Y - сумму убытков за год в городе от пожаров, то между признаками X и Y в совокупности городов России имеется прямая корреляция. В среднем, чем больше пожарников в городе, тем больше и убытков от пожаров! Данную корреляцию нельзя интерпретировать как связь причины и следствия; оба признака - следствия общей причины - размера города.

В-третьих, корреляция возникает при взаимосвязи признаков, каждый из которых может выступать и как причина, и как следствие. Такова, например, корреляция между уровнем производительности труда и уровнем оплаты одного часа труда (тарифной ставкой). С одной стороны, чем выше производительность труда, тем выше и оплата. Но с другой стороны, установленные тарифные ставки выступают в качестве стимулирующего фактора по отношению к производительности труда. В такой системе каждый признак может выступать и в роли независимой переменной X, и в качестве зависимой переменной Y.

Первым условием возможности изучения корреляции является общее условие всякого статистического исследования: - наличие данных по достаточно большой совокупности явлений. Какое именно число явлений достаточно для анализа корреляционной связи, зависит от цели анализа, требуемой точности и надежности параметров связи, от числа факторов, корреляция с которыми изучается. Обычно считают, что число наблюдений должно быть не менее чем в 5-6, а лучше - не менее чем в 10 раз больше числа факторов[2]. При большом числе наблюдений вступает в действие закон больших чисел, обеспечивающий взаимное погашение случайных отклонений от закономерного характера исследуемой связи.

Вторым условием возможности изучения корреляционной связи служит условие, обеспечивающее достоверное выражение закономерности в средней величине для чего необходима качественная однородность исследуемой совокупности. Например, не следует объединять в одну совокупность преступления, совершаемые обычными гражданами, с преступлениями, совершаемыми лицами, отбывающими наказание в исправительно-трудовых учреждениях, поскольку указанные преступления имеют существенные отличия.

Третьим условием корреляционного анализа является необходимость подчинения распределения совокупности по результативному Y и факторному X признакам нормальному закону распределения. Это условие связано с используемым при корреляционном анализе математическим аппаратом, дающим достоверную оценку параметров корреляции только при нормальном распределении. Однако на практике это условие чаще всего выполняется приближенно, но и в этом случае получаемые результаты обладают достаточной надежностью. При значительном отклонении распределений признаков от нормальных нельзя оценивать надежность корреляции, используя параметры данного распределения или распределения Стьюдента.

В статистике линейная зависимость между двумя признаками измеряется посредством простого (выборочного) коэффициента корреляции. Величина линейной зависимости одной переменной от нескольких других измеряется коэффициентом множественной корреляции. Возможно, вычисление частного коэффициента корреляции, который измеряет линейную зависимость между двумя признаками после устранения части линейной зависимости, обусловленной связью этих переменных с другими переменными.

По форме корреляционные связи могут быть линейными (прямолинейными) и нелинейными (криволинейными), а по направлению - прямыми (положительными) и обратными (отрицательными).

Прямая связь свидетельствует о том, что с увеличением (уменьшением) значений одного признака увеличиваются (уменьшаются) значения другого признака. При обратной связи увеличение (уменьшение) значений одного признака ведет к уменьшению (увеличению) значений другого признака.

Главная задача корреляционного анализа - измерение тесноты связи - решается путем вычисления различных коэффициентов корреляции и проверки их значимости.

Коэффициент корреляции может принимать значения при прямой связи от 0 до + 1, а при обратной - от - 1 до 0. При коэффициентах, близких к 0, считается, что статистическая линейная связь между признаками отсутствует; при абсолютных значениях коэффициентов, меньших 0,3, - связь слабая; при значениях 0,3...0,5 - связь умеренная; при 0,5...0,7 - связь значительная; при 0,7...0,9 - связь сильная; если значения коэффициентов больше 0,9, то связь считается очень сильной; если коэффициенты равны +1 или -1, то говорится о функциональной связи (что практически не встречается в статистических исследованиях).

Однако такая упрощенная оценка силы связи не всегда корректна, так как степень уверенности в наличии статистической связи зависит от объема исследуемой совокупности. Чем меньше объем совокупности, тем большим должно быть значение коэффициента корреляции для принятия гипотезы о существовании зависимости между признаками. С целью количественного измерения степени уверенности в существовании линейной статистической связи между признаками введены понятия уровня значимости и пороговых (критических) значений коэффициента корреляции.

Проверка значимости полученного коэффициента корреляции состоит в сравнении расчетного значения с критическим. При данном числе измерений и задаваемом уровне значимости находится критическое значение, которое сравнивается с расчетным. Если расчетное больше критического, то связь значима, если меньше, то связь или отсутствует (а такое значение коэффициента корреляции объясняется случайными отклонениями) или выборка мала для ее выявления.

Для определения существования и величины линейной зависимости между двумя переменными X и Y необходимо осуществить две процедуры. Первая заключается в графическом отображении точек [Xi, Yi, i = 1,..., n] на плоскость [XY].

Рис. 2. Линейная зависимость Рис. 3. Линейная зависимость

существует. не просматривается.

 

Полученный график (рис. 2, 3) называется диаграммой рассеяния, анализ которой позволяет сделать вывод о допустимости предположения о линейной зависимости между переменными. Если такое предположение допустимо, то необходимо выразить в количественном виде величину линейной связи. Для этого используется выборочный коэффициент корреляции:

R =,

где: , - среднеквадратические отклонения переменных X и Y соответственно.

Однако даже при наличии сильной статистически значимой связи между двумя переменными нельзя быть полностью уверенным в их причинно-следственной обусловленности, так как могут существовать другие причины (факторы), определяющие их совместную статистическую взаимосвязь. Статистические выводы должны быть всегда обоснованы надежной теоретической концепцией.

В то же время отсутствие статистически значимой связи не говорит об отсутствии причинно-следственных отношений, а заставляет искать другие пути и средства ее выявления, если содержательная концепция и практический опыт указывают на ее возможное существование.







Дата добавления: 2015-10-15; просмотров: 759. Нарушение авторских прав; Мы поможем в написании вашей работы!



Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

САНИТАРНО-МИКРОБИОЛОГИЧЕСКОЕ ИССЛЕДОВАНИЕ ВОДЫ, ВОЗДУХА И ПОЧВЫ Цель занятия.Ознакомить студентов с основными методами и показателями...

Меры безопасности при обращении с оружием и боеприпасами 64. Получение (сдача) оружия и боеприпасов для проведения стрельб осуществляется в установленном порядке[1]. 65. Безопасность при проведении стрельб обеспечивается...

Весы настольные циферблатные Весы настольные циферблатные РН-10Ц13 (рис.3.1) выпускаются с наибольшими пределами взвешивания 2...

Дренирование желчных протоков Показаниями к дренированию желчных протоков являются декомпрессия на фоне внутрипротоковой гипертензии, интраоперационная холангиография, контроль за динамикой восстановления пассажа желчи в 12-перстную кишку...

Деятельность сестер милосердия общин Красного Креста ярко проявилась в период Тритоны – интервалы, в которых содержится три тона. К тритонам относятся увеличенная кварта (ув.4) и уменьшенная квинта (ум.5). Их можно построить на ступенях натурального и гармонического мажора и минора.  ...

Понятие о синдроме нарушения бронхиальной проходимости и его клинические проявления Синдром нарушения бронхиальной проходимости (бронхообструктивный синдром) – это патологическое состояние...

Studopedia.info - Студопедия - 2014-2024 год . (0.009 сек.) русская версия | украинская версия