Справочные материалы
Виды и формы связей, различаемые в статистике. При исследовании социально-экономических явлений часто приходится иметь дело с взаимосвязанными показателями. Типы взаимосвязей по характеру зависимости, различаемые в статистике, представлены на схеме 8.1.
Схема 8.1.Типы взаимосвязей по характеру зависимости Взаимосвязи можно классифицировать также следующим образом (схема 8.2):
Схема 8.2. Классификация связей Для анализа статистических зависимостей на начальной стадии применяются методы, представленные на схеме 8.3.
Схема 8.3. Начальная стадия анализа статистических зависимостей
Пример 8. 1. Имеются данные о выпуске продукции на 6 однотипных предприятиях (х) и потреблении на них электричества (у) (таблица 8.1.): Таблица 8.1. Зависимость потребления электричества от объема выпуска продукции
Сделать вывод о наличии, характере и форме связи. Решение: Поле корреляции построено на рис. 8.1. Рисунок 8.1. Зависимость потребления электричества от выпуска продукции Таблица и рисунок демонстрируют, что с увеличением факторного признака х увеличивается результативный признак у, следовательно связь между ними можно считать прямой.
Пример 8. 2. Метод аналитических группировок продемонстрируем на примере таблицы 8.2.: Таблица 8.2. Характеристика зависимости прибыли малых предприятий от оборачиваемости оборотных средств за 2003 год
Графический метод демонстрируется на рисунке 8.2. Построив график, можно судить о форме связи, ее направлении, а по разбросу точек – о тесноте связи (отсутствие связи будет характеризоваться разбросанностью точек по всему графику).
Рис. 8.2. Графики поля корреляции Измерение тесноты связи в случае корреляционной зависимости. Оценка тесноты связи между признаками предполагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (при изучении множественных зависимостей) факторных признаков. Простейший показатель тесноты связи - показатель Фехнера. , (8.1) где C – совпадения знаков отклонений и ; Н – несовпадения знаков отклонений и ; – общее количество парных отклонений. Мера совместной вариации признаков - коэффициент ковариации. (8.2) Показатель интенсивности линейной связи – линейный коэффициент парной корреляции Пирсона (коэффициент корреляции). (8.3) Путем ряда преобразований можно получить следующие аналитические выражения для расчета линейного коэффициента корреляции.
, (8.4) где
(8.5)
(8.6)
(8.7)
Показатель Фехнера и коэффициент корреляции Пирсона изменяются в пределах [-1;+1].
Пример 8.3. Измерим тесноту связи с использованием формул (8.1) - (8.3) по данным примера 8.1. Решение: 1) Расчет показателя Фехнера Рассчитаем средние значения для х и у:
.
Показатель Фехнера 2) Расчет коэффициента ковариации
3) Расчет линейного коэффициента корреляции: С учетом того, что , Полученные значения показателя Фехнера и коэффициента корреляции свидетельствуют о достаточно сильной прямой связи.
На прямую или обратную связь указывает знак коэффициента («+» или «–» соответственно). О тесноте связи свидетельствует абсолютная величина коэффициента. Для качественной оценки тесноты связи используется таблица Чэддока (табл. 8.3.) Таблица 8.3. Критерии оценки тесноты связи (шкала Чеддока)
Оценка достоверности коэффициента корреляции. Для более наглядного представления об оценке достоверности (значимости) коэффициента корреляции построена таблица 8.4.
Таблица 8.4. Оценка достоверности (значимости) коэффициента корреляции
Доверительные границы коэффициента корреляции рассчитываются как: , (8.8) где ρ; – генеральное значение коэффициента корреляции; tp – заданный уровень вероятности.
Пример 8.4. Проверить значимость коэффициента корреляции, рассчитанного по данным примера 8.1. Решение: , , тогда , что указывает на значимость коэффициента корреляции.
Ранговая корреляция. В анализе социально-экономических явлений широко используются ранговые коэффициенты корреляции (коэффициенты корреляции рангов), когда коррелируют не непосредственные значения X и Y, а их ранги, т.е. номера их мест, занимаемых в каждом ряду значений по возрастанию или убыванию. К таким непараметрическим коэффициентам относятся коэффициенты рангов Спирмена и Кендэлла. Коэффициент ранговой корреляции Спирмена:
(8.9)
Значимость коэффициента ранговой корреляции Спирмена:
(8.10)
Коэффициент корреляции Спирмена считается статистически значимым, если , где находится по таблице распределения Стьюдента с параметрами .
Пример 8.5. Имеются данные о затратах на рекламу продукции и объеме выручки от реализации продукции (табл. 8.5.; графы А и Б). Таблица 8.5. Зависимость затрат на рекламу продукции и объема выручки от реализации продукции
Вычислить коэффициент Спирмена. Решение: Определив ранги значений X и Y и их разность (табл. 8.5.; графы 1, 2, 3, 4), получаем . При условии, что ранги не повторяются, коэффициент ранговой корреляции Кендэлла рассчитывается как: , (8.11) где S – фактическая сумма рангов При этом соблюдаем следующую последовательность действий: 1. Значения Х ранжируются в порядке возрастания или убывания. 2. Значения У располагаются в порядке соответствующем значениям Х. 3. Для каждого ранга У определяется число следующих за ним значений рангов, превышающих его величину. Результат записывается в столбец «+», суммируется и обозначается Р. 4. Для каждого ранга У определяется число следующих за ним меньших значений рангов. Результат записывается в столбец «–», суммируется и обозначается Q. 5. Определяется общая сумма S = P+Q.
Интерпретация коэффициентов Спирмена и Кендэлла аналогична интерпретации коэффициента корреляции Пирсона.
Пример 8.6. Рассчитаем значение коэффициента Кендэлла на основании данных примера 8.5 Решение:
5-й шаг: S=P+Q=32+(-13)=19, тогда
Существенность коэффициента корреляции рангов Кэндэлла проверяется по формуле:
, (8.12) где - коэффициент, определяемый по таблице нормальгого распределения для выбранного уровня значимости при больших п.
Коэффициент Кендэлла всегда меньше по значению, чем коэффициент Спирмена, точнее . Это соотношение выполняется при большом числе наблюдений, т.е п>30, и слабых либо умеренно тесных связях.
Если отдельные значения признака имеют одинаковую количественную оценку, то ранг всех этих значений принимается равным средней арифметической от соответствующих номеров мест, которые определяются. Данные ранги называются связанными (или повторяющимися). Для случая связанных рангов есть особые скорректированные формулы для коэффициентов Спирмена и Кендэлла, однако на практике часто пользуются формулами приведенными выше.
Корреляция альтернативных признаков
Для исследования степени тесноты связи между качественными признаками могут быть использованы коэффициенты контингенции Пирсона, ассоциации Юла и взаимной сопряженности Пирсона. В том случае, когда качественные признаки представлены в виде альтернативных (дихотомических), рассчитываются коэффициенты контингенции и ассоциации на основе четырехклеточных таблиц следующего вида:
Коэффициент контингенции: (8.13)
Коэффициент ассоциации: (8.14)
Значимость коэффициента ассоциации проверяется следующим образом:
, где (8.15)
(8.16)
Коэффициент ассоциации считается статистически значимым, если , где находится по таблице функции Лапласа при уровне значимости ά (обычно берется на уровне 5%).
Пример 8.7. В результате обследования работников предприятия получены следующие данные (чел.)
Требуется оценить тесноту взаимосвязи между уровнем образования и удовлетворенностью работой с помощью коэффициентов контингенции и ассоциации. Решение:
.
Коэффициенты контингенции и ассоциации изменяются в пределах [-1;+1], но величина коэффициента контингенции для тех же данных по абсолютной величине меньше величины коэффициента ассоциации, т.е .
В случае если каждый из качественных признаков состоит более чем из двух групп, то для определения тесноты связи используют коэффициент взаимной сопряженности Пирсона. Информация для оценки этой связи группируется в виде таблицы (mij – частоты взаимного сочетания двух качественных признаков).
Коэффициент взаимной сопряженности Пирсона определяется по формуле: (8.17) где - показатель средней квадратической сопряженности, рассчитываемый как
(8.18)
Интерпретация коэффициентов контингенции, ассоциации и взаимной сопряженности Пирсона аналогична интерпретации коэффициента корреляции Пирсона.
Пример 8.8. Для изучения влияния условий труда на взаимоотношения в коллективе было проведено выборочное обследование 250 работников предприятия, ответы которых распределились следующим образом:
Рассчитать коэффициент взаимной сопряженности Пирсона. Решение: .
Множественная корреляция. Изменение экономических явлений происходит под влиянием не одного, а большого числа различных факторов. Для измерения тесноты корреляционной связи между результативным признаком и несколькими факторными признаками при линейной форме связи рассчитывается коэффициент множественной корреляции. Коэффициент множественной корреляции, для случая двух факторных признаков x1 и x2 рассчитывается по формуле:
(8.19)
Множественный коэффициент корреляции изменяется в пределах [0;1] и численно не может быть меньше, чем любой из образующих его парных коэффициентов. Приближение R к единице свидетельствует о сильной зависимости между признаками. Средняя квадратическая ошибка коэффициента множественной корреляции определяется по формуле: (8.20)
Тогда, если , то с вероятностью близкой к 0,99 можно считать коэффициент множественной корреляции значимым.
Проверка значимости коэффициента множественной корреляции осуществляется так же по F-критерию Фишера. Для случая двух факторных признаков х1 и х2 он имеет вид:
(8.21)
Коэффициент множественной корреляции считается статистически значимым, если , где находится по таблице распределения Фишера с параметрами (а; 2; n – 3). В ходе изучения множественной корреляции рассчитывают также частные коэффициенты корреляции. Частные коэффициенты корреляции характеризуют степень тесноты связи между двумя признаками при фиксированном значении всех остальных. Для случая двух факторных признаков x1 и x2 формулы будут иметь вид:
(8.22)
(8.23)
В первом случае исключено влияние факторного признака х2, а во втором х1. Значения парного и частного коэффициентов корреляции отличаются друг от друга, т.к. парный коэффициент характеризует связь между двумя признаками без учета влияния других признаков, а частный учитывает наличие и влияние других факторов. Проверка значимости и расчет доверительных интервалов для частных коэффициентов корреляции аналогичны, как и для парных коэффициентов корреляции, с тем лишь отличием. Что число степеней свободы n определяется так: n = n - k., где k – порядок коэффициента частной корреляции.
|