Статистическое изучение взаимосвязи
Типовая задача 1. Пусть по 10 однотипным предприятиям имеются следующие данные о выпуске продукции (х) в тоннах (графы 1 и 2 таблицы). Требуется найти уравнение зависимости расхода топлива от выпуска продукции (или уравнение регрессии у по х) и измерить тесноту зависимости между ними. Решение: А. Рассматривая уравнение регрессии в форме линейной функции вида`ух = а0 + а1х, параметры данного уравнения (а0 и а1) найдем из системы нормальных уравнений: na0 + a1å x = å y, a0å x + a1å x2 = å xy. Таблица 5.1
Необходимые для решения суммы å х, å у, å х2, å ху рассчитаны выше в таблице. Подставляем их в уравнения и решаем систему: 10а0 + 125а1 = 80, 125а0 + 1961 а1 = 1218.
а0 = 1, 16; а1 = 0, 547. Отсюда`ух = 1, 16 + 0, 547х. Подставляя в это уравнение последовательно значения х = 5, 6, 8, 10 и т.д., получаем выравненные (теоретические) значения результативного показателя`ух (графа 5 таблицы).
Б. Для измерения тесноты зависимости между у и х воспользуемся прежде всего линейным коэффициентом корреляции (поскольку зависимость рассматривалась линейной): а) применяем формулу Находим ху = 121, 8; `х = 12, 5; `у = 8; `х2 = 196, 1. Определяем sх и sу, предварительно найдя å у2 = 770 и `у2 = 77:
Отсюда Значение линейного коэффициента корреляции r = 0, 96 (т.е. близкое к единице) характеризует не только меру тесноты зависимости вариации у от вариации х, но и степень этой зависимости к линейной; б) воспользуемся еще одной формулой линейного коэффициента корреляции: т.е. результат тот же. При расчете коэффициента корреляции очень важно оценить его значимость. Оценка значимости (существенности) линейного коэффициента корреляции основана на сопоставлении значения r с его средней квадратической ошибкой (sr). Средняя ошибка коэффициента корреляции при n > 50 рассчитывается приближенно по формуле Если при этом коэффициент корреляции r превышает свою среднюю ошибку sr больше чем в 3 раза, т.е. если то он считается значимым, а связь – реальной. При n < 30 значимость коэффициента корреляции проверяется на основе t-критерия Стьюдента. Для этого рассчитывается фактическое (расчетное) значение критерия которое сопоставляется с tтабл, для числа степеней свободы v = n – 2 и заданного уровня значимости (обычно a = 0, 05). Если tфакт > tтабл, r считается значимым, а связь – реальной. Если tфакт < tтабл, то считается, что связь между х и у отсутствует и значение r, отличное от нуля, получено случайно. В рассматриваемом примере средняя ошибка коэффициента корреляции: а Находим, что при числе степеней свободы v = 10 – 2 = 8 и уровне значимости a = 0, 05 табличное (критическое, пороговое) t равно 2, 306, т.е. tтабл = 2, 306. Поскольку фактическое (расчетное) t больше табличного, т.е. tфакт > tтабл, то линейный коэффициент корреляции r = 0, 96 считается значимым, а связь между х и у – реальной.
Типовая задача 2. По группе однородных предприятий имеются данные об объеме выпущенной продукции и уровне механизации трудоемких и тяжелых работ. Таблица 5.2
Требуется оценить степень тесноты связи между показателями механизации трудоемких и тяжелых работ и объемом продукции при помощи коэффициента Фехнера. Решение: Для расчета коэффициента Фехнера составляется вспомогательная таблица. Коэффициент Фехнера определяется по формуле где nа – количество совпадений знаков (х -`х) и (у -`у); nb – количество несовпадений знаков. В нашем примере (см. табл. 4.3) nа = 9; nb = 3. Таким образом Таблица 5.3
Полученное значение коэффициента свидетельствует о наличии связи между уровнем механизации работ и объемом продукции.
Типовая задача 3. По группе акционерных коммерческих банков региона имеются следующие данные. Исчислить коэффициент корреляции рангов для оценки тесноты связи между суммой прибыли банка и размером его активов. Таблица 5.4
Решение: Для расчета коэффициента корреляции рангов предварительно выполняется ранжирование банков по уровню каждого признака.
Таблица 5.5
Дальнейшие расчеты даны в таблице 5.6: Таблица 5.6 Вспомогательная таблица для расчета коэффициента корреляции рангов
По таблице определяется при объеме выборки 10 единиц (n = 10) и уровне значимости 5 % (a = 0, 05) критическая величина для рангового коэффициента корреляции. Она составляет ± 0, 6364. Поэтому общий вывод по результату анализа: есть необходимость увеличивать объем выборки.
Типовая задача 4. В результате обследования работников предприятия получены следующие данные (чел). Требуется оценить тесноту связи между уровнем образования и удовлетворенностью своей работой с помощью коэффициентов ассоциации и контингенции. Таблица 5.7
Решение: Коэффициент ассоциации – Юла Коэффициент контингенции – Пирсона Полученные коэффициенты подтверждают наличие существенной связи между исследуемыми признаками. Однако коэффициент контингенции всегда бывает меньше коэффициента ассоциации и дает более корректную оценку тесноты связи. Типовая задача 4. Для изучения влияния условий производства на взаимоотношения в коллективе было проведено выборочное обследование 250 рабочих, ответы которых распределились следующим образом. Таблица 5.8
Требуется охарактеризовать связь между исследуемыми показателями с помощью коэффициента взаимной сопряженности К. Пирсона и А.А. Чупрова. Сформулировать вывод. Решение: Коэффициент взаимной сопряженности К. Пирсона определяется по формулам:
Коэффициент взаимной сопряженности А.А. Чупрова: Полученное значение коэффициента взаимной сопряженности К. Пирсона свидетельствует, что связь между условиями производства и взаимоотношениями в коллективе весьма заметна. Коэффициент А.А. Чупрова также не опровергает наличие установленной связи. Типовая задача 5. Пусть имеются следующие условные данные по 5 предприятиям (графы 1, 2, 3, 4 таблицы). Определить (измерить) тесноту зависимости между у, х и z с помощью коэффициента конкордации (W).
Таблица 5.9
По данным таблицы Решение: 1. Ранжируем каждый из трех показателей (факторов) (графы 5, 6, 7). 2. Находим сумму рангов по каждой строке (графа 8) и общую сумму пяти строк. 3. Возводим в квадрат сумму рангов в каждой строке и находим общую сумму пяти строк (графа 9). 4. Находим S по формуле где Ri – ранг i-го показателя. S = 425 – (45)2 / 5 = 20. Этот же результат получим, рассчитывая S по формуле сначала определяем тогда 5. Рассчитываем коэффициент конкордации: Учитывая малую величину значения W, можно сказать, что зависимость между рассматриваемыми показателями (факторами) весьма незначительна. Коэффициент конкордации часто используется в экспертных оценках для определения согласованности мнения m экспертов в распределении мест (рангов) между n исследуемыми факторами или объектами по их приоритетности. Задачи 5.1. Составить линейное уравнение регрессии и определить тесноту связи между показателями (линейный коэффициент корреляции, теоретическое и эмпирическое корреляционное соотношения, коэффициент детерминации, индекс корреляции) по данным табл. 5.10.
Таблица 5.10 Исходные данные к задаче 5.1
5.2. Составить линейное уравнение регрессии: x × y = 106; x = 11; x2 = 137; y = 9; y2 = 85; a0 = 4, 8.
5.3. Эмпирическое корреляционное соотношение равно 0, 9; величина совокупности - 100. Дисперсия равна 6, 6. Определить среднюю из групповых дисперсий (внутригрупповую).
5.4. Имеет место зависимость выпуска продукции y от размера основного капитала x по 20 предприятиям. Уравнение регрессии имеет вид yx = 12, 0 + 0, 5 × x. Средняя величина основного капитала x равна 12, 0 млн р.; среднее квадратическое отклонение основного капитала s x = 3, 5 млн р. средний выпуск продукции y равен 18 млн р.; среднее квадратическое отклонение по выпуску продукции s y = 2, 0 млн р. Определить линейный коэффициент корреляции.
5.5. Среднее значение x равно 20, средний квадрат x - 436; среднее значение y - 60; средний квадрат y – 3700; линейный коэффициент корреляции rxy = 0, 75. Составить линейное уравнение регрессии.
5.6. Определить тесноту связи между производитель-ностью труда и стажем работы на основе эмпирического корреляционного соотношения. Таблица 5.11
5.7. Составить линейное уравнение регрессии. Таблица 5.12
5.8. Составить линейное уравнение регрессии по данным табл. 4.13.
Таблица 5.13
5.9. Имеются следующие данные о росте 8 пар братьев и сестер, представленные в табл. 4.14: Таблица 5.14
Определить тесноту зависимости между ростом братьев и сестер на основе: а) коэффициента Фехнера; б) коэффициентов корреляции рангов Спирмэна и Кендэла. 5.10. У восьми учащихся колледжа зафиксировано следующее количество баллов, полученных за самостоятельные работы по математике (х) и по гуманитарным предметам (у):
Таблица 5.15
Для характеристики корреляции между успеваемостью по математике и гуманитарным предметам рассчитать: а) коэффициент Фехнера; б) коэффициент корреляции рангов Спирмэна; в) коэффициент корреляции рангов Кендэла.
5.11. На основе опроса 400 работников коммерческих структур и 400 работников бюджетных организаций получено следующее их распределение по ответам на вопрос, довольны ли они своей заработной платой: Таблица 5.16
1. С помощью критерия Пирсона c2 определить, случайно или неслучайно данное распределение. 2. Рассчитать коэффициенты ассоциации и контингенции.
5.12. Имеются следующие данные о распределении 200 молочных ферм области по производительности труда и себестоимости молока:
Таблица 5.17
1. С помощью критерия c2 проверить, случайно ли данное распределение, т.е. существует ли зависимость между производительностью труда и себестоимостью молока. 2. Измерить тесноту зависимости между указанными показателями с помощью коэффициентов взаимной сопряженности Пирсона и Чупрова.
5.13. Имеются следующие данные по Северо-Западному району РФ: Таблица 5.18
С помощью коэффициента конкордации определить, согласуется ли «рейтинг» областей по всем показателям.
5.14. Имеются следующие данные по областям Центрально-Черноземного района РФ:
Таблица 5.19
1. Измерить тесноту связи между х1 и х2 с помощью коэффициентов корреляции рангов: а) Спирмэна; б) Кендэла. 2. С помощью коэффициента конкордации W определить, согласуется ли «рейтинг» областей по показателям х1, х2, х3.
Домашнее задание Задача 1. Совокупность разбита на три группы: n1 = 10; n2 = 20; n3 = 20. Средние значения по группам равны соответственно: x1 =5; x2 = 8; x3 = 15. Общая дисперсия составляет 18, 5. Определить эмпирическое корреляционное соотношение.
Задача 2. Среднее значение x равно 15, средний квадрат x - 289; среднее значение y - 50; среднее квадратическое отклонение по y - 4, линейный коэффициент корреляции rxy = = 0, 6. Составить линейное уравнение регрессии. Задача 3. Определить тесноту связи, рассчитав линейный коэффициент корреляции, теоретическое корреляционное соотношение, коэффициент детерминации, индекс корреляции. Составить уравнение регрессии.
Таблица 5.20
Задача 4. Определить эмпирическое корреляционное соотношение. Таблица 5.21
Задача 5. Получены следующие результаты анкетного обследования рабочих, имеющих вторичную занятость: Таблица 5.22
1. С помощью критерия c2 проверить, является ли данное распределение случайным. 2. Измерить тесноту зависимости между признаками, положенными в основу группировки, с помощью коэффициентов взаимной сопряженности: а) Пирсона; б) Чупрова. Задача 6. По восьми предприятиям имеются следующие условные данные об энерговооруженности труда (х) и производительности труда (у): Таблица 5.23
Измерить тесноту зависимости между х и у, используя: 1) коэффициент Фехнера; 2) коэффициенты корреляции рангов; 3) линейный коэффициент корреляции.
|