И их особенности
Уравнение связи (уравнение регрессии) характеризует форму связи между результативным и факториальным признаками. Определение формы связи чрезвычайно важно для дальнейшего подбора функции, наилучшим образом описывающей взаимодействие факторных и результативного признаков. Уравнение связи определяется с помощью способа наименьших квадратов, который требует, чтобы сумма квадратов отклонений эмпирических значений от значений, получаемых на основании уравнения связи, была минимальной. Применение способа наименьших квадратов позволяет находить параметры уравнения связи при помощи решения системы так называемых нормальных уравнений, различных для связи каждого вида. Чтобы отметить, что зависимость между двумя признаками выражается и среднем, значения результативного признака, найденные по уравнению связи, обозначаются Ух. Зная уравнение связи, можно вычислить заранее среднее значение результативного признака, когда значение факториального признака известно. Таким образом, уравнение связи является методом обобщения наблюдаемых статистических связей, методом их изучения. Применение той или иной функции в качестве уравнения связи разграничивает связи по их форме: линейную связь и криволинейную связь (параболическую, гиперболическую и др.). Рассмотрим уравнения связи для зависимостей от одного признака при разных формах связи, (линейной, криволинейной параболической, гиперболической) и для множественной связи. Линейная зависимость между признаками. Уравнение связи как уравнение прямой ух = ао+а1х применяется в случае равномерного нарастания результативного признака с увеличением признака факториального. Такая зависимость будет зависимостью линейной (прямолинейной). Параметры уравнения прямой линии ао и а1 находятся путем решения системы нормальных уравнений, получаемых по способу наименьших квадратов: (8.6) Примером расчета параметров уравнения и средних значений результативного признака ух может служить следующая таблица (табл.8.1), являющаяся результатом группировки по факториальному признаку и подсчета средних по результативному признаку. Группировка предприятий по стоимости основных средств и подсчет сумм необходимы для уравнения связи. Таблица 8.1 Расчет исходных данных для определения параметров уравнения связи
Из таблицы находим: n==6; =18; =39,0; =71,5 = 132.0. Строим систему двух уравнений с двумя неизвестными: 6а0 + 18а1 = 39,0 18а0 + 71,5а1 = 132,0 Поделив каждый член в обоих уравнениях на коэффициенты при a0 получим: а0 + 3а1 = 6,5 а0 + 3,97а1 = 7,33 Вычтем из второго уравнения первое: 0,97а1=0,83; а1==0,86. Подставив значения а1 в первое уравнение a0 + 3 * 0,86 =6,5, найдем а0= 6,5 - 2,58 = 3,92. Уравнение связи примет вид: yx = 3,92 + 0,86х. Подставив в это уравнение соответствующие х, получим значения результативного признака, отражающие среднюю зависимость у от х в виде корреляционной зависимости. Заметим, что суммы, исчисленные по уравнению и фактические, равны между собой. Параболическая зависимость между признаками. Параболическая зависимость, выражаемая уравнением параболы 2-го порядка уx = а0+a1x+a2x2, имеет место при ускоренном возрастании или убывании результативного признака в сочетании с равномерным возрастанием факториального признака. Параметры уравнения параболы a0; а1; а2, вычисляются путем решения системы 3 нормальных уравнений: na0 + a1∑x + a2∑x2 = ∑y (8.7) a0∑x + a1∑x2 + a2∑x3 = ∑yx a0∑x2 + a1∑x3 + a2∑x4 = ∑yx2 Гиперболическая зависимость между признаками. Обратная связь указывает на убывание результативного признака при возрастании факториального. Такова линейная связь при отрицательном значении а1. В ряде других случаев обратная связь может быть выражена уравнением гиперболы Параметры уравнения гиперболы а0 и а1 находятся из системы нормальных уравнений: (8.8) где - сумма величин, обратных значениям факториального признака; - сумма квадратов величин, обратных значениям факториального признака. 8.3. Понятие о к орреляционной таблице и корреляционном отношении
При большом объеме наблюдений, когда число взаимосвязанных пар велико, парные данные легко могут быть расположёны в корреляционной таблице, являющейся наиболее удобной формой представления значительного количества пар чисел. В корреляционной таблице один признак располагается в строках, а другой — в колонках таблицы. Число, расположенное в клетке на пересечении графы и колонки, показывает, как часто встречается данное значение результативного признака в сочетании с данным значением факториального признака. Для простоты расчета возьмем небольшое число наблюдений на 20 предприятиях за средней месячной выработкой продукции на одного рабочего (тыс. руб. - у) и за стоимостью основных производственных средств (млн. руб. - х). В обычной парной таблице эти сведения располагаются так (табл. 8.2).
Таблица 8.2 Исходные данные наблюдений результативного и факторного признаков
Сведем эти данные в корреляционную таблицу (табл. 8.3). Таблица 8.3 Корреляционная таблица результативного и факторного признаков
Итоги строк у показывают частоту признака nу, итоги граф х - частоту признака nx. Числа, стоящие в клетках корреляционной таблицы, являются частотами, относящимися к обоим признакам, и обозначаются nxy. Корреляционная таблица даже при поверхностном знакомстве дает общее представление о прямой и обратной связи. Если частоты расположены по диагонали вниз направо, то связь между признаками прямая (при увеличивающихся значениях признака в строках и графах). Если же частоты расположены по диагонали вверх направо, то связь обратная. Теперь дадим представление о корреляционном отношении. Если произведено измерение явления по двум признакам, то имеется возможность находить меры рассеяния (главным образом дисперсию) по результативному признаку для одних и тех же значений факториального признака. Дана, например, корреляционная таблица (табл. 8.4) двух взаимозависимых рядов, в которых для простоты имеется лишь три значения факториального признака количества внесенных удобрений (х), а результативный признак - урожайность (у) - значительно колеблется. Таблица 8.4 Корреляционная таблица
Каждая группа участков с разной урожайностью имела разное количество внесенных удобрений. Так, когда вносилось удобрений по 20 г/ урожайность на разных участках была равной: на одном участке она составила 0,8 т, на двух участках — 0,9 т, на трех — 1,0 т и на одном — 1,1 т. Найдем среднюю урожайность и дисперсию по урожайности для этой группы участков.
Для группы участков с количеством внесенных удобрений 30,0 г средняя урожайность составит: Дисперсия равна: Вычислим аналогичные характеристики для группы участков, получивших удобрений по 40 т: Из этих данных можно определить также средний урожай всех 20 участков, независимо от количества внесенных удобрений, т.е. общую среднюю: и меру колеблемости (дисперсию) средней урожайности групп •около общей средней. Эту дисперсию называют межгрупповой дисперсией и обозначают d2 (8.9) где уi—средние урожайности по группам участков, отличающихся количеством внесенных удобрений; m1, m2, m3 — численности групп. Межгрупповая дисперсия для данного примера составит: Межгрупповая дисперсия показывает рассеяние, возникающее за счет факториального признака. В данном примере у = 0,010247 является показателем рассеяния урожайности, возникшего за счет разности в количестве внесенных удобрений. Однако, кроме межгрупповой дисперсии, можно вычислить и дисперсию как показатель рассеяния за счет остальных факторов (если называть так все прочие факторы, кроме удобрений). Этот показатель явится средней (взвешенной) величиной из показателей рассеяния (дисперсий) по группам участков (8.10) Для нашего примера: Сумма межгрупповой дисперсии и средней из дисперсий групп равна общей дисперсии: (8.11) Это практически означает, что можно получить общую меру рассеяния (дисперсию) для всех 20 участков, если имеются сведения о средних и дисперсиях по группам участков, отличающихся количеством внесенных удобрений. Следовательно, общая дисперсия по урожайности для 20 участков составит: s2 = 0,010247 + 0,006094 = 0,016341. Формулы для исчисления межгрупповой и средней из групповых дисперсий можно сокращенно записать так: (8.12) (8.13) Расчет общей дисперсии, внутригрупповой и межгрупповой дисперсии позволяет делать некоторые выводы о мере влияния факториального признака на колеблемость признака результативного. Эта мера влияния находится при помощи корреляционного отношения: (8.14) где h - показатель корреляционного отношения; - межгрупповая дисперсия; s2 – общая дисперсия. Корреляционное отношение показывает, какую долю в общей мере рассеяния (дисперсии) занимает дисперсия, возникающая за счет влияния факториального признака. Для приведенного выше примера . Значит, колеблемость по урожайности участков на 78% зависит от колеблемости количества внесенных удобрений.
|