Методика множественного корреляционного анализа
Экономические явления и процессы хозяйственной деятельности предприятий зависят от большого количества факторов, и как правило, только комплекс факторов в их взаимосвязи может дать более или менее полное представление о характере изучаемого явления. Многофакторный корреляционный анализ состоит из нескольких этапов. На первом этапе определяются факторы, которые оказывают воздействие на изучаемый показатель, и отбираются наиболее существенные для корреляционного анализа.
130 131 V На втором этапе собирается и оценивается исходная информация, необходимая для корреляционного анализа. На третьем этапе моделируется связь между факторным и результативным показателями, т.е. подбирается и обосновывается математическое уравнение, которое наиболее точно выражает сущность исследуемой зависимости. На четвертом этапе рассчитываются основные показатели связи корреляционного анализа. На пятом этапе дается статистическая оценка результатов корреляционного анализа и производится практическое их применение. Отбор факторов для корреляционного анализа ~ очень важный момент: от того, насколько правильно отобраны факторы, зависят конечные результаты анализа. Главная роль при отборе факторов принадлежит теории, а также практическому опыту анализа. При этом необходимо придерживаться следующих правил. 1. В первую очередь следует учитывать причинно-следственные связи между показателями, ибо только они раскрывают сущность изучаемых явлений. Анализ же таких факторов, которые находятся только в математических соотношениях с результативным показателем, не имеет практического смысла. 2. При создании многофакторной корреляционной модели необходимо отбирать самые значимые факторы, которые оказывают решающее воздействие на результативный показатель, так как охватить все условия и обстоятельства практически невозможно. Факторы, которые имеют критерий надежности по Стьюденту меньше табличного, не рекомендуется принимать в расчет. 3. В корреляционную модель линейного типа не рекомендуется включать факторы, связь которых с результативным показателем имеет криволинейный характер. 4. Нельзя включать в корреляционную модель взаимосвязанные факторы. Если парный коэффициент корреляции между двумя факторами больше 0,85, то по правилам корреляционного анализа один из них необходимо исключить, иначе это приведет к искажению результатов анализа. 5. Не рекомендуется включать в корреляционную модель факторы, связь которых с результативным показателем носит функциональный характер. Большую помощь при отборе факторов для корреляционной модели оказывают аналитические группировки, способ сравнения параллельных и динамических рядов, линейные графики. С их по- мощью можно определить наличие, направление и форму зависимости между изучаемыми показателями. Отбор факторов можно производить также в процессе решения задачи корреляционного анализа на основе оценки их значимости по критерию Стьюдента. Учитывая перечисленные требования и используя названные способы отбора факторов, для многофакторной корреляционной модели уровня рентабельности (У) подобраны следующие факторы, оказывающие наиболее существенное влияние на ее уровень: х[ — материалоотдача, руб.; х2 — фондоотдача, коп.; х3 — производительность труда (среднегодовая выработка продукции на одного работника), тыс. руб.; х4 — продолжительность оборота оборотных средств предприятия, дни; х5 — удельный вес продукции высшей категории качества, %. Поскольку корреляционная связь достаточно полно проявляется только в массе наблюдений, объем выборки данных должен быть достаточно большим, так как только в массе наблюдений сглаживается влияние других факторов. Чем большая совокупность объектов исследуется, тем точнее результаты анализа. Учитывая это требование, влияние перечисленных факторов на уровень рентабельности исследуется на примере 40 предприятий. Собранная исходная иноЬормаиця по каждому факторному и результативному показателю должна быть проверена на точность, на однородность и на соответствие закону нормального распределения. В первую очередь необходимо убедиться в достоверности информации, соответствии ее объективной действительности, поскольку использование недостоверной информации приведет к неточным результатам анализа и к неправильным выводам. Информация должна быть однородной относительно ее распределения около среднего уровня. Если в совокупности имеются группы объектов, которые значительно отличаются от среднего уровня, то это говорит о неоднородности исходной информации. Критерием однородности информации являются среднеквад-ратическое отклонение и коэффициент вариации, которые рассчитываются по каждому факторному и результативному показателю. Средиеквадратическое отклонение показывает абсолютное отклонение индивидуальных значений от среднеарифметической. Его значение определяют по формуле
132 133
Коэффициент вариации показывает относительную меру отклонения отдельных значений от среднеарифметической. Он рассчитывается по формуле (6.8)
Чем больше коэффициент вариации, тем относительно больший разброс и меньшая выравненность изучаемых объектов. Изменчивость вариационного ряда принято считать незначительной, если вариация не превышает 10%, средней — если составляет 10—20%, значительной — если она больше 20%, но не превышает 33%. Вариация выше 33% свидетельствует о неоднородности информации и о необходимости исключения нетипичных наблюдений, которые обычно бывают в первых и последних ранжированных рядах выборки (табл. 6.4). Таблица 6.4 Показатели статистической характеристики исходной информации
В табл. 6.4 самая высокая вариация пох5 (К= 22,98), но она не превышает 33%. Значит, исходная информация является однородной и ее можно использовать для дальнейших расчетов.
V— вариация, %; t — показатель надежности связи, который при уровне вероятности Р = 0,05 равен 1,96; т — показатель точности расчетов (для экономических расчетов допускается ошибка 5—8 %). Значит, принятый в расчет объем выборки (40 предприятий) является достаточным для проведения корреляционного анализа. Подчинение исходной информации закону нормального распределения означает, что основная масса исследуемых данных по каждому показателю должна быть сгруппирована около ее среднего значения, а объекты с очень маленькими или очень большими значениями должны встречаться как можно реже. График нормального распределения приведен на рис. 6.1. Рис. 6.1. График нормального распределения информации Для количественной оценки степени отклонения информации от нормального распределения используются отношение показателя асимметрии к ее ошибке и отношение показателя эксцесса к его ошибке. Показатель асимметрии (А) и его ошибка (та) рассчитываются по следующим формулам:
Показатель эксцесса (Е) и его ошибка (те) рассчитываются следующим образом:
134 135 В симметричном распределении Л = 0. Отличие от нуля указывает на наличие асимметрии в распределении данных около средней величины. Отрицательная асимметрия свидетельствует о преобладании данных с большими значениями; положительная асимметрия — о том, что чаше встречаются данные с небольшими значениями. В нормальном распределении показатель эксцесса Е = 0. Если Е > 0, то данные густо сгруппированы около средней, образуя островершинность. Если Е< 0, то кривая распределения будет плосковершинной. Однако когда отношения А/та и Е/те меньше 3, то асимметрия и эксцесс не имеют существенного значения и исследуемая информация соответствует закону нормального распределения. В табл. 6.4 во всех случаях отношения Л/та и Е/те не превышают 3, значит, исходная информация подчиняется этому закону. Моделирование связи между факторными и результативными показателями предусматривает подбор соответствующего уравнения, которое наиболее точно описывает изучаемые зависимости. Для его обоснования используются те же приемы, что и для установления наличия связи: аналитические фуппировки, линейные графики и др. Если связь всех факторных показателей с результативным носит прямолинейный характер, то для записи этих зависимостей можно использовать линейную функцию К = а + V, + bfr +... + Ь„х„. (6.12) При криволинейной форме зависимости между результативным и факторными показателями может быть использована степенная функция или логарифмическая функция }gYx = hb+bl]gxl+b2]gx2+... + b„\gx„. (6.14) Приведенные модели выгодны тем, что их параметрам (Ь{) можно дать экономическое объяснение (интерпретацию). В линейной модели коэффициенты bi показывают, на сколько единиц изменяется результативный показатель с изменением факторного на единицу в абсолютном выражении, в степенных и логарифмических — в процентах. В случаях когда трудно обосновать форму зависимости, решение задачи можно провести по разным моделям и сравнить полу- ченные результаты. Адекватность разных моделей фактическим зависимостям проверяется по критерию Фишера, показателю средней ошибки аппроксимации и величине множественного коэффициента детерминации, о которых речь пойдет несколько позже. Изучение взаимосвязей между исследуемыми факторами и уровнем рентабельности показало, что все зависимости в нашем примере имеют прямолинейный характер. Поэтому для их описания использована линейная функция. Решение задачи многофакторного корреляционного анализа проводится на ПЭВМ по типовым программам, которые содержатся в пакете «Статистика». Сначала формируется матрица исходных данных (табл. 6.5), в первой колонке которой записывается порядковый номер наблюдения, во второй — значения результативного показателя (К), а в следующих — значения факторных показателей (*,-)■ Таблица 6.5 Исходные данные для корреляционного анализа
Эти сведения вводятся в ПЭВМ, и на их основании рассчитываются матрицы парных и частных коэффициентов корреляции, уравнение множественной регрессии, а также показатели, с помощью которых оценивается надежность коэффициентов корреляции и уравнение связи: критерий Стьюдента (t), критерий Фишера (Е), средняя ошибка аппроксимации (е), множественные коэффициенты корреляции (R) и детерминации (D). Изучая матрицы парных и частных коэффициентов корреляции, можно сделать вывод о тесноте связи между изучаемыми явлениями. Коэффициенты парной корреляции характеризуют тесноту связи между двумя показателями в общем виде с учетом взаимодействия с остальными факторами, определяющими уровень результативного показателя. Данные табл. 6.6 (первый столбец) свидетельствуют о том, что все факторы оказывают ощутимое воздействие на уровень рентабельности. Особенно тесно рентабельность связана с материало-
136 137 Таблица 6.6 Матрица парных коэффициентов корреляции
отдачей, фондоотдачей, качеством продукции и производительностью труда. С увеличением данных показателей уровень рентабельности повышается (прямая связь); при увеличении продолжительности оборота средств рентабельность снижается (обратная связь). Однако необходимо отметить, что парные коэффициенты корреляции получены при условии воздействия других факторов на результат. Чтобы абстрагироваться от их влияния и получить количественную характеристику связи между результативным и факторными показателями в чистом виде, рассчитываются частные коэффициенты корреляции (табл. 6.7). Таблица 6.7 Матрица частных коэффициентов корреляции
При сравнении частных коэффициентов корреляции с парными видно, что влияние других факторов на тесноту связи между уровнем рентабельности и исследуемыми факторами довольно значимое: частные коэффициенты корреляции намного ниже парных. Это свидетельствует о том, что факторы, которые входят в данную корреляционную модель, оказывают на рентабельность не только непосредственное, но и косвенное влияние. Поэтому 138 взаимосвязи, очищенные от влияния сопутствующих факторов, получились менее тесными. В некоторых случаях они могут оказаться более тесными, если исключить влияние факторов, которые действуют в противоположном направлении. По этой причине может измениться не только величина коэффициента корреляции, но и направление связи: в общем виде связь может быть прямой, а в чистом виде — обратной, и наоборот. Объясняется это тем, что при расчете парных коэффициентов корреляции изучается взаимосвязь между результативным и факторным показателем с учетом их взаимодействия и с другими факторами. Например, с повышением уровня оплаты труда рентабельность увеличивается, если темпы роста производительности труда обгоняют темпы роста его оплаты. Поэтому в обшем виде взаимосвязь между уровнем рентабельности и уровнем оплаты труда будет прямой. Если же взять непосредственную связь между этими показателями при условии неизменности производительности труда и других факторов, то при повышении оплаты труда рентабельность будет снижаться, т.е. частный коэффициент корреляции будет со знаком минус. Таким образом, с помощью парных и частных коэффициентов корреляции можно получить представление о степени связи между изучаемыми явлениями в общих- и непосредственных соприкосновениях. Значительный интерес представляют коэффициенты корреляции, характеризующие взаимосвязь факторов. Как уже отмечалось, в корреляционную модель надо подбирать независимые между собой факторы. Если коэффициент корреляции между двумя факторными показателями выше 0,85, то один из них необходимо исключить из модели. Исследование матрицы коэффициентов корреляции позволяет сделать вывод, что в данную модель включены факторы, не очень тесно связанные между собой. При изучении тесноты связи надо иметь в виду, что величина коэффициентов корреляции является случайной, зависящей от объема выборки. Известно, что с уменьшением количества наблюдений надежность коэффициентов корреляции падает, и наоборот, при увеличении количества наблюдений надежность коэффициентов корреляции возрастает. Значимость коэффициентов корреляции проверяется по критерию Стьюдента / = — = -^- = 5,72, (6.15) <уг 0,103 V ' 139 где ог — среднеквадратическая ошибка коэффициента корреляции, которая определяется по формуле
(6.16) Если расчетное значение t выше табличного, то можно сделать заключение о том, что величина коэффициента корреляции является значимой. Табличные значения t находят по таблице значений критериев Стьюдента. При этом учитываются количество степеней свободы (V= n - 1) и уровень доверительной вероятности (в экономических расчетах обычно 0,05 или 0,01). В нашем примере количество степеней свободы равняется п - 1 = 40 - 1 = 39. При уровне доверительной вероятности Р = 0,05 t — 2,02. Поскольку / фактическое во всех случаях выше t табличного, связь между результативным и факторными показателями является надежной, а величина коэффициентов корреляции — значимой (табл. 6.8). Таблица 6.8 Фактические значения критерия Стьюдента
Следующий этап корреляционного анализа — расчет уравнения связи (регрессии), который проводится обычно шаговым способом. Сначала в расчет принимается один фактор, который оказывает наиболее значимое влияние на результативный показатель, потом второй, третий и т.д. На каждом шаге рассчитываются уравнение связи, множественный коэффициент корреляции (К) и детерминации (/)), /"-отношение (критерий Фишера), стандартная ошибка (е) и другие показатели, с помощью которых оценивается надежность уравнения связи. Величина их на каждом шаге сравнивается с предыдущей. Чем выше величина коэффициентов множественной корреляции, детерминации и критерия Фишера и чем ниже величина стандартной ошибки, тем точнее уравнение связи описывает зависимости, сложившиеся между исследуемыми показателями. Если добавление следующих факторов не улучшает оценочных показателей связи, то надо их отбросить, т.е. остановиться на том уравнении, где эти показатели наиболее оптимальны. Сравнивая результаты на каждом шаге (табл. 6.9), можно сделать вывод, что наиболее полно описывает зависимости между \-щ Таблица 6.9 % - Результаты расчета уравнения связи
изучаемыми показателями пятифакторная модель, полученная на пятом шаге. Уравнение связи на этом шаге имеет следующий вид: Yx = 0,49 + 3,65х, + 0,09х2 + 1,02х3 - 0,122х4 + 0,052х5, где хх — матери ал оотдача, руб.; х2 — фондоотдача, коп.; х3 — производительность труда (среднегодовая выработка продукции на одного работника), тыс. руб.; г х4 — продолжительность оборота оборотных средств предпри -г ятия, дни; | х5 — удельный вес продукции высшей категории качества, ' %. Коэффициенты уравнения показывают количественное воздействие каждого фактора на результативный показатель при неизменности других. В данном случае можно дать следующую интерпретацию полученному уравнению: рентабельность повышается на 3,65% при увеличении материалоотдачи на 1 руб.; на 0,09% — с ростом фондоотдачи на 1 коп.; на 1,02% — с повышением среднегодовой выработки продукции одним работником на 1 тыс. руб.; на 0,052% — при повышении удельного веса продукции высшей категории качества на 1 %. С увеличением продолжительности оборота средств на 1 день рентабельность снижается в среднем на 0,122%. Коэффициенты регрессии в уравнении связи имеют разные единицы измерения, что делает их несопоставимыми, если возникает вопрос о сравнительной силе воздействия факторов на результативный показатель. Чтобы привести их в сопоставимый вид, все переменные уравнения регрессии выражают в долях среднеквад-ратического отклонения — другими словами, рассчитывают стан-
140 141 дартизованные коэффициенты регрессии. Их еще называют бета-коэффициентами по символу, который принят для их обозначения (β). Бета-коэффициенты и коэффициенты регрессии связаны следующим отношением: Бета-коэффициенты показывают, что если величина фактора увеличится на одно среднеквадратическое отклонение, то соответствующая зависимая переменная увеличится или уменьшится на долю своего среднеквадратического отклонения. Сопоставление бета-коэффициентов позволяет сделать вывод о сравнительной степени воздействия каждого фактора на величину результативного показателя. В нашем примере наибольшее влияние на уровень рентабельности оказывают материалоотдача, фондоотдача и производительность труда (табл. 6.10). Таблица 6.10 Коэффициенты эластичности и бета-коэффициенты
(6.18)
Коэффициенты эластичности показывают, на сколько процентов в среднем изменяется функция с изменением аргумента на 1%. Согласно данным табл. 6.10 рентабельность возрастает на 0,374% при увеличении уровня материалоотдачи на 1%, на 0,308 — при повышении фондоотдачи на 1 % и т.д.
|