Методы многомерного статистического анализа: характеристика возможностей и сферы применения
В многомерном статистическом анализе образовалось несколько взаимосвязанных направлений или разделов: - корреляционный анализ; - регрессионный анализ; - дисперсионный анализ; - дискриминантный анализ; - факторный анализ; - кластерный анализ. Корреляционный анализ изучает взаимосвязи между двумя или несколькими признаками. При этом устанавливается не только наличие связей, но и их теснота и направление. Инструментами корреляционного анализа являются коэффициенты корреляции: парные, частные, множественные, канонические. Регрессионный анализ – основной целью ставит формирование зависимости между результативными и факторными признаками, т.е. составление уравнения регрессии и оценку его параметров. Регрессионные зависимости могут быть: - одномерные, - многомерные, - линейные, - нелинейные, - гребеночные. Дисперсионный анализ позволяет исследовать влияние номинальных (качественных) признаков на результативные показатели; а также используется для проверки статистических гипотез в регрессионном анализе. Факторный анализ. Если число влияющих признаков невелико (5-7), то для описания связи и исследования зависимости между ними и результативным признаком используется кореляционно-регрессионный анализ, а если число признаков больше, эту же задачу выполняет факторный анализ. При этом влияющие признаки группируются в обобщающие факторы, которые в достаточной степени объясняют изменение изучаемого результативного признака. Таким образом, задача факторного анализа - заменить набор наблюдаемых признаков на меньшее число влияющих факторов, являющихся комбинацией исходных признаков. В основе этого метода лежит следующая гипотеза: измеряемые признаки являются лишь косвенными характеристиками изучаемого объекта, а на самом деле, существуют внутренние или скрытые свойства (факторы), число которых невелико, но которые объясняют поведение объекта. Основная цель факторного анализа – выявить скрытые факторы и установить зависимость между ними и результативным признаком. Пример: Уровень производительности труда зависит от большого числа признаков: квалификации работников, фондовооруженности труда, возраста оборудования, среднемесячной заработной платы и т.д. (до 40 признаков). С помощью факторного анализа удалось обнаружить, что решающее воздействие на производительность труда оказывают лишь несколько обобщающих факторов (например, размер предприятия, уровень организации труда), которые непосредственно не наблюдаются при исследовании. Дискриминантный анализ: этот метод наряду с кластерным анализом позволяет проводить классификацию исследуемых объектов, т.е. разделять исследуемую совокупность на однородные группы. Классификация с использованием предварительных сведений («обучение с учителем»)- дискриминантный анализ, а без них («обучение без учителя») - кластерный анализ. При этом в дискриминантном анализе количество групп устанавливается заранее, и надо найти лишь разделяемую плоскость между ними. Для этого в исследование включается большое число переменных с целью определения тех из них, которые наилучшим образом разделяют совокупность объектов на однородные группы. Например, при помощи дискриминантного анализа все страны мира можно разделить на 3 группы по уровню их человеческого развития – страны с высоким, средним и низким уровнем человеческого развития. Кластерный анализ ставит задачу формирования классификатора на основе сочетания ряда признаков и проведения самой группировки объектов наблюдения, при этом количество групп и их состав заранее неизвестны. Объекты социально-трудовой сферы по своим количественным и качественным характеристикам разбиваются на группы (кластеры) так, чтобы каждый объект принадлежал только одной группе и чтобы объекты, входящие в одну группу, были максимально схожи по ряду признаков. Решение задачи кластерного анализа - это определение меры, при помощи которой один объект может быть отделен от другого или соединен с ним. Например, при помощи процедур кластерного анализа можно провести разделение всех стран на группы по уровню жизни населения с использованием достаточно большого числа индикаторов уровня жизни.
|