Принятие решения о количестве размерностей.
Цель многомерного шкалирования – получить пространственную карту с наименьшим количеством размерностей, которая наилучшим образом подходит для анализа данных. Однако пространственные карты рассчитывают таким образом, что соответствие модели исходным данным увеличивается с ростом количества размерностей пространства. Вообще говоря, чем больше размерность пространства, используемого для воспроизведения расстояний, тем лучше согласие воспроизведенной матрицы с исходной (меньше значение стресса). Если взять размерность пространства равной числу переменных, то возможно абсолютно точное воспроизведение исходной матрицы расстояний. Однако в связи с тем, что визуальную интерпретацию можно проводить только в двумерном пространстве или с тремя осями, всегда предпочтительнее иметь меньшее число последних. Поэтому следует идти на компромисс. Для определения того насколько принятое в рамках многомерного шкалирования решение соответствует точному отображению исходных данных, используют показатель стресса: чем выше значение стресса, тем ниже качество подгонки модели. Обычно величина стресса возрастает по мере уменьшения числа осей. Существует несколько подходов к определению количества размерностей: – определение, основанное на предварительной информации; – определение, основанное на критерии изогнутости, – необходимое число осей можно получить, построив график зависимости стресса от их числа. Как и в случае с факторным анализом (график «каменистой осыпи»), а также кластерным анализом (график сумм квадратов ошибок), выбор числа осей зависит от того, в какой точке начинается скачкообразное изменение стресса; – определение, основанное на легкости использования – иногда намеренно стремятся получить двумерное представление, поскольку его проще интерпретировать.
|