Тема 16 (5). Кластерный анализ (2 часа)
1 Сущность и область применения 2 Процедура выполнения
Вопрос 1 – Сущность и область применения Кластерный анализ – это совокупность методов, позволяющих классифицировать многомерные наблюдения, каждое из которых описывается набором исходных переменных Х1,Х2,..., Хm. Целью кластерного анализа является образование групп схожих между собой объектов, которые принято называть кластерами. Объекты в каждом кластере должны быть похожи между собой и отличаться от объектов в других кластерах. Кластерный анализ также называют классификационным анализом или численной таксономией (систематикой). Кластерный анализ предназначен для классификации переменных. Группы, или кластеры, определяют с помощью собранных данных, а не заранее (как в дискриминантном анализе). Кластерный анализ используют в маркетинге для различных целей: – сегментация рынка; – понимание поведения покупателей; – определение возможностей нового товара или позиционирование товара. Кластеризацией торговых марок и товаров можно определить конкурентоспособные наборы в пределах данного рынка. Фирма может изучить свои текущие предложения в сравнении с предложениями своих конкурентов; – выбор тестовых рынков. Группировкой городов в однородные кластеры можно подобрать сравнимые города для проверки различных маркетинговых стратегий; – сокращение размерности данных. Кластерный анализ можно использовать как основной инструмент сокращения размерности данных при создании кластеров или подгрупп данных, более удобных для анализа, чем отдельные наблюдения. Последующий многомерный анализ выполняют над кластерами, а не над отдельными наблюдениями. К понятиям, используемым в кластерном анализе, относятся: – мера расстояния и сходства – способ вычисления расстояния между объектами; – метод объединения – правила определения расстояния между кластерами, используемые в агломеративной иерархической кластеризации; – кластерный центроид – среднее значение переменных для всех случаев или объектов в конкретном кластере; – кластерные центры (зерна кластеризации) – исходные начальные точки в неиерархической кластеризации; – принадлежность кластеру; – древовидная диаграмма (дендрограмма, древовидный граф) – графическое средство для показа результатов кластеризации. Вертикальные линии представляют объединяемые кластеры. Положение вертикальной линии на шкале расстояния (горизонтальная ось) показывает расстояния, при которых объединяли кластеры; – расстояния между кластерными центрами – указывают, насколько разнесены отдельные пары кластеров. Кластеры, которые разнесены широко, ясно выражены и поэтому желательны.
Вопрос 2 – Процедура выполнения Этапы выполнения кластерного анализа:
|