Комбінаторний метод ієрархічної класифікації
Мета роботи. Здійснити методом кластерного аналізу ієрархічну класифікацію даних, представлених матрицею близькостей, отриманою в попередніх дослідженнях та відобразити результати у вигляді дендрограми та площинної діаграми.
Зміст роботи. Суть даної роботи полягає в реалізації конкретної процедури класифікації відповідним чином підготовлених даних. Підготовка даних означає, що вони ретельно відібрані, перевірені представлені матрицею близькостей, причому допускається використана при формуванні матриці близькостей метрика, оскільки в іншому випадку матрицю близькостей необхідно обчислювати заново. Загальний алгоритм процедури класифікації можна представити як основний цикл об’єднань наступними кроками. Крок 1. Кожен з елементів, які підлягають класифікації, розглядається як окремий кластер. Обчислюється початкова матриця міжкластерних відстаней Крок 2. Поглядається матриця Крок 3. Об’єднуються два кластери Крок 4. Обчислюються нові відстані Зауваження. Якщо об’єднується Більш конкретно зміст процедури об’єднання можна пояснити на наступному прикладі. Припустимо, що маємо п’ять індивідуумів, для яких задані міри відмінностей Використовуємо для групування гнучку стратегію, яка зберігає метрику простору, з параметром
1. Знаходимо найменше значення в матриці
Стовпчик 1 і стрічка 1 відкидаються, а замість стовпчика 2 і стрічки 2 записується стовпчик 6 і стрічка 6. Отримуємо нову матрицю:
Тепер найменше значення в матриці
Стовпчик 3 і стрічка 3 відкидаються, а замість стовпчика 4 і стрічки 4 записується стовпчик 7 і стрічка 7, після чого матриця має вид:
Найменше значення в матриці тепер дорівнює
Об’єднання 5 і 8 дає групу 9. оскільки залишилась лише одна група то процедура класифікації завершується. Результат може бути представлений у формі таблиці Таблиця 1.
Рис. 1. Представлення результатів ієрархічної комбінаторної класифікації: а – дендрограмою, б – площинною діаграмою.
|