Агломеративні стратегії об’єднання
Основний алгоритм. Початкові дії в усіх алгомеративних системах однакові. Для об’єктів обчислюються всі мір відмінностей, пара об’єктів з найменшою мірою об’єднується в одну групу. Далі необхідно визначити міру відмінностей між цією групою та рештою об’єктами, а на більш пізніх стадіях, очевидно, буде необхідно визначити міру між об’єктом і групою будь-якого об’єму, а також між будь-якими двома групами. На кожному кроці класифікації здійснюється те об’єднання (між двома об’єктами, між об’єктом і групою або між двома групами), для якого міра відмінностей мінімальна серед всіх решти об’єктів і груп, які залишились до даного кроку. Міра має бути такою, щоб об’єкт можна було розглядати як групу з одного елементу. Стратегія об’єднання визначається саме мірою відмінності між групами. Всього протягом роботи алгоритму обчислюється мір. Комбінаторні рішення. Переважно -міри можна розглядати з позиції деякої лінійної моделі. Нехай маємо дві групи та з кількістю та елементів відповідно. Позначимо міру відмінностей між ними через . Припустимо, що є найменшим з усіх, що залишилися, а та об’єднуються так, що після об’єднання та утворюють нову групу , з елементами. Розглянемо деяку іншу групу з елементами. Перед об’єднанням відомі значення . Приймемо: . (3) Де параметри , , , визначають суть стратегії. Для деяких стратегій параметри є просто числами, але в багатьох випадках вони є простими функціями від деяких величин . Для інформаційної статистики, яка представляє -міри, не існує комбінаторного вирішення, в цьому випадку дані мають бути збережені для обчислень, зв’язаних з об’єднанням в групи, протягом усього процесу класифікації.
|