Гіпотеза компактності
Оцінювання ступеня подібності або відмінності об’єктів, які представлені векторами ознак, вимагає введення деякої формальної міри подібності (відмінності), в термінах якої і буде здійснюватись порівнювання цих об’єктів між собою. Впровадження такої міри обґрунтовується гіпотезою компактності, яка постулює можливість розбиття великої кількості об’єктів дослідження та невелике число “сильно відмінних” підмножин, в середині яких об’єкти є “подібні“ між собою в тому чи іншому можливо і невідомому, але об’єктивно існуючому відношенні. Якщо описи об’єктів розглядаються як вектори в – мірному просторі ознак то гіпотеза компактності стверджує, що для того щоб задача обробки емпіричних даних, яка полягає у виявленні в них емпіричних закономірностей, мала розв’язок, емпіричні дані повинні мати дві принципові властивості. 1. Компактність – точки, що відображають в об’єкти одного класу, розташовані в ближче одна до одної ніж точки, що відображають в об’єкти інших класів; 2. Сепарабельність – класи повинні бути обмежені і не перетинатися між собою. Гіпотеза компактності найбільш природно вводить міру відмінності між об’єктами, як відстань між точками (векторами), що відображають порівнюванні об’єкти в просторі . При цьому в одних і тих же термінах формулюється як поняття відстані між об’єктами та заданими їх описами та так і поняття відстані від об’єкта до класу (1) та між класами та . (2) З (1) та (2) випливає, що відстань між об’єктом та класом це відстань між цим та найближчим представником класу , а відстань між класами та – це відстань між найближчими представниками цих класів. На практиці використовується і менш строге поняття відстані від об’єкту до класу та між класами, наприклад у вигляді відстані від центра ваги класу.
|