Студопедия — Для бінарних об’єктів
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Для бінарних об’єктів






 

Мета роботи. Виконати ієрархічну класифікацію даних, з бінарним представленням значень ознак і результати відобразити з допомогою дендрограми та площинної діаграми.

 

Зміст роботи. Суть даної роботи полягає в реалізації конкретної процедури класифікації, зведених у звичайну таблицю “об’єкт – ознака” бінарних даних, представлених числами: “0” – відсутність даної ознаки в даного об’єкта або “1” – наявність цієї ознаки в цього об’єкта. При використанні інформаційної статистики матрицю близькості не формують. Підготовка даних означає, що будь-які числові дані також можуть бути представлені в бінарній формі, якщо їх значення мають конкретно визначений діапазон, для якого можна вказати, у відповідності з тим чи іншим критерієм, деяке порогове значення таке, що перевищення значенням ознаки цього значення можна трактувати як значення бінарної ознаки рівне “1”, а значення ознаки, які є меншими або рівними цьому порогу трактувати як значення бінарної ознаки рівне “0”.

Пояснимо процедуру ієрархічної класифікації методом інформаційної статистики на конкретному прикладі. Нехай необхідно згрупувати п’ять об’єктів, кожен з яких характеризується десятьма ознаками. Поіменуємо ці об’єкти літерами A, B, C, D, E і зведемо інформацію про них в таблицю, в якій бінарні значення ознак представлені цифрами “0”, “1”. Таблиця має наступний вид.

 

 

Об’єкти Ознаки
                   
A                    
B                    
C                    
D                    
E                    

 

Згідно з процедурою, на кожному кроці процесу класифікації буде потрібно знати:

1. Склад усіх груп, які залишились.

2. Число об’єктів в кожній групі.

3. Інформаційний зміст кожної групи.

Далі необхідно дослідити усі можливі об’єднання між групами, між об’єктами та між групою і об’єктом.

Для кожного об’єднання треба знати:

1. групи, з яких воно складене;

2. число об’єктів після об’єднання;

3. інформаційний зміст після об’єднання;

4. інформаційний виграш, визначений різницею інформаційних змістів об’єднаних груп.

Послідовність операцій в процедурі може бути представлена наступним алгоритмом.

Крок 1. Так як об’єкти A – E мають нульовий ін форм акційний зміст, то інформаційний виграш, наприклад від об’єднання A і B дорівнює , так, що для початкового об’єднання інформаційний виграш рівний інформаційному змісту. Об’єднують пару з найменшим інформаційним виграшем, тобто об’єднують об’єкти A і B в нову групу F з двома об’єктами і інформаційним змістом . Об’єкти A і B і будь-яке об’єднання, яке їх містить, можуть бути тепер виключені. Ілюстрацією реалізації першого кроку даної процедури є фрагмент таблиці 3.

 

Об’єкти Кількість об’єктів Специфікація ознак Інформацій-ний зміст Інформацій-ний виграш
Крок 1 Початкові групи
A   1 1 0 1 0 0 1 1 1 1 0.0000
B   1 0 1 1 0 1 0 1 1 1 0.0000
C   0 0 1 0 1 0 1 0 0 1 0.0000
D   0 0 0 1 0 1 1 1 0 0 0.0000
E   1 1 1 0 1 1 0 0 1 0 0.0000
Об’єднання Груп
AB   2 1 1 2 0 1 1 2 2 2 5.5452 5.5452
AC   1 1 1 1 1 0 2 1 1 2 9.7041 9.7041
AD   1 1 0 2 0 1 2 2 1 1 6.9315 6.9315
AE   2 2 1 1 1 1 1 1 2 1 9.7041 9.7041
BC   1 0 2 1 1 1 1 1 1 2 9.7041 9.7041
BD   1 0 1 2 0 2 1 2 1 1 6.9315 6.9315
BE   2 1 2 1 1 2 0 1 2 1 6.9315 6.9315
CD   0 0 1 1 1 1 2 1 0 1 8.3178 8.3178
CE   1 1 2 0 2 1 1 0 1 1 8.3178 8.3178
DE   1 1 1 1 1 2 1 1 1 0 11.0904 11.0904
Крок 2. Групи, що залишились
C   0 0 1 0 1 0 1 0 0 1 0.0000
D   0 0 0 1 0 1 1 1 0 0 0.0000
E   1 1 1 0 1 1 0 0 1 0 0.0000
F   2 1 1 2 0 1 1 2 2 2 5.5452
Об’єднання груп
CD*   0 0 1 1 1 1 2 1 0 1 8.3178 8.3178
CE*   1 1 2 0 2 1 1 0 1 1 8.3178 8.3178
DE*   1 1 1 1 1 2 1 1 1 0 11.0904 11.0904
FC   2 1 2 2 1 1 2 2 2 3 17.1855 11.6403
FD   2 1 1 3 0 2 2 3 3 3 13.3665 7.8213
FE   3 2 2 2 1 2 1 2 3 2 15.2760 9.7308
Крок 3. Групи, що залишились
C   0 0 1 0 1 0 1 0 0 1 0.0000
E   1 1 1 0 1 1 0 0 1 0 0.0000
G   2 1 1 3 0 2 2 3 3 3 13.3665
Об’єднання груп
CE*   1 1 2 0 2 1 1 0 1 1 8.3178
CG   2 1 2 3 1 2 3 3 2 3 24.5868
EG   3 2 2 3 1 3 2 3 3 2 24.5868
Крок 4. Групи, що залишились
G   2 1 1 3 0 2 2 3 3 3 13.3665
H   1 1 2 0 2 1 1 0 1 1 8.3178
Об’єднання Груп
GH   3 2 3 3 2 3 3 3 3 3 33.6510 11.9667

 

Деякі пояснення.

 

Крок 1. Зауважимо, що інформаційний виграш, наприклад для FC отримується з інформаційного змісту 17.1855 шляхом вирахування інформаційного змісту F(5.5452) і C(0.0000). найменший виграш зв’язаний з FD. Об’єднуючи F і D, отримуємо нову групу G з трьох об’єктів і всі, що відносяться до F і D виключаємо з подальшого розгляду.

Крок 3. Найменший виграш зв’язаний з CE. Об’єднання C і E дає нову групу H з двох об’єктів. Все, що відноситься до C і E виключається з подальшого аналізу.

Крок 4. Процес закінчено. Остаточний результат приведений в таблиці 4.

Таблиця 4

Об’єднання елементів і груп Результат об’єднання Інформаційний виграш Інформаційний зміст
A і B дає F 5.5452 5.5452
D і F дає E 7.8213 13.3665
C і E дає G 8.3178 8.3178
E і G дає H 11.9667 33.6510

 

 







Дата добавления: 2014-11-10; просмотров: 603. Нарушение авторских прав; Мы поможем в написании вашей работы!



Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Билет №7 (1 вопрос) Язык как средство общения и форма существования национальной культуры. Русский литературный язык как нормированная и обработанная форма общенародного языка Важнейшая функция языка - коммуникативная функция, т.е. функция общения Язык представлен в двух своих разновидностях...

Патристика и схоластика как этап в средневековой философии Основной задачей теологии является толкование Священного писания, доказательство существования Бога и формулировка догматов Церкви...

Основные симптомы при заболеваниях органов кровообращения При болезнях органов кровообращения больные могут предъявлять различные жалобы: боли в области сердца и за грудиной, одышка, сердцебиение, перебои в сердце, удушье, отеки, цианоз головная боль, увеличение печени, слабость...

Неисправности автосцепки, с которыми запрещается постановка вагонов в поезд. Причины саморасцепов ЗАПРЕЩАЕТСЯ: постановка в поезда и следование в них вагонов, у которых автосцепное устройство имеет хотя бы одну из следующих неисправностей: - трещину в корпусе автосцепки, излом деталей механизма...

Понятие метода в психологии. Классификация методов психологии и их характеристика Метод – это путь, способ познания, посредством которого познается предмет науки (С...

ЛЕКАРСТВЕННЫЕ ФОРМЫ ДЛЯ ИНЪЕКЦИЙ К лекарственным формам для инъекций относятся водные, спиртовые и масляные растворы, суспензии, эмульсии, ново­галеновые препараты, жидкие органопрепараты и жидкие экс­тракты, а также порошки и таблетки для имплантации...

Studopedia.info - Студопедия - 2014-2024 год . (0.013 сек.) русская версия | украинская версия