Математична постановка задачі розпізнавання
При аналізі і розпізнаванні зображень опрацьована інформація представляється числовою матрицею, яка відтворює властивості зображуваного об’єкта (сцени) і деформації, пов’язані із способом і процесом отримання зображення. В такому випадку для формалізації процесу обробки (в широкому сенсі) зображень слід визначити три множини (моделей) зображень, на яких постулюється існування класів еквівалентності, і множини допустимих перетворень, заданих на класах еквівалентності. Використання класів еквівалентності на множині моделей зображень відтіняє гіпотезу, згідно з якою будь-яке зображення володіє певною регулярністю або сумішшю регулярностей різних типів. Задача аналізу і розпізнавання при цьому припущенні зводиться до поділу зображень на зображення, які зберігають власну регулярність, і на зображення з порушенням власної регулярності. Розглянемо наступну модель. Нехай – деяке істинне зображення досліджуваного об’єкта. Процес його отримання можна розглядати як передачу істинного зображення по каналу з завадами. В результаті предметом аналізу є вже не істинне зображення, а деяке реальне – спостережуване – зображення . В процесі аналізу зображення класифікується, тобто визначається його прототип в істинному класі еквівалентності або на цьому зображенні необхідно виявити регулярність (регулярності) заданого виду . Таким чином є можливість визначити множини , та , та перетворення формування і розпізнавання зображень: , (5) . (6) Отже, розпізнавання зображень зводиться до визначення на класах еквівалентності множини алгебраїчних систем перетворень і та застосування їх до спостережуваних зображень для: а) аналізу “назад” – розділення зображень у відповідності з характером регулярності (відновлення істинних зображень, тобто вказання класів еквівалентності, до яких вони відносяться); б) аналізу “вперед” – пошуку на зображенні регулярностей певного виду та їх локалізації. Така постановка задачі розпізнавання дозволяє визначити клас процедур обробки зображень, який характеризується фіксованою структурою процесу, інтерпретація і конкретна реалізація якої залежить від цілей і типу аналізу. В процесі аналізу виділяються наступні основні етапи: 1. Синтез моделі спостережуваного зображення – так званий етап приведення до виду, зручного для розпізнавання, тобто отримання деякого формалізованого опису аналізованого зображення, придатного для обробки його відповідними перетвореннями – алгоритмічними процедурами розпізнавання. 2. Логічна фільтрація зображення. На цьому етапі проводиться попередня обробка спостережуваного зображення, яка забезпечує і його попередню класифікацію. Яка необхідна для вибору множини перетворень . Припускається існування відповідності між типом і/або характером моделі і класом еквівалентності, визначеному на множині . Крім того припускається наявність слабкої еквівалентності на множині , що дає можливість співставляти, в сенсі такої слабкої еквівалентності, підмножини класам еквівалентності моделей істинних зображень. 3. Встановлення класу еквівалентності істинного зображення , яке породжує спостережуване зображення . Для цього до моделі застосовують обернені перетворення обернені перетворення формування . Крім того, на основі результатів аналізу етапу 2 висувається гіпотеза про клас еквівалентності, який істинний для моделі . Це дає можливість застосувати до моделі істинного зображення-прототипу перетворення для перевірки допустимості породження спостережуваного зображення у відповідному класі еквівалентності і співставляти результати застосування до і до . І перші і другі перетворення можуть у відповідності з методологією алгебраїчного підходу використовуватись у формі лінійних і алгебраїчних замикань відповідних перетворень ; (7) . (8) При досягненні еквівалентності і , і або еквівалентності проміжних результатів перетворень процесів аналізу “вперед” і “назад” процес припиняється. Цей механізм відновлення класу еквівалентності, що є істинним для , називається процедурою реверсивного алгебраїчного замикання. 4. По вибираються перетворення аналізу , оскільнки припускається також відповідність множин перетворень і :
. (9)
5. “Розпізнавання”: виявлення на шуканих регулярностей з допомогою застосування до аналізу “вперед” і одночасного застосування до перетворень , тобто аналізу «назад». В даному випадку, як і на етапі 3 використовується процедура реверсивного алгебраїчного замикання, але на цей раз для встановлення того, чи може шукана регулярність породжуватися моделлю спостережуваного зображення : ; (10) . (11) При досягненні еквівалентності і та і або еквівалентності проміжних результатів перетворень процесів аналізу “вперед” і “назад” процес припиняється. При відсутності еквівалентності виконуються нові ітерації для етапів 1 – 5 з іншими і гіпотезами . В рамках даної постановки розпізнавання зводиться до визначення на класах еквівалентності множини алгебраїчних систем перетворень і і застосуванню їх до спостережуваних зображень у відповідності з методом реверсивного алгебраїчного замикання для: а) аналізу “назад” – розділення зображень у відповідності з характером їх регулярності (“відновлення” істинних зображень – вказання класів еквівалентності, до яких вони відносяться); б) аналізу “вперед” – пошуку на зображеннях регулярностей визначеного виду та їх локалізації. Принциповими особливостями дескриптивної теорії розпізнавання зображень, які визначаються її цілями є створення регулярних методів для вибору і синтезу алгоритмічних процедур обробки інформації в задачах розпізнавання зображень, специфічність постановки і розв’язку задачі розпізнавання при заданій вихідній інформації у вигляді зображень, структурою моделі алгоритму розпізнавання зображень.
|