Зміст роботи
В основі поняття розпізнавального алгоритму, тобто алгоритму з допомогою якого здійснюється розпізнавання зображень об’єктів два базові принципи: принцип аналізу елементів зображення, в якості якого найчастіше виступає принцип розгортання або сканування елементів цього зображення в заданій послідовності та принцип порівняння або логічного аналізу у відповідності з яким порівнюють кожен елемент або групу елементів щодо їх подібності чи еквівалентності заданому еталону. Таким чином розпізнавальний алгоритм забезпечує планомірне відслідковування елементів зображення з одночасним їх логічним аналізом. Суть принципу сканування полягає в наступному. Розглянемо деяке прямокутне бінарне зображення розмірності
причому елементи
де оператор Таким чином, при розгортанні області зображення елемент за елементом (піксел за пікселом) в межах локалізованої на ньому площі, здійснюється ідентифікація всіх точок цієї області у відповідності з визначеними задачами, умовами та критеріями, тобто аналізується колір, інтенсивність, сусідство кожного елемента в контексті даної задачі. Найпростішою ознакою будь-якого об’єкта, представленого на екрані монітору є характеристичні параметри довільної точки, що належить об’єкту розпізнання. Проте, використання в якості ознак тільки одного елементе є ефективним лише в окремих випадках, наприклад, якщо об’єкт відрізняється кольором. Переважно в описах, тобто робочих словниках використовують, як правило, конфігуративні ознаки, які є фрагментами форми розпізнаваних об’єктів, або ж в якості ознак використовують інваріанти, тобто параметри, які не змінюються при афінних чи інших перетвореннях. Такі параметри визначаються через характерні точки, які, в свою чергу, визначаються через цілісне зображення або його фрагменти. Процедура розгортання заданої області або цілого зображення, яку часто назівають скануванням, є основною частиною перважної більшості розпізнавальних алгоритмів і легко може бути реалізована програмно з допомогою двох вкладених один в одного операторів циклів, наприклад де внутрішній цикл переміщує апертуру аналізатора (тобто активну область аналізуючого пристрою, наприклад, для людського зорового аналізатора – ока це є точка фіксації зору (погляду) в яку скерована увага і відносно якої здійснюється аналіз баченого, в технічних системах це область зображення виділена оптичною сенсорною системою, в якій проводиться аналіз спеціалізованими пристроями (наприклад роботами), а при комп’ютерній обробці це матриця, з допомогою якої відображається виділена прямокутна область зображення, яка розглядається як математичний обєкт і аналізується математичними алгоритмами, оскільки кожен елемент матриці є відповідним значенням елемент (піксела) зображення у виділеній області). Фактично алгоритм розгортки це алгоритм B, який практично є однаковим для різних розпізнавальних алгоритмів. Для комп’ютерного аналізу ознак, суть якого зводиться до константації факту наявності тої чи іншої ознаки, заданої словником ознак конфігурації пікселів, найбільш простим в цьому плані є представлення ознаки конфігурацією, утвореною чотирьома пікселами, розміщеними у формі квадратної матриці Це значить, що такі об’єкти можуть бути описані послідовністю, порядок якої визначений процедурою розгортки, яка включає вісім видів ознак, вид яких зображено на рис. 2.
Рис.2. Розпізнавальні ознаки, описані предикатами.
Зображенні на рис. 2. темні піксели відповідають фону, а світлі об’єкту, хоча може бутти і навпаки. Як бачимо з цього рисунка ознаки 1, 2, 3, 4 відповідають зовнішнім кутам контура об’єкта і представлені лише пікселом вершини кута в оточенні трьох пікселів фону. Ознаки 5, 6,, 7, 8, утворені трьома пікселам, які належать об’єкту і тому представляють внутрішні кути об’єкта. Для розпізнавання об’єкта за цими ознаками використовується логічний предикат. Нагадаємо, що логічним предикатом називається функція яка відображає множину довільної природи (в даному випадку характеристик піксела) в множину На рисунку 2. показано нумерацію пікселів так, як вони входять в логічний даний логічний предикат. Розпізнавання ознак в цього випадку є бінарною процедурою прийняття рішення: 1 – ознака є, 0 – ознака відсутня. Для візуального контролю роботи даного алгоритму виконучою рішення структурою є оператор CIRCLE(X, Y), R. Робота цього оператора полягає у виділенні розпізнаної ознаки круговою областю (колом), колір якого (за домовленістю) відповіцдає номеру ознаки, наприклад за нумерацією прийнятою на рис.2.
|