МЕТОДЫ И СИСТЕМЫ РАСПОЗНАВАНИЯ ОБРАЗОВ
Несмотря на многообразие методов распознавания образов, их можно разделить на две группы. Первая основана на понятии пространства признаков и их обработки в этом пространстве, вторая – на исследовании конструкции рассматриваемых образов (синтаксическое распознавание). Для первой группы методов в качестве основополагающей принята гипотеза о возможности представления образа в виде вектора, принадлежащего множеству V. Множество векторов, состоит из N таких подмножеств, что каждый вектор, отнесенный в результате классификации к j -му классу, принадлежит подмножеству Ej. Свойства множества V могут быть записаны в виде . Если процесс распознавания объектов связывать с техническими средствами, то его возлагают на системы распознавания. Абстрагируясь от типа системы и прикладной области поставленной перед ней проблемы, можно определить последовательность действий, составляющих ход решения задачи. 1. Выделяются характерные признаки, по которым будет выполняться распознавание объектов, и создается словарь признаков. 2. Назначается алфавит классов, т.е. в соответствии с выбранным принципом совокупность объектов или явлений подразделяется на классы. 3. Каждый класс описывается на языке словаря признаков. 4. Выбираются и (или) создаются средства для определения признаков. 5. На вычислительных средствах реализуется алгоритм сопоставления апостериорных и априорных данных и принимается решение о результатах распознавания. Рассмотрим более подробно этапы, составляющие процедуру распознавания. Необходимо определить все признаки, характеризующие сущность распознаваемых объектов или явлений, так как неполнота информации приводит в дальнейшем к ошибкам или невозможности правильной классификации. В современных условиях не существует способов автоматической генерации признаков, она является эвристической операцией и выполняется человеком. Эффективнее выбирать признаки, имея представление об их общих свойствах. С этих позиций Детерминированные признаки – это характеристики объектов или явлений, которые имеют конкретные и постоянные числовые значения. В задачах распознавания с детерминированными признаками ошибки их вычисления часто не играют существенной роли. Например, если точность измерений такого признака, как размах крыльев самолета, значительно выше (например 1 см), чем различие этого признака у разных классов самолетов (например 10 м). Вероятностные признаки – это характеристики объектов или явлений, которые носят случайный характер. В основном они встречаются в природе и технике. В силу случайности соответствующей величины признак одного класса может принимать значения из области значений других классов, каждый из которых подлежит распознаванию в системе. Если признак принимает значения из области значений одного класса, то он переходит в разряд детерминированных признаков. Для распознавания объектов в условиях неопределенности следует потребовать, чтобы вероятности наблюдения значений признака в классе, которому он принадлежит, были как можно больше, чем в остальных классах. В противном случае данный признак не позволит построить систему, использующую описание классов на его основе, поскольку разделительная способность признака окажется недостаточной для принятия достоверного решения на его основе. Логические признаки – это характеристики объекта или явления, представленные в виде элементарных высказываний об истинности. Такие признаки не имеют количественного выражения, а являются качественными суждениями о наличии или отсутствии некоторых свойств у объектов или явлений. Кроме того, к логическим можно отнести признаки, для которых не существенно конкретное значение, а важен сам факт его попадания или непопадания в заданный интервал. Структурные признаки – это элементы изображений, являющихся объектами распознавания. Появление структурных признаков связано с проблемой распознавания изображений с ее специфическими особенностями. Когда все существенные признаки объектов определены, на их основе выделяются классы объектов распознавания. Чаще всего решение этой задачи осуществляется эвристически. Для одной задачи могут быть предложены различные варианты составления алфавита классов. Выбор определенного из них в дальнейшем отразится на качестве распознавания. Располагая перечнем признаков и априорным алфавитом классов, необходимо провести анализ возможностей измерения признаков или расчета их по данным измерений, выбрать те, которые обеспечиваются измерениями, а в случае необходимости создать новые средства для достижения требуемого качества распознавания. В результате первоначальный набор признаков может подвергнуться корректировке. Однако оценить качество словаря признаков удается только, выполнив испытания системы распознавания в целом. Поскольку система еще не существует, создается ее математическая модель, работая с которой методом последовательных приближений можно добиться выбора словаря признаков, обеспечивающего желаемое качество решений. Описание классов априорного алфавита на языке априорного словаря признаков – творческая и наиболее сложная из задач в процессе распознавания объектов, требующая глубокого изучения их свойств. В рамках этой задачи необходимо каждому классу поставить в соответствие числовые параметры детерминированных и вероятностных признаков, значения логических признаков и предложения, составленные из структурных признаков-примитивов. Значения перечисленных признаков получают как результат следующих действий: · специально поставленных экспериментов и наблюдений за ними; · обработки экспериментальных данных; · математических расчетов; · математического моделирования; · обработки литературных источников. И, наконец, последний шаг – это реализация алгоритма распознавания, когда на основе словаря признаков и алфавита классов объектов или явлений происходит разбиение пространства значений признаков на области, соответствующие классам. Разбиение должно быть выполнено таким образом, чтобы обеспечивались минимальные значения ошибок отнесения классифицируемых объектов или явлений к «чужим» классам. Физически распознавание основывается на сравнении значений той или иной меры близости распознаваемого объекта с каждым классом. При этом если значение выбранной меры близости L объекта w с каким-либо классом Wg достигает максимума по сравнению с аналогичными значениями L для других классов, то принимается решение о принадлежности w классу Wg. Разбиение пространства признаков можно представлять как построение разделяющих функций между областями признаков, принадлежащих разным классам. В алгоритмах, использующих детерминированные признаки в качестве меры близости, используется среднеквадратичное расстояние между интересующим объектом и совокупностью объектов, представляющих каждый класс. В алгоритмах, работающих с вероятностными признаками, в качестве меры близости используется риск, связанный с решением о принадлежности объекта к классу Wi, где i – номер класса, (i=1, 2,.., m). К исходным данным для расчета меры близости относится платежная матрица вида В ней на главной диагонали расположены значения потерь при правильных решениях. Обычно принимают или . С обеих сторон от главной диагонали стоят потери при ошибочных решениях. В каждой системе они свои. Если для распознаваемого объекта w вектор признаков , то риск, связанный с отнесением w к классу Wg, когда практически он может принадлежать классам W1, W2,..., Wm, наиболее целесообразно определять как среднее значение потерь С1g, C2g,..., Cmg, т.е. значений, стоящих в g -м столбце платежной матрицы. Тогда средний риск можно определить из следующего выражения:
где P(Wi/Xw) – апостериорная вероятность того, что w Wi. Эта вероятность находится по формуле Байеса:
Вероятности и плотности, входящие в формулу, – это характеристики описания классов в вероятностной системе. Для алгоритмов, основанных на логических признаках, понятие мера близости не имеет смысла. Поскольку достаточно подставить значения признаков в соответствующие булевы соотношения, чтобы сразу получить результат как истину или ложь булевой функции описания класса. Для алгоритмов, основанных на структурных признаках, понятие меры близости более специфично. Каждый класс описывается совокупностью предложений, характеризующих структурные особенности принадлежащих ему объектов. Распознавание неизвестного объекта выполняется путем идентификации предложения, описывающего объект, с одним из предложений, определяющих класс. Под идентификацией подразумевается наибольшее сходство предложения-объекта с предложениями из наборов описаний каждого класса. В процессе работы с системой распознавания меняются ее признаки и алфавит классов. Поэтому становится необходимым переход от априорных словаря признаков и алфавита классов к рабочим словарю и алфавиту. В них выбираются признаки и классы, позволяющие при всех имеющихся ограничениях на их получение добиться максимума вероятности правильной классификации объектов и минимума вероятности ошибочных классификаций в системе. Основу процедуры классификации составляет процесс обучения, в задачу которого входит постепенное усовершенствование алгоритма разделения предъявляемых объектов на классы. Этот процесс стремятся автоматизировать, для чего отбирают часть предъявляемых объектов и используют их для «тренировки» системы. По количеству первоначальной информации системы распознавания делят на системы без обучения, обучающиеся и самообучающиеся системы. Системы первого типа являются самыми простыми по своей структуре и алгоритмам работы, для их построения необходимо располагать полной первоначальной информацией. Массив исходных данных в обучаемой системе состоит из двух частей: обучающей выборки и тестовой выборки, используемой в ходе испытаний. Если совокупность классов известна заранее, то обучение называют контролируемым, или «с учителем». Роль разработчика заключается в определении наилучших критериев классификации, учитывающих различия между признаками, характерными для отдельных классов. Главной задачей в этом случае становится поиск оптимальных методов разделения. Если классы, составляющие обучающую выборку, неизвестны до начала процедуры классификации, то речь идет о самообучающейся системе, а обучение называют неконтролируемым, или «без учителя». Решение задачи при таких условиях значительно сложнее, чем в предыдущих случаях.
|