Стадии приобретения знаний
С точки зрения системного анализа при изучении сложных систем необходимо применить декомпозицию, разбивая сложную задачу на подзадачи. Процесс приобретения знаний при проектировании экспертной системы, по мнению Бучанана, представим следующей схемой:
Формулировок
Требования
формулировок
Концепции
структур Структура
настройка
Правила
Рассмотрим подробнее содержание указанных этапов. В процессе идентификации анализируется класс проблем, которые предполагается решать с помощью проектируемой системы, включая данные, которыми нужно оперировать, и критерии оценки качества решений, определяются ресурсы, доступные при разработке проекта, - источники экспертных знаний, трудоемкость, ограничения по времени, стоимости и вычислительным ресурсам. На этапе концептуализации формулируются базовые концепции и отношения между ними, характеристики используемых данных, производится анализ информационных потоков и структур предметной области с точки зрения рассмотрения причинно-следственных связей, отношений система-подсистема, часть-целое, частное-общее. Формализация предполагает представление структуры пространства состояний и выявление методов поиска в этом пространстве, оценку полноты и степени достоверности или неопределенности информации и ограничений, накладываемых на интерпретацию данных. В процессе реализации происходит преобразование формализованных знаний в работающую программу, спецификация методов организации управления процессом и уточнение деталей организации информационных потоков, правила преобразуются в форму, предназначенную для выполнения программой. На этапе тестирования производится проверка работы созданного варианта системы на большом числе репрезентативных задач, анализ возможных источников ошибок в поведении системы, проверка работы имеющейся системы правил, положенных в основу работы экспертной системы. Нейронная сеть состоит из множества одинаковых элементов — нейронов. Биологический нейрон моделируется как устройство, имеющее несколько входов (дендриты), и один выход (аксон). Каждому входу ставится в соответствие некоторый весовой коэффициент (w), характеризующий пропускную способность канала и оценивающий степень влияния сигнала с этого входа на сигнал на выходе. В зависимости от конкретной реализации, обрабатываемые нейроном сигналы могут быть аналоговыми или цифровыми (1 или 0). В теле нейрона происходит взвешенное суммирование входных возбуждений, и далее это значение является аргументом активационной функции нейрона, один из возможных вариантов которой представлен на Рис. Рис. - Искусственный нейрон Будучи соединенными определенным образом, нейроны образуют нейронную сеть. Работа сети разделяется на обучение и адаптацию. Под обучением понимается процесс адаптации сети к предъявляемым эталонным образцам путем модификации (в соответствии с тем или иным алгоритмом) весовых коэффициентов связей между нейронами. Заметим, что этот процесс является результатом алгоритма функционирования сети, а не предварительно заложенных в нее знаний человека, как это часто бывает в системах искусственного интеллекта. Среди различных структур нейронных сетей (НС) одной из наиболее известных является многослойная структура, в которой каждый нейрон произвольного слоя связан со всеми аксонами нейронов предыдущего слоя или, в случае первого слоя, со всеми входами НС. Такие НС называются полносвязными. Когда в сети только один слой, алгоритм ее обучения с учителем довольно очевиден, так как правильные выходные состояния нейронов единственного слоя заведомо известны, и подстройка синаптических связей идет в направлении, минимизирующем ошибку на выходе сети. По этому принципу строится, например, алгоритм обучения однослойного перцептрона. В многослойных же сетях оптимальные выходные значения нейронов всех слоев, кроме последнего, как правило, не известны, и двух или более слойный перцептрон уже невозможно обучить, руководствуясь только величинами ошибок на выходах НС. Один из вариантов решения этой проблемы – разработка наборов выходных сигналов, соответствующих входным, для каждого слоя НС, что, конечно, является очень трудоемкой операцией и не всегда осуществимо. Второй вариант – динамическая подстройка весовых коэффициентов синапсов, в ходе которой выбираются, как правило, наиболее слабые связи и изменяются на малую величину в ту или иную сторону, а сохраняются только те изменения, которые повлекли уменьшение ошибки на выходе всей сети. Очевидно, что данный метод "тыка", несмотря на свою кажущуюся простоту, требует громоздких рутинных вычислений. И, наконец, третий, более приемлемый вариант – распространение сигналов ошибки от выходов НС к ее входам, в направлении, обратном прямому распространению сигналов в обычном режиме работы. Этот алгоритм обучения НС получил название процедуры обратного распространения. Именно он будет рассмотрен в дальнейшем. Согласно методу наименьших квадратов, минимизируемой целевой функцией ошибки НС является величина: (1) где – реальное выходное состояние нейрона j выходного слоя N нейронной сети при подаче на ее входы p-го образа; djp – идеальное (желаемое) выходное состояние этого нейрона. Суммирование ведется по всем нейронам выходного слоя и по всем обрабатываемым сетью образам.
|