Состав знаний экспертной системы
Рассмотрим вопрос о том, какими (по составу) знаниями должна обладать ЭС для выполнения стоящих перед ней задач. Состав знаний зависит: 1) от проблемной области; 2)от структуры ЭС; 3) от требований и целей пользователей; 4) от языка общения. В соответствии с общей схемой ЭС (см. рис. 6.1) для ее функционирования требуются следующие знания: 1) знания о процессе решения задачи, т. е. управляющие знания, используемые интерпретатором; 2) знания о языке общения и способах организации диалога, используемые лингвистическим процессором; 3) знания о способах представления и модификации знаний, используемые компонентой приобретения знаний; 4) поддерживающие структурные и управляющие знания, используемые объяснительной компонентой.
Зависимость состава знаний от требований пользователя проявляется в следующем: 1) какие задачи (из общего набора задач) и с какими данными хочет решать пользователь; 2) каковы предпочтительные способы и методы решения; 3) при каких ограничениях на количество результатов и способ их получения должна быть решена задача; 4) каковы требования к языку общения и к организации диалога; 5) какова степень общности/конкретности знаний о проблемной области, доступная пользователю; 6) каковы цели пользователей. Классификация знаний будет дана с точки зрения проблемной области и с точки зрения архитектуры ЭС. Предметную область можно характеризовать совокупностью объектов, характеристик объектов и отношений между объектами. В зависимости от особенностей предметной области данные об образующих ее сущностях могут быть точными/ошибочными, приблизительными, многозначными и полными/неполными. Знания, хранимые ЭС, как правило, неточны в силу их экспертного характера. Ошибочность/приблизительность/многозначность данных и знаний (правил, модулей) приводит к тому, что ЭС имеет дело не с одной, а как бы с несколькими альтернативными областями, представляемыми в системе в виде альтернативных пространств. При этом в задачу ЭС может входить либо рассмотрение всех возможных альтернативных пространств и выдача всех решений, либо рассмотрение всех пространств и выбор некоторых (одного или нескольких) решений. Неполнота данных и знаний приводит к необходимости использовать не одну, а несколько моделей и не один, а несколько источников знаний. Наличие нескольких моделей приводит к представлению в ЭС одной предметной области в виде нескольких взаимно дополняющих пространств. Предметные области могут быть статическими, т. е. неизменяемыми, и динамическими, т.е. изменяемыми. Если быть точным, то практически любая предметная область является изменяемой. Вопрос в том, представляются ли эти изменения в ЭС. Примерами медицинских систем, не учитывающих динамику предметной области, являются MYCIN, INTERNIST, CASNET, PIP, PUFF и др. Динамические области (точнее, представления, учитывающие динамику области) можно разделить на следующие типы: 1) представления, в которых учитываются только изменения местоположения объектов в пространстве, но сами объекты считаются неизменными во времени; 2) представления, в которых учитываются изменения объектов (их свойств) во времени, но не рассматриваются изменения пространственных отношений между объектами; 3) представления, в которых учитываются как изменения объектов во времени, так и изменения пространственных взаимоотношений между ними. Представления первого типа обычно используются в робототехнике, где источником динамики является, как правило, только деятельность активных агентов. Представления второго типа используются в системах, в которых источником изменений считается ход времени, т.к. подлинные причины изменений неизвестны системе или игнорируются ею. Примером такой системы является система VM, учитывавшая изменение состояния больного во времени. ЭС, допускающие третий тип представления предметной области, пока неизвестны. Необходимо отметить, что точность/ошибочность, полнота/неполнота, статичность/динамичность данных и знаний являются слабо зависимыми свойствами проблемной области, что приводит к произвольному сочетанию этих свойств. Могут быть точные статические области, неточные динамические области, альтернативные статические и (или) динамические области и т.п. Задачи, решаемые в предметной области, требуют соответствующих знаний. Не касаясь специфики решаемых задач, их можно классифицировать на следующие типы: 1) задачи анализа предметной области; 2) задачи преобразования предметной области; 3) задачи определения (выбора) предметной области. К задачам анализа будем относить те задачи, которые осуществляют доопределение или переформулирование текущего состояния предметной области, т. е. правила вывода (умозаключения), используемые системой в процессе решения задачи анализа, не преобразуют состояние предметной области. В точной статической предметной области можно решать только задачи анализа. Задачи анализа являются простейшим из рассматриваемых нами типов задач. В связи с тем, что в задачах анализа при точных данных и знаниях происходит не изменение, а доопределение состояния предметной области, данные, получаемые в ходе решения, обладают свойством монотонности. Говоря другими словами, в ходе решения задачи данные только добавляются, но не устраняются. Все формальные логические системы являются монотонными, т.е. если А, В и С являются высказываниями такими, что B выводится из А, то В выводится и из А L С. Итак, при решении задач анализа данные только добавляются в рабочую память. В этом случае для коммутативных систем вопрос "правильности" решения не стоит, т. к., применив в любом порядке все имеющиеся знания, мы рано или поздно получим искомые решения, если они существуют. При решении задач анализа необходимо заботиться только о скорости поиска решения. К задачам преобразования будем относить те задачи, в процессе решения которых одно состояние предметной области (пространства) преобразуется в другое, т.е. правила вывода, используемые при решении таких задач, преобразуют предметную область, но не выводят систему за рамки данной области. Проблема в том, чтобы определить, можно ли преобразовывать предметную область и как ее следует преобразовывать, чтобы удовлетворить условиям решаемой задачи. Необходимо отметить, что для определения того, является ли полученное состояние конечным и можно ли преобразовывать текущее состояние, необходимо решить задачу анализа. При решении задач преобразования данные не только добавляются в рабочую память, но и устраняются из нее, так как при переходе из одного состояния в другое (если хранится только одно состояние) надо устранять сведения, отличающие предшествующее состояние от нового. Процесс преобразования состояний может приводить к тупиковым ситуациям, в которых решение уже не может быть найдено, хотя для исходного состояния оно существовало. Если при решении задачи анализа тупик означает невозможность решить исходную задачу, то наличие тупиков при преобразовании состояний означает выбор ошибочного пути, что приводит к необходимости запоминать предыдущие состояния и обеспечивать возврат к ним с тем, чтобы испробовать альтернативные пути преобразования области. К задачам определения предметной области будем относить те задачи, в ходе решения которых система переходит из одной альтернативной области (пространства) в другую. В ходе решения задачи определения система осуществляет поиск той из альтернативных или взаимно дополняющих областей, которая адекватна решаемой проблеме. Ясно, что в процессе решения задачи определения, могут решаться задачи анализа и преобразования. При решении задач определения необходимо использовать "предположения", устраняющие неполноту информации и позволяющие продолжить процесс поиска решения. Если сделанные предположения начинают противоречить точно известным фактам, то система должна переходить в другую альтернативную или взаимно дополняющую область. Необходимо отметить, что пересмотр "предположений" требует повторного вывода данных, полученных на основе этих предположений. При решении задач определения необходимо обеспечить поддержание непротиворечивости предположений и фактов, пересмотр предположений и модификацию рабочей памяти. Использование предположений требует установления зависимостей между данными (т.е. отслеживание, на основании каких знаний выведены те или иные данные), что значительно усложняет архитектуру системы. Итак, проблемную область можно обобщенно охарактеризовать следующим набором слабо зависимых параметров: 1) точность/ошибочность данных и знаний; 2) полнота/неполнота данных и знаний; 3) статическая/динамическая область; 4) тип решаемых задач. Первые три параметра являются независимыми, т.е. могут встречаться в любом сочетании. Четвертый параметр частично зависит от предыдущих, так, например, задачи преобразования можно решать только в динамической области, а задачи определения только при наличии альтернативных или взаимно дополняющих областей. Однако задача анализа может решаться в любой предметной области. Ясно, что для определения конкретной проблемной области необходимо задать состав объектов, характеристик объектов, значений характеристик и отношений, существующих между объектами и характеристиками. Кроме того, необходимо задать форму описания решаемых задач. В связи с тем, что определение конкретной области и конкретных задач существенно зависит от специфики приложения, эти вопросы рассматриваться нами не будут. Данная классификация рассматривает знания, учитывая их использование в ходе работы экспертной системы. Все знания делятся на интерпретируемые и неинтерпретируемые. К первому типу относятся те знания, которые способен интерпретировать решатель (интерпретатор). Все остальные знания относятся ко второму типу. Решатель не знает их структуру и содержание. Если эти знания и используются какой-либо компонентой системы, то она не "осознает" этих знаний. Неинтерпретируемые знания подразделяются на вспомогательные знания, хранящие информацию о лексике и грамматике языка общения и информацию о структуре диалога, и поддерживающие знания. Вспомогательные знания обрабатываются естественно-языковой компонентой, но ход этой обработки решатель не осознает, т.к. этот этап обработки входных сообщений является вспомогательным для проведения экспертизы. Поддерживающие знания используются при создании системы и при выполнении объяснений. Поддерживающие знания выполняют роль описаний (обоснований) как интерпретируемых знаний, так и действий системы. Поддерживающие знания подразделяются на технологические и семантические. Технологические поддерживающие знания содержат сведения о времени создания описываемых ими знаний, об авторе знаний и т.п. Семантические поддерживающие знания содержат смысловое описание этих знаний. Они содержат информацию о причинах ввода знаний, о назначении знаний, описывают способ использования знаний и получаемый эффект. Поддерживающие знания имеют описательный характер.
Рис. 6.4. Структура знаний в базе знаний
Интерпретируемые знания можно разделить на предметные знания, знания о представлении и управляющие знания. Знания о представлении содержат информацию о том, каким образом (в каких структурах) в системе представлены интерпретируемые знания. Предметные знания содержат данные о предметной области и способах преобразования этих данных при решении поставленных задач. По отношению к предметным знаниям знания о представлении и знания об управлении являются метазнаниями. В предметных знаниях можно выделить описатели, и собственно предметные знания. Описатели содержат определенную информацию о предметных знаниях, такую, как коэффициент определенности правил и данных, меры "важности" и "сложности". Собственно предметные знания разбиваются на факты и операционные знания. Факты определяют возможные значения сущностей и характеристик предметной области. Операционные знания содержат информацию о том, как можно изменять описание предметной области в ходе решения задач. Говоря другими словами, операционные знания - это знания, задающие процедуры обработки. Однако использовать термин процедурные знания (вместо операционные) не рекомендуется, т.к. эти знания могут быть заданы не только в процедурной форме, но и в декларативной. Управляющие знания можно разделить на фокусирующие и решающие. Фокусирующие знания описывают, какие знания следует использовать в той или иной ситуации. Обычно фокусирующие знания содержат сведения о наиболее перспективных гипотезах и о знаниях, которые наиболее целесообразно использовать при проверке соответствующих гипотез. В первом случае внимание фокусируется на элементах рабочей памяти, во втором - на элементах базы знаний. Решающие знания содержат информацию, используемую для выбора способа интерпретации знаний, подходящего к текущей ситуации. Эти знания используются для выбора стратегий или эвристик, наиболее эффективных для решения данной задачи. Качественные и количественные показатели ЭС могут быть значительно улучшены за счет использования метазнаний, т. е. знаний о знаниях. Метазнания не представляют некоторую единую сущность, они могут использоваться для достижения различных целей (для управления процессом решения, для объяснения и приобретения знаний). Перечислим возможные назначения метазнаний: 1) метазнания в виде стратегических метаправил используются для выбора релевантных правил; 2) метазнания используются для обоснования целесообразности применения правил из области экспертизы; 3) метаправила используются для обнаружения синтаксических и семантических ошибок в предметных правилах; 4) метаправила позволяют системе адаптироваться к окружению путем перестройки предметных правил и функций; 5) метаправила позволяют явно указать возможности и ограничения системы, т. е. определить, что эта система знает, а чего не знает.
|