Пример ЭС, основанной на правилах логического вывода и действующую в обратном порядке.
Допустим, вы хотите построить ЭС в области медицинской диагностики. В этом случае вам вряд ли нужно строить систему, использующую обучение на примерах, потому что имеется большое количество доступной информации, позволяющей непосредственно решать такие проблемы. К сожалению, эта информация приведена в неподходящем для обработки на компьютере виде.
Возьмите медицинскую энциклопедию и найдите в ней статью, например, о гриппе. Вы обнаружите, что в ней приведены все симптомы, причем они бесспорны, при наличии указанных симптомов всегда можно поставить точный диагноз.
Но чтобы использовать информацию, представленную в таком виде, вы должны обследовать пациента, решить, что у него грипп, а потом заглянуть в энциклопедию, чтобы убедиться, что у него соответствующие симптомы. Что-то здесь не так. Ведь необходимо, чтобы вы могли обследовать пациента, решить, какие у него симптомы, а потом по этим симптомам определить, чем он болен. Энциклопедия же, похоже, не позволяет сделать это так, как надо. Нам нужна не болезнь со множеством симптомов, а система, представляющая группу симптомов с последующим названием болезни. Именно это мы сейчас и попробуем сделать.
Идеальной будет такая ситуация, при которой мы сможем в той или иной области предоставить машине в приемлемом для нее виде множество определений, которые она сможет использовать примерно так же, как человек-эксперт. Именно это и пытаются делать такие программы, как PUFF, DENDRAL, PROSPECTOR.
С учетом байесовской системы логического вывода примем, что большая часть информации не является абсолютно точной, а носит вероятностный характер.
Основой любой ЭС является совокупность знаний, структурированная в целях упрощения процесса принятия решения. Термин знания означает информацию, которая необходима программе, чтобы она вела себя "интеллектуально". Эта информация принимает форму фактов и правил. Факты и правила в ЭС не всегда либо истинны, либо ложные. Иногда существует некоторая степень неуверенности в достоверности факта или точности правила. Если это сомнение выражено явно, то оно называется "коэффициентом доверия". Коэффициент доверия — это число, которое означает вероятность или степень уверенности, с которой можно считать данный факт или правило достоверным или справедливым, он принимает значения (-1;1).
Многие правила ЭС являются эвристиками, то есть эмпирическими правилами или упрощениями, которые эффективно ограничивают поиск решения. ЭС используют эвристики, так как задачи, которые она решает, трудны, не до конца понятны, не поддаются строгому математическому анализу или алгоритмическому решению. Алгоритмический метод гарантирует корректное али оптимальное решение задачи, тогда как эвристический метод даёт приемлемое решение в большинстве случаев. База знаний представляет собой текстовый файл (который в дальнейшем может быть зашифрован), включающий три секции со следующей структурой:
--------------------------- Описание базы знаний, имя автора, комментарий и т.п. (можно в несколько строк, общая длина которых не должна превышать 10000 символов; данная секция заканчивается после первой пустой строки)
Действие №0 (Симптом № 0) (любой текст (не более 1000 символов), заканчивающийся переносом строки) Действие №1 (Симптом № 1) Действие №2 (Симптом № 2) ... Действие № N (Симптом № N) Например, Симптом_5 может означать строку "Много ли вы кашляете?", или, Симптом_2 "Повышенная ли у вас температура тела" (после последнего свидетельства следует одна пустая строка, и вторая секция заканчивается)
Болезнь № 0, P [, i, Py, Pn ] Болезнь № 1, P [, i, Py, Pn ] Болезнь № 2, P [, i, Py, Pn ] ... Болезнь № M, P [, i, Py, Pn ] ---------------- Поле "болезнь" характеризует название возможного исхода, например "Грипп". Следующее поле — p — это априорная вероятность такого исхода P(H), т.е. вероятность исхода в случае отсутствия дополнительной информации. После этого идет ряд повторяющихся полей из трех элементов. Первый элемент — j — это номер соответствующего симптома (свидетельства, переменной, вопроса, если вы хотите назвать его по-другому). Следующие два элемента — P(E: H) и P(E: не H) — соответственно вероятности получения ответа "Да" на этот вопрос, если возможные исход верен и неверен. Например: Грипп 0.01, 1,0.9,0.01, 2,1,0.1, 3,0,0.01
Здесь сказано существует априорная вероятность P(H)=0.01, что любой наугад взятый человек болеет гриппом.
Допустим, программа задает вопрос 1 (симптом 1 "Высокая температура тела"). Тогда мы имеем P(E: H)=0.9 и P(E: не H)=0.01, а это означает, что если у пациента грипп, то он в девяти случаях из десяти ответит "да" на этот вопрос, а если у него нет гриппа, он ответит "да" лишь в одном случае из ста. Очевидно, ответ "да" подтверждает гипотезы о том, что у него грипп. Ответ "нет" позволяет предположить, что человек гриппом не болеет.
Так же и во второй группе симптомов (2, 1, 0.1). Вопрос "Насморк". В этом случае P(E: H)=1, т.е. если у человека грипп, то этот симптом должен присутствовать. Соответствующий симптом может иметь место и при отсутствии гриппа (P(E: не H)=0.1), но это маловероятно.
Вопрос 3 исключает грипп при ответе "да", потому что P(E: H)=0. Это может быть вопрос вроде такого: "наблюдаете ли вы такой симптом на протяжении большей части жизни?" — или что-нибудь вроде этого.
Нужно подумать, а если вы хотите получить хорошие результаты, то и провести исследование, чтобы установить обоснованные значения для этих вероятностей. И если быть честным, то получение такой информации — вероятно, труднейшая задача, в решении которой компьютер также сможет существенно помочь Вам. Если вы напишите программу общего назначения, ее основой будет теорема Байеса, утверждающая:
P(H: E) = P(E: H) * P(H) / (P(E: H) * P(H) +P(E: не H) * P(не H)).
Вероятность осуществления некой гипотезы H при наличии определенных подтверждающих свидетельств Е вычисляется на основе априорной вероятности этой гипотезы без подтверждающих свидетельств и вероятности осуществления свидетельств при условиях, что гипотеза верна или неверна.
Поэтому, возвращаясь к нашим болезням, оказывается:
P(H: E) = py * p / (py * p + pn * (1 - p)).
В данном случае мы начинаем с того, что Р(Н) = р для всех болезней. Программа задает соответствующий вопрос и в зависимости от ответа вычисляет P(H: E). Ответ "да" подтверждает вышеуказанные расчеты, ответ "нет" тоже, но с (1 – py) вместо py и (1 – pn) вместо pn. Сделав так, мы забываем об этом, за исключением того, что априорная вероятность P(H) заменяется на P(H: E). Затем продолжается выполнение программы, но с учетом постоянной коррекции значения P(H) по мере поступления новой информации.
v Имеется следующий набор симптомов для нескольких ОРЗ. Откройте редактор БЗ и создайте свою. Введите заголовок. Выберите на основании таблицы характерные симптомы, по которым будут определяться болезни и введите их в несколько строчек (каждый вопрос в отдельной строке). В соответствии с вышеизложенными пояснениями, заполните четыре строки для болезней: Грипп, Парагрипп, РС-инфекция, Аденовирусная инфекция. Например так:
Протестируйте полученную БЗ для разных симптомов. Должны по результатам опроса выдаваться правильные результаты (определяться вид ОРЗ).
1 Респираторно-синцитиальная 2 Ларингит – воспаление гортани (хрипота (осиплость голоса) и звонкий, сухой, удушающий кашель, першение в горле) 3 острое или хроническое воспаление слизистой оболочки трахеи (Наиболее характерный признак Трахеита — сухой кашель ночью и особенно утром, а также приступы кашля при глубоком вдохе, дыхание становится поверхностным и учащенным). 4 острое воспаление бронхиол (возникает вследствие перехода воспалительного процесса с бронхов при бронхите на бронхиолы – тончайшие продолжения бронхов, возникает вследствие перехода воспалительного процесса с бронхов при бронхите на бронхиолы – тончайшие продолжения бронхов) 5 Конъюнктивит — воспаление слизистой оболочки глаза (Катаральный: обычно развивается на 2-4-е сутки от начала заболевания, жжение, резь, ощущение песка в глазах. Отмечается слезотечение. При фолликулярной форме через 2-3 сут. конъюнктивы становятся зернистыми вследствие выбухания фолликулов. При пленчатом конъюнктивите отек век резко выражен, часто больной не может открыть глаза. На переходных складках появляются сероватого цвета пленки) 6 Фарингит – воспаление слизистой оболочки и лимфоидной ткани глотки. При остром фарингите появляется боль в горле (особенно при глотании), сухой кашель, выделение слизи или гноя. При осмотре горла (фарингоскопии) можно заметить сильное покраснение слизистой горла.
Вопросы: 1 Логические выражения бывают Словами, фразами, текстом Истинными или ложными Полными, неполными и сомнительными Фактами, предположениями, гипотезами Все ответы верны 2 Что показывает коэффициент уверенности? 3 Какое численное значение принимает коэффициент уверенности? 4 Экспертные системы обычно предусматривают: Моделирование механизма мышления человека Использование знаний Использование приближенных и эвристических методов Все ответы верны 5 Что содержит База знаний? 6 Эвристические методы: Основаны на высокоточных математических вычислениях Предполагают выдвижение и проверку гипотез Используют сложные алгоритмы Всегда записываются в виде рисунков
|