Подход с использованием коэффициентов уверенности
Наиболее развитой и успешной оказалась схема, реализованная Шортлиффом в MYCIN, представляющая собой основанную на здравом смысле модификацию байесовского метода, позволяющую достаточно просто решить поставленные во вступлении к данному разделу четыре основных вопроса: а) как количественно выразить достоверность, надежность посылок? б) как выразить степень поддержки заключения конкретной посылкой? в) как учесть совместное влияние нескольких посылок на заключение? г) как строить цепочки умозаключений в условиях неопределенности?
Е→С ("если Е то С"). Если иметь возможность присваивать коэффициент уверенности как посылке, так и импликации, то их можно использовать для оценки степени определенности заключения, выводимого по данному правилу. Шортлифф применяет в данном случае коэффициенты уверенности подобно вероятностям: коэффициент уверенности ct(E) в посылке подобен p(E); коэффициент уверенности сt(Е→С) в импликации подобен p(C:E). Для определения коэффициента уверенности в заключении Шортлифф использует схему:
ct(посылки)∙ct(импликации)=ct(заключения). Логические комбинации посылок в одном правиле. Посылкой в правиле считается все, что находится между если и то. В MYCIN избран принцип: делать все правила простыми. Тогда простейшими логическими комбинациями посылок являются их конъюнкия или дизъюнкция, т.е. правила вида: (Е1&Е2)→С или (Е1v Е2)→С.
Коэффициент уверенности конъюнкции посылок в MYCIN принято оценивать по наименее надежному свидетельству: ct(Е1&Е2) = min {ct(Е1),ct(E2)}. Соответственно, коэффициент уверенности дизъюнкции посылок в MYCIN принято оценивать по наиболее надежному свидетельству: ct(Е1v Е2) = max {ct(Е1),ct(E2)}.
Впрочем, дизъюнкции стараются разбивать на отдельные правила, т.е. вместо правила (Е1v Е2)→С создается пара правил: Е1→С и Е2→С, так как это позволяет лучше видеть роль каждой посылки в формировании заключения. Но, если эксперт полагает, что дизъюнкция, как она описана выше, лучше отражает суть дела, то возможно использование правила с логической комбинацией посылок в форме дизъюнкции. Поддержка одного заключения множеством правил. В этой ситуации тоже могут быть предложены различные способы учета совместного влияния свидетельств на заключение. В MYCIN применена схема, подобная схеме вычисления суммарной вероятности нескольких независимых событий. Пусть имеются правила Е1→С и Е2→С, первое из которых обеспечивает поддержку заключения С с уверенностью ct1, а второе - с уверенностью ct2. По логике вещей, если обе посылки Е1 и Е2 верны, эти два правила совместно должны обеспечивать заключению С большую поддержку, чем каждое из них в отдельности. В MYCIN это достигается вычислением степени совместной поддержки по следующей формуле: ct = ct1 + ct2 - ct1• ct2. При наличии более двух правил, поддерживающих одно и то же заключение, их совместное влияние может быть учтено последовательным применением этой схемы для объединения суммарной поддержки уже учтенных правил с поддержкой очередного, еще не учтенного правила. Использованная Шортлиффом схема объединения поддержки одного заключения множеством правил позволяет учитывать коэффициенты уверенности поддерживающих правил в произвольном порядке и объединять их по мере поступления свидетельств. Вместе с тем, важно помнить, что эти принципы учета коэффициентов уверенности исходят из предположения о независимости свидетельств, а также о том, что правомерность такого способа комбинирования не имеет иного обоснования, кроме того, что он прост, соответствует здравому смыслу и общему правильному поведению людей, если не относиться к нему излишне доверчиво.
Одним из многих вкладов, привнесенных системой MYCIN, является некоторое (хотя и не единственно возможное) решение проблемы комбинирования свидетельств. Шортлифф разработал схему, основанную на так называемых коэффициентах уверенности, которые он ввел для измерения степени доверия к любому данному заключению, являющемуся результатом полученных к этому моменту свидетельств. Коэффициент уверенности — это разность между двумя мерами: КУ [h: е] = МД [h: е] — МНД [h: е]. В этом выражении КУ [h: е] — уверенность в гипотезе h с учетом свидетельств е; МД [h: е] — мера доверия h при заданном е, тогда как МНД [h: е]— мера недоверия гипотезе h при свидетельствах е. КУ может изменяться от — 1 (абсолютная ложь) до +1 (абсолютная истина), принимая также все промежуточные значения, причем 0 означает полное незнание. Значения же МД и МНД, с другой стороны, могут изменяться лишь от 0 до 1. Таким образом, КУ — это простой способ взвешивания свидетельств "за" и "против". Промежуточные значения выражают степень доверия или недоверия к ситуации. Все описанные для однополярных коэффициентов процедуры здесь тоже имеют место, но при вычислении max и min учитываются знаки при величинах коэффициентов (например, что +0,1 > -0,2). Биполярность коэффициентов повлияла и на вид используемых формул. Заметим, что эта формула не позволяет отличить случай противоречащих свидетельств (и МД, и МНД обе велики) от случая недостаточной информации (и МД, и МНД обе малы), что иногда было бы полезно. Заметим также, что ни КУ, ни МД, ни МНД не являются вероятностными мерами. МД и МНД подчиняются некоторым аксиомам теории вероятности, но не являются выборками из какой-нибудь популяции, и, следовательно, им нельзя дать статистическую интерпретацию. Они просто позволяют упорядочить гипотезы в соответствии с той степенью обоснованности, которая у них есть. Так для вычисления коэффициента уверенности отрицания посылки достаточно лишь поменять знак коэффициента, т.е. ct(неЕ) = -ct(E). Процедура расчета степени поддержки заключения несколькими правилами тоже претерпела соответствующие изменения: а) если оба коэффициента положительны, то ct = ct1 + ct2 - ct1• ct2; б) если оба коэффициента отрицательны, то ct = ct1 + ct2 + ct1• ct2; в) если один из коэффициентов положителен, а другой отрицателен, то Работа с биполярными коэффициентами может привести к нереальным результатам, если правила сформулированы неточно. В частности, ошибка возникает, если не учитывается, что правила бывают обратимыми (применимыми при любых значениях коэффициентов уверенности в посылке) и необратимыми (применимыми лишь при положительных значениях коэффициента уверенности в посылке).
Многоступенчатые рассуждения и сети вывода. До сих пор речь шла о ситуациях, когда заключение отделялось от посылки одним шагом рассуждений. Более типична ситуация, когда вывод от посылок отделен рядом промежуточных шагов рассуждений. Принцип последовательного учета свидетельств работает успешно в том случае, когда применима так называемая монотонная логика. Но часто встречаются ситуации, когда она не имеет места. Это те случаи, когда какое-либо очередное свидетельство опровергает выводы, сделанные на основе предшествующих свидетельств. Для таких ситуаций разрабатываются специальные типы логик. Другого типа трудность возникает вследствие "незамкнутости мира": птицы летают, но не все; можно перечислить все предметы в комнате, но нельзя перечислить то, что вне ее. В таких случаях принимается "гипотеза закрытого мира": все, что вне его, то - ложь.
Шортлифф добавил в систему формулу уточнения, по которой новую информацию можно было непосредственно сочетать со старыми результатами. Она применяется к мерам доверия и недоверия, связанным с каждым предположением. Формула для МД выглядит следующим образом: МД[h: el, е2] =МД[h: el] +МД[h: е2) (1 — МД[h: e1]), где е1 и е2 – свидетельства, запятая между ними означает, что е2 следует за el. Аналогичным образом уточняются значения МНД. Смысл формулы состоит в том, что эффект второго свидетедьства (e2) на гипотезу h при заданном свидетельстве e1 сказывается в смещении МД в сторону полной определенности на расстояние, зависящее от второго свидетельства. Эта формула имеет два важных свойства: 1. 0на симметрична в том смысле, что порядок el и е2 не существен. 2. По мере накопления подкрепляющих свидетельств МД (или МНД) движется к определенности. Давайте рассмотрим фиктивные политические правила: Правило 1 ЕСЛИ Х водит "Фолькцваген" И Х читает "Вашингтон пост" ТО Х будет голосовать за демократов Правило 2 ЕСЛИ Х не любит Рональда Рейгана ИЛИ Х хочет, чтобы США убрались из Сальвадора ТО Х будет голосовать за демократов. Примем, что значения МД для этого Х таковы: l а. Х водит "Фолькцваген-" 0,8 } lб. Х читает "Вашингтон пост" 0,75} И < = > min 2а. Х не любит Рейгана 0,4} 2б. Х хочет покинуть Сальвадор 0 6} ИЛИ < = > max Тогда гипотеза, что Х голосует за демократов, поддерживается на уровне 0,75 правилом 1 и на уровне 0,6 правилом 2. Применяя приведенную формулу, получаем
МД [демократы: правило 1, правило 2] = МД [демократы: правило 1] + + МД [демократы: правило 2] (1 — МД [демократы: правило 1]) = = 0,75+ 0,6 • 0,25 = 0,9. Таким образом, объединенная мера доверия оказывается выше, чем при учете каждого свидетельства, взятого отдельно. Это согласуется с нашей интуицией, что несколько показывающих одно и то же направление свидетельств подкрепляют друг друга. Кроме того, можно поменять порядок правил 1 и 2, и на результате это не отразится. Схема Шортлиффа допускает также возможность того, что, как и данные, правила могут быть ненадежными. Это позволяет описывать более широкий класс ситуаций. Каждое правило снабжено "коэффициентом ослабления", числом от 0 до 1, показывающим надежность этого правила. Так, возвращаясь к нашим избирателям, мы могли бы сказать что-то вроде следующего: Правило 3 (надежность 0,64) ЕСЛИ Х водит "Шевроле" И Х читает Readers'Digest ТО Х будет голосовать за республиканцев. Правило 4 (надежность 0,8) ЕСЛИ Х любит бывших актеров ИЛИ Х хочет, чтобы США оккупировали Никарагуа ТО Х будет голосовать за республиканцев. Здесь правило 4 вызывает больше доверия, чем правило 3. Если степени поддержки условий таковы: За. Х водит "Шевроле" 0,88} Зб. Х читает Reader’s Digest 0,75} И ó MIN 4а. Х любит бывших актеров 0,5} 4б. Х хочет вторжения США 0,7} ИЛИ ó MAX в Никарагуа
то немодифицированная сила заключений будет равна 0,5 и 0,7, но эти МД следует умножить на ослабляющие коэффициенты 0,64 и 0,8, что дает 0,32 для правила 3 и 0,56 для правила 4. Применяя формулу уточнения Шортлиффа, получаем МД [республиканцы: пЗ, п4] = 0,32+ 0,56Х0,68 = 0,7008. Шортлифф предпринял попытку дать теоретическое обоснование этим методам, но его соображения не слишком убедительны. Важным здесь является то обстоятельство, что такой набор приемов сослужил хорошую службу в системе MYCIN и последовавших за ней программах.
|