Совместное использование дискретных и непрерывных переменных в байесовских сетях доверия
В настоящее время существует ряд программных реализаций оболочек ЭС на основе БСД, которые позволяют оперировать не только дискретными, но и непрерывными случайными переменными. К числу таких программных средств относится и Hugin. Однако при использовании БСД, содержащих как непрерывные, так и дискретные переменные существует ряд ограничений: · дискретные переменные не могут иметь непрерывных родителей; · непрерывные переменные должны иметь нормальный закон распределения, условный на значениях родителей; · распределение непрерывной переменной Y с дискретными родителями I и непрерывными родителями Z является нормальным распределением P(Y | I = i, Z = z) = N(my (mi, mz), sy (si)), где my линейно зависит от непрерывных родителей, а sy вообще не зависит от непрерывных родителей. Однако, оба они (my и sy) зависят от дискретных родителей. Это ограничение гарантирует возможность точного вывода. Рассмотрим пример построения БСД с непрерывными и дискретными вершинами шансов. Пусть требуется построить ЭС, позволяющую оценивать суммарные производственные затраты в зависимости от использования и загрузки трёх групп оборудования (например, трех пилорам). Такая ЭС поможет в выборе наиболее рациональной загрузки оборудования, в обоснованном решение об аренде необходимого оборудования и допустимых арендных платежах и многое другое, необходимое менеджеру или инженеру по деревообработке. При анализе предметной ситуации эксперты установили, что в состав суммарных производственных затрат (без учёта зарплаты и начислений) входят: · прямые производственные затраты на каждую группу оборудования за исследуемый календарный период, которые зависят как от количества используемых групп оборудования, так и от времени работы каждой из групп в течение исследуемого периода времени, т.е. от степени загрузки каждой из групп; · расходы на амортизацию каждой из групп оборудования, зависящие как от её балансовой стоимости, так и установленных норм амортизации; · арендную плату за участок при каждой из групп оборудования, используемый для складирования сырья и продукции, которая зависит как от площади участка, так и от ставок арендной платы. Построение любой модели БСД начинается с выделения основных объектов и событий предметной области, анализа возможных состояний каждого из событий и установления причинно-следственных связей между ними. Так, в нашем примере, исходя из мнения экспертов, можно заключить, что на суммарные производственные затраты оказывают влияние:
· степень загрузки каждой из групп оборудования в течение исследуемого периода; · значения нормы амортизаци-онных отчислений; · ставка арендной платы за участок, используемый опреде-ленной группой оборудованием. При этом модель БСД будет иметь вид, приведенный на рис.8.3, где одинарные овалы соответствуют дискретным событиям, а двойные овалы - непрерывным событиям (гауссовским переменным). Для того чтобы данная качественная модель превратилась в полную БСД необходимо определить ее количественные характеристики. Для этого необходимо тщательно проанализировать каждое из событий. Так, вершина «Загрузка оборудования» соответствует дискретному событию, которое характеризуется тремя возможными состояниями. Вероятность пребывания в каждом из них определяется степенью загрузки каждой из групп оборудования, при условии, что суммарная загрузка всего оборудования равна единице. Если считать, что все группы оборудования загружены равномерно, то распределение вероятностей для этой вершины будет иметь вид табл.8.1. Таблица 8.1 Распределение вероятностей для вершины "Загрузка оборудования".
При этом следует отметить, что возможны и любые другие исходные распределения вероятностей, учитывающие различные варианты загрузки оборудования. Полученные от экспертов знания о том, что · ставка аренды 1 га земли в среднем составляет 2500 у.е. и колеблется в пределах ±10%, т.е. принимает значения 2500 ± 250 у.е., · а норма амортизации может находиться в пределах 5 - 10 % от балансовой стоимости, т.е. принимать значения 7,5 ± 2,5% (или 0,075 ± 0,025 относительных единиц) позволяют определить параметры ещё двух вершин - «Ставка арендной платы» и «Норма амортизации». Предполагая, что эти вершины шансов являются непрерывными случайные переменными с гауссовским законом распределения, необходимо задать параметры этих законов для каждой из вершин (табл.8.2). Таблица 8.2 Параметры законов распределение для непрерывных вершин.
Что касается вершины «Производственные затраты», то она характеризуется случайной переменной, условно нормальной на значениях родителей (т.е. на значениях трёх других вершин нашего примера). Следует отметить, что в общем случае распределение вероятностей для вершин, аналогичных «Производственные затраты» является не просто нормальным, а смешанным нормальным распределением. Т.е. представляет собой весовую сумму распределений, для каждого из которых должен быть задан список его параметров: · математические ожидания и дисперсии для распределений, описывающих степень влияния дискретных родителей; · весовые коэффициенты, учитывающие степень влияния на математическое ожидание непрерывных родителей. Если теперь, используя экспертное оценивание, предположить, что: · балансовая стоимость каждой из пилорам составляет 50000, 40000 и 30000 у.е., · площадь арендуемых участков, закрепляемая за ними равна 0,6; 0,5 и 0,4 га, · а оценка прямых затрат на поддержание нормальной работы каждой из пилорам в среднем составляет 3000, 3200 и 3500 у.е. и получена с 5% точностью, то степень влияния родительских вершин на «Производственные затраты» можно представить таблицей вида табл.8.3.
На основе проведенного экспертного оценивания предметной области можно теперь переходить к реализации БСД в системе Hugin и построения на ее базе ЭС, которая позволит получить оценку любых ее состояний, при любых произвольно задаваемых свидетельствах.
|