Студопедия — Стратегии получения знаний
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Стратегии получения знаний






В литературе по ЭС получили распространение несколько терминов: приобретение, добыча, извлечение, получение, выявление, формирование знаний. В англоязычной специальной литературе в основном используются два: acquisition (приобретение) и elicitation (выявление, извлечение, установление).

Термин "приобретение" трактуется либо очень широко (тогда он включает весь процесс передачи знаний от эксперта к базе знаний ЭС), либо уже как способ автоматизированного построения базы знаний посредством диалога эксперта и специальной программы (при этом структура знаний заранее закладывается в программу). В обоих случаях термин "приобретение" не касается самого таинства экстрагирования структуры знаний из потока информации о предметной области. Этот процесс описывается понятием "извлечение".

Термин "приобретение" оставляем за автоматизированными системами прямого общения с экспертом. Они действительно непосредственно приобретают уже готовые фрагменты знаний в соответствии со структурами, заложенными разработчиками систем. Большинство этих инструментальных средств специально ориентировано на конкретные ЭС с жестко обозначенной предметной областью и моделью представления знаний, т. е. не являются универсальными.

Термин "формирование" знаний традиционно закрепился за чрезвычайно перспективной и активно развивающейся областью инженерии знаний, которая занимается разработкой моделей, методов и алгоритмов обучения. Она включает индуктивные модели формирования гипотез на основе обучающих выборок, обучение по аналогии и другие методы.

Таким образом, можно выделить три стратегии проведения стадии получения знаний при разработке ЭС (см. рис. 6.6):

1) использованием ЭВМ при наличии подходящего программного инструментария; тогда мы будем говорить о приобретении знаний;

2) с использованием программ обучения при наличии репрезентативной (т.е. достаточно представительной) выборки примеров принятия решений в предметной области и соответствующих пакетов прикладных программ; тогда мы будем говорить о формировании знаний;

3) без использования вычислительной техники путем непосредственного контакта инженера по знаниям и источника знаний (будь то эксперт, специальная литература или другие источники); в этом случае мы будем говорить об извлечении знаний; эта стратегия наиболее актуальна.

 

 


Рис. 6.6. Три стратегии получения знаний

 

Извлечение знаний - это процедура взаимодействия эксперта с источником знаний, в результате которой становятся явными процесс рассуждений специалистов при принятии решения и структура их представления о предметной области.

В процедуре извлечения знаний можно выделить три основных аспекта: психологический, лингвистический и гносеологический.

Из трех выделенных аспектов извлечения знаний психологический является главным, поскольку он определяет успешность и эффективность взаимодействия инженера по знаниям (аналитика) с основным источником знаний - экспертом-профессионалом. Извлечение знаний происходит чаще всего в процессе непосредственного общения разработчиков системы.

Общение или коммуникация (от латинского communicatio - связь) - это междисциплинарное понятие, обозначающее все формы непосредственных контактов между людьми. Общение есть процесс выработки новой информации, общей для общающихся людей и рождающей их общность. Можно выделить четыре основных уровня общения:

1) уровень манипулирования;

2) уровень "рефлексивной игры";;

3) уровень правового общения;

4) уровень нравственного общения.

Предлагается следующая структурная модель общения при извлечении знаний: участники общения (партнеры); средства общения (процедура); предмет общения (знания).

В соответствии с этой структурой выделяют три "слоя" психологических проблем, возникающих при извлечении знаний: контактный слой, процедурный слой, когнитивный (познавательный) слой.

Лингвистический аспект извлечения знаний имеет следующую структуру: общий код, понятийная структура, словарь пользователя.

Проблема "общего кода" возникает из-за различия языков, на которых говорят аналитик (инженер по знаниям) и эксперт.

Язык аналитика состоит из трех компонентов:

1) терминов предметной области, которые он почерпнул из специальной литературы в период подготовки;

2) общенаучной терминологии из его "теоретического багажа";

3) бытового разговорного языка.

Язык эксперта состоит из:

1) специальной терминологии, принятой в предметной области;

2) общенаучной терминологии;

3) бытового языка:

4) неологизмов, созданных экспертом за время работы (его профессиональный жаргон).

Некоторый общий язык или код, который необходимо выработать партнерам для успешного взаимодействия, будет складываться из следующих потоков, представленных на рис. 6.7.

Под понятийной структурой понимают "энциклопедию", в которой все термины объяснены в словарных статьях со ссылками на другие термины.

 

 

 

 


Рис. 6.7. Схема получения общего кода

 

Лингвистическая работа инженера по знаниям на данном слое проблем заключается в построении таких связанных фрагментов с помощью "сшивания" терминов. Фактически эта работа является подготовкой к этапу концептуализации, где это шитье (по Шенку - КОП, концептуальная организация памяти) приобретает некоторый законченный вил.

При тщательной работе аналитика и эксперта в понятийных структурах начинает проглядывать иерархия понятий. Эта иерархическая организация хорошо согласуется с теорией универсального предметного кода (УПК), согласно которой при мышлении используются не языковые конструкции, а их коды в форме некоторых абстракций.

Иерархия абстракций - это глобальная схема, которая может быть положена в основу концептуального анализа структуры знаний любой предметной области. Лингвистический эквивалент иерархии - иерархия понятий, которую необходимо построить в понятийной структуре, формируемой инженером по знаниям (см. рис. 6.8). На стадии концептуализации эта иерархическая структура превращается в пирамиду знаний.


 

 


Рис. 6.8. Пример соответствия понятийной структуры иерархии универсального предметного кода

 

Словарь пользователя. Лингвистические результаты, отнесенные к слоям общего кода и понятийной структуры, направлены на создание адекватной базы знаний. Для разработки пользовательского интерфейса необходима дополнительная доработка словаря общего кода с поправкой на доступность и "прозрачность" системы.

Гносеологический аспект.

Гносеология, - это раздел философии, связанный с теорией познания или теорией отражения действительности в сознании человека.

Инженерия знаний как наука, если можно так выразиться, дважды гносеологична - сначала действительность (О) отражается в сознании эксперта 1), а затем деятельность и опыт эксперта интерпретируются сознанием инженера по знаниям 2), что служит уже основой для построения третьей интерпретации (Pz) - поля знаний экспертной системы (рис. 6.9). I1, I2, I3 - процессы отображения.

 


Рис. 6.9. Гносеологический аспект извлечения знаний

 

Познание всегда связано с созданием новых понятий, теорий. Аналитику может помочь инструментарий системной методологии, позволяющий использовать известные принципы логики научных исследований, понятийной иерархии науки. Эта методология заставляет его за частным всегда стремиться увидеть общее, т.е. строить цепочки:

ФАКТ ® ОБОБЩЕННЫЙ ФАКТ ® ЭМПИРИЧЕСКИЙ ЗАКОН ® ТЕОРЕТИЧЕСКИЙ ЗАКОН.

Такой подход полностью согласуется со структурой научного знания, которое имеет два уровня:

1) эмпирический (наблюдения, явления);

2) теоретический (законы, абстракции, обобщения).

Но теория - это не только стройная система обобщения научного знания, это также некоторый способ производства новых знаний. Основными методологическими критериями научности, позволяющими считать научным и само новое знание, и способ его получения, являются: 1) внутренняя согласованность и непротиворечивость; 2) системность; 3) объективность; 4) историзм.

Внутренняя согласованность. Этот критерий в эмпирических областях, на первый взгляд, просто не работает - в них факты часто не согласуются друг с другом, определения противоречивы, диффузны и т. д. Аналитику, знающему особенности эмпирического знания - его модальность, противоречивость и неполноту, приходится сглаживать эти "шероховатости" эмпирики.

Модальность знания означает возможность его существования в различных категориях, т. е. в конструкциях существования и долженствования. Таким образом, часть закономерностей возможна, другая обязательна и т.д. Кроме того, приходится различать такие оттенки модальности, как "эксперт знает, что..."; "эксперт думает, что..."; "эксперт считает, что... "; "эксперт хочет, чтобы... ".

Возможная противоречивость эмпирического знания - это естественное следствие из основных законов диалектики, и противоречия эти не всегда должны разрешаться в поле знаний, а напротив, именно противоречия служат чаще всего отправной точкой в рассуждениях экспертов.

Неполнота знания связана с возможностью полного описания предметной области. Задача аналитика эту неполноту ограничить определенными рамками "полноты", т. е. либо сузить границы предметной области, либо ввести ряд ограничений и допущений, упрощающих проблему.

Системность. Системно-структурный подход к познанию ориентирует аналитика на рассмотрение любой предметной области с позиций закономерности системного целого и взаимодействия составляющих его частей.

Современный структурализм исходит из многоуровневой иерархической организации любого объекта, т.е. все процессы и явления можно рассматривать как множество более мелких подмножеств (признаков, деталей) и, наоборот, любые объекты можно (и нужно) рассматривать как элементы более высоких классов обобщений. Например, системный взгляд на понятие "стол" позволяет увидеть его иерархическую организацию (см. рис. 6.10).

Объективность. Более корректно говорить о глубине понимания, чем об объективности знания. Понимание - это сотворчество, процесс истолкования объекта с точки зрения субъекта. Это сложный и неоднозначный процесс, совершающийся в глубинах человеческого сознания и требующий мобилизации всех интеллектуальных и эмоциональных способностей человека. Все усилия аналитик должен сосредоточить на понимании проблемы.

Историзм. Этот критерий связан с развитием. Познание настоящего есть познание породившего его прошлого. Хотя большинство ЭС дают "горизонтальный" срез знаний - без учета времени (в статике), инженер по знаниям должен всегда рассматривать процессы с учетом временных изменений - как связь с прошлым, так и связь с будущим. Например, структура поля знаний и база знаний должны допускать подстройку и коррекцию как в период разработки, так и во время эксплуатации ЭС.

 

 

 


Рис. 6.10. Классификация методов извлечения знаний

 

На выбор метода влияют три фактора: личностные особенности инженера по знаниям, эксперта и характеристика предметной области.

Одна из возможных классификаций людей по психологическим характеристикам делит всех на три типа: мыслитель (познавательный тип), собеседник (эмоционально-коммуникативный тип) и практик (практический тип). Мыслители ориентированы на интеллектуальную работу, учебу, теоретические обобщения. Собеседники - это общительные, открытые люди, готовые к сотрудничеству. Практики предпочитают действие разговорам, хорошо реализуют замыслы других, направлены на результативность работы.

Для характеристики предметных областей можно предложить следующую классификацию: хорошо документированные, средне документированные, слабо документированные.

Кроме того, предметные области можно разделить по критерию структурированности знаний. Под структурированностью будем понимать степень теоретического осмысления и выявленности основных закономерностей и принципов, действующих в данной предметной области.

 

Методологическая структура познания может быть представлена как последовательность следующих этапов:

1) описание и обобщение фактов;

2) установление связей;

3) построение идеализированной модели;

4) объяснение и предсказание явлений.

В заключение перечислим наиболее часто встречающиеся неудачи, связанные с гносеологическими проблемами инженерии знаний:

1) ошибочность, фрагментарность знаний (из-за нарушений принципа системности или ошибок в выборе фокуса внимания);

2) противоречивость знаний (из-за естественной противоречивости природы и общества, из-за неполноты извлеченных знаний, из-за некомпетентности эксперта);

3) ошибочная классификация (из-за неправильного определения числа классов или неточного описания класса);

4) ошибочная атрибуция, т.е. приписывание объекту свойств, которыми он не владеет (из-за неглубокой проработки знаний о предметной области);

5) ошибочный уровень обобщения (из-за чрезмерной детализации или обобщенности классов объектов);

6) ошибочная модель (из-за неадекватных когнитивных структур).








Дата добавления: 2015-10-19; просмотров: 1096. Нарушение авторских прав; Мы поможем в написании вашей работы!



Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...

Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...

Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...

Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Основные разделы работы участкового врача-педиатра Ведущей фигурой в организации внебольничной помощи детям является участковый врач-педиатр детской городской поликлиники...

Ученые, внесшие большой вклад в развитие науки биологии Краткая история развития биологии. Чарльз Дарвин (1809 -1882)- основной труд « О происхождении видов путем естественного отбора или Сохранение благоприятствующих пород в борьбе за жизнь»...

Этапы трансляции и их характеристика Трансляция (от лат. translatio — перевод) — процесс синтеза белка из аминокислот на матрице информационной (матричной) РНК (иРНК...

Оценка качества Анализ документации. Имеющийся рецепт, паспорт письменного контроля и номер лекарственной формы соответствуют друг другу. Ингредиенты совместимы, расчеты сделаны верно, паспорт письменного контроля выписан верно. Правильность упаковки и оформления....

БИОХИМИЯ ТКАНЕЙ ЗУБА В составе зуба выделяют минерализованные и неминерализованные ткани...

Типология суицида. Феномен суицида (самоубийство или попытка самоубийства) чаще всего связывается с представлением о психологическом кризисе личности...

Studopedia.info - Студопедия - 2014-2024 год . (0.012 сек.) русская версия | украинская версия