Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Типы автоматического понимания текста





В зависимости от сложности использованных знаний и их кол-ва, различают след. типы автоматич.понимания текста: 1-Понимание - узнавание (комп.система должна иметь лишь знания о языке. Суть понимания сводится к тому, что ПК узнаёт морфологическую структуру каждого слова, предложения). 2 - Понимание - употребление (система должна иметь знания о языке и
правила их использования. Система понимает текст, если она способна ответить на вопросы к тексту. При таком понимании ПК, просто находит готовые ответы в своей базе знаний). 3 - Понимание - прогнозирование (ориентировано на достаточно узкую предметную область. В данном случае ПК должен иметь знания о языке, правила их использования в предметной области). 4 - Понимание - объединение (в базе знаний системы представлены и виды знаний. Объединяя эти знания ПК, система должна делать выводы, умозаключения к тексту и объяснять почему она формирует этот вывод). 5 - Понимание - объяснение (в базе знаний использ.все 5 значений. Система должна уметь объяснять каким образом она поняла текст, верно ли сохранила его задания).

 

22. Автоматическое порождение письменного текста: определение, этапы, общая структура системы порождения

Порождение связного текста с помощью компьютера. Установлено, что процесс текстообразования состоит из двух этапов: стратегическую (должно быть принято решение о том «что написать») и тактического (должно быть принято решение о том «как написать»). Результатом выполнения первого этапа должно стать смысловое представление будущего текста. Результатом выполнения второго этапа должен стать собственно сам текст в языковой форме. Исследователи разных стран пришли к выводу, что в системе автоматического порождения текста должны быть представлены три взаимосвязанных компонента:

1. Оболочка;

2. Планировщик;

3. Лингвистический реализатор.

Оболочка, прежде всего, определяет назначение порождающей системы. Это может быть обучающая компьютерная система, генерирующая комментарии компьютера в виде текста; экспертная система, отвечающая на запрос пользователя связным текстом; система моделирующая процесс создания текста - описания какого-либо объекта, текста - определения какого-либо понятия, текста стихотворения, рассказа и т. д.

В оболочке содержится вся база знаний. Она состоит из двух частей: предметной, в которую входят понятия, связи и отношения между понятиями конкретной предметной области, к которой будет относиться порождаемый текст, и лингвистической, которая включает формализованные сведения о конкретном языке на котором генерируется текст (списки морфем, словарь с необходимой лексикой, синтаксические структуры предложений и т. п.).

Планировщик выполняет следующие функции: 1- определяет ту информацию, которая должна быть представлена в тексте, и ту, которую можно опустить; 2- определяет, как эта информация должна быть представлена 3- определяет порядок следования абзацев в тексте; 4-устанавливает порядок следования синтаксических составляющих в пределах абзаца и всего текста; 5- осуществляет языковое оформление взаимосвязи предложений в абзаце и абзацев в тексте;6 -осуществляет построение синтаксической структуры предложений будущего текста; 7- осуществляет выбор соответствующей лексики.

Все эти задачи планировщик решает с опорой на оболочку и, в частности, на базу знаний (ее очень тщательно разрабатывают специалисты). Лингвистический реализатор обеспечивает грамматическую правильность порождаемого текста и принимает все окончательные синтаксические и морфологические решения (подтверждение или отрицание выбора синтаксического типа предложения и

его структуры, подтверждение или отрицание выбора конкретных основ и афиксов/окончаний или словоформ и т. д.).

 







Дата добавления: 2015-06-15; просмотров: 865. Нарушение авторских прав; Мы поможем в написании вашей работы!




Шрифт зодчего Шрифт зодчего состоит из прописных (заглавных), строчных букв и цифр...


Картограммы и картодиаграммы Картограммы и картодиаграммы применяются для изображения географической характеристики изучаемых явлений...


Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...


Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...

Классификация холодных блюд и закусок. Урок №2 Тема: Холодные блюда и закуски. Значение холодных блюд и закусок. Классификация холодных блюд и закусок. Кулинарная обработка продуктов...

ТЕРМОДИНАМИКА БИОЛОГИЧЕСКИХ СИСТЕМ. 1. Особенности термодинамического метода изучения биологических систем. Основные понятия термодинамики. Термодинамикой называется раздел физики...

Травматическая окклюзия и ее клинические признаки При пародонтите и парадонтозе резистентность тканей пародонта падает...

Гидравлический расчёт трубопроводов Пример 3.4. Вентиляционная труба d=0,1м (100 мм) имеет длину l=100 м. Определить давление, которое должен развивать вентилятор, если расход воздуха, подаваемый по трубе, . Давление на выходе . Местных сопротивлений по пути не имеется. Температура...

Огоньки» в основной период В основной период смены могут проводиться три вида «огоньков»: «огонек-анализ», тематический «огонек» и «конфликтный» огонек...

Упражнение Джеффа. Это список вопросов или утверждений, отвечая на которые участник может раскрыть свой внутренний мир перед другими участниками и узнать о других участниках больше...

Studopedia.info - Студопедия - 2014-2025 год . (0.008 сек.) русская версия | украинская версия