Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Назначение и возможности систем автоматического чтения текста





АЧТ - предназначены для автоматического ввода текста - сложная программа, которая позволяет преобразовать изображение в электронный вид, распознав при этом каждый символ.

Принципы работы АЧТ: 1) целостность (объект описывается как целое) 2) целенаправленность (распознавание строится как процесс выдвижения и целенапр.проверки гипотез) 3) адаптирование (способность комп.системы к самообучению). Этапы работы системы АЧТ: 1) сканирование 2) распознавание: анализ графич.пакета страницы, картина, выделение в тексте строк и отдельных символов 3) распознавание каждого символа на основе классификатора символов. Возможности систем АЧТ: 1) Позволяют распознать символы более 2000 языков 2) хорошо распознаёт, узнаёт все шрифты документа 3) способны самообучаться и распознавать плохо отпечатанные символы 4) распознаёт любые форматы изображений, б) хорошо распознаёт тексты с графикой, подписями, логотипами, тексты иа цветном фоне, точность распозн.текста хор. кач-ва достигает 97-99%.

 

Аннотация и реферат текста; основные понятия. Позиционный и логико-семантический методы автоматического реферирования текста

Реферат - связный текст, который кратко выражает не только центр.тему, но и цель, применяемые методы, основные результаты описываемого исследования. Рефераты - вторичные документы, которые составляют к научно-техническим документам, книгам, статьям Они помогают человеку ориентироваться в информационных потоках. Аннотация - краткое изложение содержания документа, дающее общее представление о его теме. Аннотирование (реферирование) - составление текста с помощью ПК. Система автоматического аннотирования и реферирования текста - система, имитирующая действия человека, создающего реферат Этапы построения реферата человеком: 1) Подготовительный (определение тематики) 2) Аналитический (раздел текста ив фрагменты, из которых выделяются основные смысловые единицы) 3) Построения реферата (выделенные смысловые единицы располагаются в текст в соответствии с планом реферата). Основные смысловые единицы - ключевые слова - термины, относящиеся к содержанию текста и повторяющиеся несколько раз с учётом всех синонимов. Ключевое сочетание слов - сочетание слов, среди которых есть одно или несколько ключевых слов. Ключевым словам предшествуют слова-реляторы книга посвящена следующим проблемам, в стать рассматривается... ПК должен уметь: 1) Находить ключевые слова, словосоч. предл. 2) находить менее значимые единицы 3) составлять из ключевых слов, словосоч. и предл. текст реферата. Основные методы автоматического реферирования текстов: 1 •статистические, 2 — позиционные, 3 - логико-семантические. Позиционные методы щ критерием для включения предложения в реферат, является ключевое предложение, явл.заголовком, подзаголовком, началом концом какой-либо части текста. Используются 2 метода: 1-метод заглавия-исследуется лексика заголовков 2-переое и предложения абзаца. Логико-семантические методы - опираются на исследование структуры и семантики текстов. Цель:выделить предложение с наибольшим функциональным методом. По данному методу был создан словарь ключевых слов, где каждому словаря приписан семантический код или признак

 







Дата добавления: 2015-06-15; просмотров: 732. Нарушение авторских прав; Мы поможем в написании вашей работы!




Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...


Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...


Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...


ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Краткая психологическая характеристика возрастных периодов.Первый критический период развития ребенка — период новорожденности Психоаналитики говорят, что это первая травма, которую переживает ребенок, и она настолько сильна, что вся последую­щая жизнь проходит под знаком этой травмы...

РЕВМАТИЧЕСКИЕ БОЛЕЗНИ Ревматические болезни(или диффузные болезни соединительно ткани(ДБСТ))— это группа заболеваний, характеризующихся первичным системным поражением соединительной ткани в связи с нарушением иммунного гомеостаза...

Решение Постоянные издержки (FC) не зависят от изменения объёма производства, существуют постоянно...

Понятие массовых мероприятий, их виды Под массовыми мероприятиями следует понимать совокупность действий или явлений социальной жизни с участием большого количества граждан...

Тактика действий нарядов полиции по предупреждению и пресечению правонарушений при проведении массовых мероприятий К особенностям проведения массовых мероприятий и факторам, влияющим на охрану общественного порядка и обеспечение общественной безопасности, можно отнести значительное количество субъектов, принимающих участие в их подготовке и проведении...

Тактические действия нарядов полиции по предупреждению и пресечению групповых нарушений общественного порядка и массовых беспорядков В целях предупреждения разрастания групповых нарушений общественного порядка (далееГНОП) в массовые беспорядки подразделения (наряды) полиции осуществляют следующие мероприятия...

Studopedia.info - Студопедия - 2014-2025 год . (0.01 сек.) русская версия | украинская версия