Управление работой сканера.Программное обеспечение
Для управления работой сканера (впрочем, как и иного устройства) необходима соответствующая программа — драйвер. В этом случае управление идет не на уровне «железа» (портов ввода-вывода), а через функции или точки входа драйвера. До недавнего времени каждый драйвер для сканера имел свой собственный интерфейс. Это было достаточно неудобно, поскольку для каждой модели сканера требовалась своя прикладная программа. Логичнее было бы наоборот, если бы с одной прикладной программой могли работать несколько моделей сканеров. Это стало возможным благодаря TWAIN. TWAIN — это стандарт, согласно которому осуществляется обмен данными между прикладной программой и внешним устройством. Основной целью создания TWAIN-спецификации было решение проблемы совместимости, то есть легкого объединения различных устройств ввода с любым программным обеспечением. После обработки документа сканером получается графическое изображение документа, который еще не является текстом. С точки зрения ПК, документ превращается в набор разноцветных точек, а вовсе не в текстовый документ. Эту проблему решают специальные программы, предназначенные для распознавания текста. На сегодняшний день существует немало программ, предназначенных для этой цели. Наиболее распространенная и широко известная — Fine Reader. Она обеспечивает высокое качество распознавания и удобство применения. Порядок распознавания текстовых документов (программа Fine Reader) Преобразование бумажного текстового документа в электронный происходит в три этапа, причем Fine Reader может выполнять их как автоматически, так и под контролем пользователя.
Рис. 9 Окно программы Fine Reader
Первый этап — сканирование. Для его проведения необходимо запустить программу и включить сканер, после чего произвести щелчок на кнопке «Сканировать». Второй этап работы — сегментация текста. Дело в том, что в бумажном документе текст не всегда располагается в фиксированном порядке. Он может размещаться и в нескольких колонках, содержать табличные данные, иллюстрации и т.д., поэтому прежде чем включать текст в документ, его разбивают на блоки, содержащие цельные фрагменты. При щелчке на кнопке «Сегментировать» сегментация производится автоматически. Последний этап работы — непосредственно распознавание. Этот этап обычно не требует вмешательства пользователя, за исключением случаев, когда бумажный документ имеет недостаточную контрастность или необычный шрифт. В этих исключительных случаях целесообразно сначала провести «обучение» программы в соответствии с особенностями данного документа, для чего устанавливают флажок «Распознавание с обучением» и следуют инструкциям, которые предлагает программа. Для всех остальных случаев распознавание начинается по щелчку на кнопке «Распознать». Полученный текст можно сохранить в виде форматированного (отредактированного) или неформатированного документа, либо отправить в программы Word или Excel, а также в буфер обмена Windows.
|