Документальные и фактографические АИС
ДОКУМЕНТАЛЬНО-ФАКТОГРАФИЧЕСКИЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ — специфический класс информационно-справочных и информационно-поисковых систем, осуществляющих поиск, переработку и хранение документальной и фактографической информации. Интерес к такого рода системам особенно возрос в связи с проблемой информационного обеспечения управления научными, производственными и административными организациями, а также управления отраслями, ведомствами и территориальными объединениями. Для такого управления характерно использование одновременно документов и сведений фактического характера; причем информация одного вида может генерироваться из информации другого вида. Д.-ф. и. с. строят как кооперированные или как интегрированные системы. В кооперированных системах процессы переработки документальной и фактографической информации четко разграничены в рамках соответствующих каналов обработки. Каждый канал опирается на свою информационную базу и разобщен с другим по решаемым задачам или сообщениям на изменение содержания хранимой информации. В то же время оба канала могут иметь общие технические средства, общее управление функционированием, использовать одни и те же элементы матем. обеспечения и даже источники информации. Поэтому Д.-ф. и. с. кооперированного типа можно рассматривать как совокупность фактографической и документальной систем с обобществлением управления, используемых средств тех. и матем. обеспечения, а также источников поступления информации. Интегрированные Д.-ф. и. с. имеют полностью или частично совмещенную информационную базу для обоих каналов обработки. Это совмещение может быть сравнительно простым, когда, напр., показатели фактографических массивов сопровождаются ссылками на хранящиеся документы - источники. В других случаях совмещение предполагает непосредственное извлечение фактографической информации при ответах на запросы, применяя семантический анализ текста документов и различных правил логического вывода. Большое внимание в настоящее время уделяется разработке и внедрению автоматизированных Д.-ф. и. с. Построение автоматизированных систем кооперированного типа обычно предполагает независимую разработку фактографического и документального каналов с применением соответствующих методов и средств. Однако такие вопросы, как организация функционирования системы, использование обобществленных ресурсов, совмещение отдельных информационных процессов и т. д. рассматриваются для всей системы в целом. При построении автоматизированных Д.-ф. и. с. интегрированного типа основные трудности связаны с созданием алгоритмов, которые обеспечивают автомат, пополнение и обновление фактографических массивов информационной базы путем анализа поступающих документов, а также эффективное извлечение отдельных сведений из текста документов при ответе на поступающие запросы. Ключевыми вопросами здесь являются: разработка эффективных алгоритмов семантического анализа текстовой информации; создание достаточно мощной дедуктивной системы, позволяющей делать нетривиальные выводы о фактическом содержании анализируемого текста или группы показателей; разработка эффективных процедур и критериев оценки содержательной достоверности результатов анализа и логического вывода. Необходимыми условиями решения указанных проблем являются, в частности, создание формализованного языка, обеспечивающего адекватное описание объектов и ситуаций; разработка эффективных алгоритмов грамматического анализа текстов на естественном языке; разработка методов оптим. организации массивов данных со сложной внутренней структурой и т. д. Тех. предпосылками создания автоматизированных Д.-ф. и. с., пригодных для практического применения, является наличие запоминающих устройств с произвольным доступом и большой емкостью, а также реализация автоматич. ввода текста непосредственно с первичных документов в ЦВМ. Было построено несколько экспериментальных автоматизированных Д.-ф. и. с., на которых исследовались отдельные вопросы построения и применения таких систем. Создание Д.-ф. и. с., рассчитанных на широкое применение. затрудняется тем, что пока нет эффективных методов семантического анализа и дедуктивных систем, пригодных к практическому использованию. Однако, несмотря на эти затруднения, интерес к изучению Д.-ф. и. с. интегрированного типа не ослабевает, т. к. применение таких систем является наиболее перспективным путем повышения эффективности применения автоматизированных информационных систем для обеспечения научных исследований, управления в экономике и т. п.
|