Подходы к поиску информации
Обозначим два подхода к поиску информации: 1. Использование списков специальных дескрипторов (ключевых слов, систематических индексов), заранее присвоенных вручную каждому элементу информации (справке об организации, книге, газетной статье) в соответствии с некоторыми правилами. Эти дескрипторы могут встречаться или не встречаться в тексте документа. Они могут иметь обобщающий или аналитический характер, как, например, библиотечные предметные рубрики или систематические индексы УДК и ББК. Этот способ применяется в обычных записных книжках, телефонных и иных справочниках, указателях, картотеках, библиотечных каталогах, реляционных базах данных и т.п. Дескрипторы могут выстраиваться в линейный список (алфавит фамилий в каталоге, хронология публикаций в газете, адреса строений вдоль улицы) или образовывать древовидную структуру. Например, дерево предметных рубрик в предметном указателе или библиотечном каталоге, дерево рубрик в систематическом каталоге, выстроенное вручную дерево ссылок на тематические сайты в интернет-каталогах. 2. Контекстный поиск, т.е. поиск нужной информации путем сплошного просмотра массива документов. При этом, разумеется, весь массив не «пролистывают» заново при каждом обращении к нему. Поисковая машина (локальная или в Интернете) заранее просматривает его и строит по особым правилам список встречающихся в нем слов. Этот список периодически обновляется и используется для поиска при запросе. Такой список является формально правильным, но не может нести элемента обобщения или анализа информации. Этот способ применяется поисковыми машинами в Интернете и локальными «искалками». Кроме того, широко применяется комбинированный способ, когда каждому документу из массива вручную, в соответствии с правилами, присваивается некоторый набор дескрипторов, характеризующих содержание документа, раскрывающих его смысл, назначение и т.д. Эти дескрипторы при сплошном просмотре массива документов также включаются в список встретившихся слов. Данный метод нередко используют для организации работы поисковых машин в Интернете и в полнотекстовых справочных правовых системах, таких как «Консультант Плюс» и др. Перечисленные способы отличаются еще по одному параметру: Поиск только с помощью дескрипторов, как правило, очень точно выделяет нужные документы, хотя некоторые из них могут не попасть в выборку из-за недостатков систематизации или предметизации. Правильно сформулированный контекстный поиск даст все нужные документы – но, к сожалению, и большое количество ненужных (велик «информационный шум»). Для изменения результатов поиска (расширения или сужения) могут применяться специальные операторы: · замены символа: • (одного) или * (нескольких); · усечения слова (слева, справа); · больше, меньше, равно; · операторы буквального соответствия; · операторы диапазона значений; · логические операторы: И (и то, и это), ИЛИ (или то, или это, или оба вместе), НЕ, исключительное ИЛИ (или только то – или только это); · операторы близости расположения и порядка следования слов. Может задаваться старшинство операторов (как в алгебраических выражениях, с помощью скобок). Развитые системы поиска и базы данных позволяют сохранять результаты поисков и не только производить логические операции над выражениями, но и комбинировать с помощью логических операторов результаты предыдущих поисков, уточняя и дополняя запрос сколь угодно долго, вплоть до получения удовлетворительного результата.
|