Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Подходы к поиску информации





 

Обозначим два подхода к поиску информации:

1. Использование списков специальных дескрипторов (ключевых слов, систематических индексов), заранее присвоенных вручную каждому элементу информации (справке об организации, книге, газетной статье) в соответствии с некоторыми правилами. Эти дескрипторы могут встречаться или не встречаться в тексте документа. Они могут иметь обобщающий или аналитический характер, как, например, библиотечные предметные рубрики или систематические индексы УДК и ББК. Этот способ применяется в обычных записных книжках, телефонных и иных справочниках, указателях, картотеках, библиотечных каталогах, реляционных базах данных и т.п. Дескрипторы могут выстраиваться в линейный список (алфавит фамилий в каталоге, хронология публикаций в газете, адреса строений вдоль улицы) или образовывать древовидную структуру. Например, дерево предметных рубрик в предметном указателе или библиотечном каталоге, дерево рубрик в систематическом каталоге, выстроенное вручную дерево ссылок на тематические сайты в интернет-каталогах.

2. Контекстный поиск, т.е. поиск нужной информации путем сплошного просмотра массива документов. При этом, разумеется, весь массив не «пролистывают» заново при каждом обращении к нему. Поисковая машина (локальная или в Интернете) заранее просматривает его и строит по особым правилам список встречающихся в нем слов. Этот список периодически обновляется и используется для поиска при запросе. Такой список является формально правильным, но не может нести элемента обобщения или анализа информации. Этот способ применяется поисковыми машинами в Интернете и локальными «искалками».

Кроме того, широко применяется комбинированный способ, когда каждому документу из массива вручную, в соответствии с правилами, присваивается некоторый набор дескрипторов, характеризующих содержание документа, раскрывающих его смысл, назначение и т.д. Эти дескрипторы при сплошном просмотре массива документов также включаются в список встретившихся слов. Данный метод нередко используют для организации работы поисковых машин в Интернете и в полнотекстовых справочных правовых системах, таких как «Консультант Плюс» и др.

Перечисленные способы отличаются еще по одному параметру: Поиск только с помощью дескрипторов, как правило, очень точно выделяет нужные документы, хотя некоторые из них могут не попасть в выборку из-за недостатков систематизации или предметизации. Правильно сформулированный контекстный поиск даст все нужные документы – но, к сожалению, и большое количество ненужных (велик «информационный шум»).

Для изменения результатов поиска (расширения или сужения) могут применяться специальные операторы:

· замены символа: • (одного) или * (нескольких);

· усечения слова (слева, справа);

· больше, меньше, равно;

· операторы буквального соответствия;

· операторы диапазона значений;

· логические операторы: И (и то, и это), ИЛИ (или то, или это, или оба вместе), НЕ, исключительное ИЛИ (или только то – или только это);

· операторы близости расположения и порядка следования слов.

Может задаваться старшинство операторов (как в алгебраических выражениях, с помощью скобок).

Развитые системы поиска и базы данных позволяют сохранять результаты поисков и не только производить логические операции над выражениями, но и комбинировать с помощью логических операторов результаты предыдущих поисков, уточняя и дополняя запрос сколь угодно долго, вплоть до получения удовлетворительного результата.

 







Дата добавления: 2015-07-04; просмотров: 549. Нарушение авторских прав; Мы поможем в написании вашей работы!




Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...


Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...


Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...


Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Выработка навыка зеркального письма (динамический стереотип) Цель работы: Проследить особенности образования любого навыка (динамического стереотипа) на примере выработки навыка зеркального письма...

Словарная работа в детском саду Словарная работа в детском саду — это планомерное расширение активного словаря детей за счет незнакомых или трудных слов, которое идет одновременно с ознакомлением с окружающей действительностью, воспитанием правильного отношения к окружающему...

Правила наложения мягкой бинтовой повязки 1. Во время наложения повязки больному (раненому) следует придать удобное положение: он должен удобно сидеть или лежать...

ОСНОВНЫЕ ТИПЫ МОЗГА ПОЗВОНОЧНЫХ Ихтиопсидный тип мозга характерен для низших позвоночных - рыб и амфибий...

Принципы, критерии и методы оценки и аттестации персонала   Аттестация персонала является одной их важнейших функций управления персоналом...

Пункты решения командира взвода на организацию боя. уяснение полученной задачи; оценка обстановки; принятие решения; проведение рекогносцировки; отдача боевого приказа; организация взаимодействия...

Studopedia.info - Студопедия - 2014-2025 год . (0.009 сек.) русская версия | украинская версия