Студопедия — Подходы к поиску информации
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Подходы к поиску информации






 

Обозначим два подхода к поиску информации:

1. Использование списков специальных дескрипторов (ключевых слов, систематических индексов), заранее присвоенных вручную каждому элементу информации (справке об организации, книге, газетной статье) в соответствии с некоторыми правилами. Эти дескрипторы могут встречаться или не встречаться в тексте документа. Они могут иметь обобщающий или аналитический характер, как, например, библиотечные предметные рубрики или систематические индексы УДК и ББК. Этот способ применяется в обычных записных книжках, телефонных и иных справочниках, указателях, картотеках, библиотечных каталогах, реляционных базах данных и т.п. Дескрипторы могут выстраиваться в линейный список (алфавит фамилий в каталоге, хронология публикаций в газете, адреса строений вдоль улицы) или образовывать древовидную структуру. Например, дерево предметных рубрик в предметном указателе или библиотечном каталоге, дерево рубрик в систематическом каталоге, выстроенное вручную дерево ссылок на тематические сайты в интернет-каталогах.

2. Контекстный поиск, т.е. поиск нужной информации путем сплошного просмотра массива документов. При этом, разумеется, весь массив не «пролистывают» заново при каждом обращении к нему. Поисковая машина (локальная или в Интернете) заранее просматривает его и строит по особым правилам список встречающихся в нем слов. Этот список периодически обновляется и используется для поиска при запросе. Такой список является формально правильным, но не может нести элемента обобщения или анализа информации. Этот способ применяется поисковыми машинами в Интернете и локальными «искалками».

Кроме того, широко применяется комбинированный способ, когда каждому документу из массива вручную, в соответствии с правилами, присваивается некоторый набор дескрипторов, характеризующих содержание документа, раскрывающих его смысл, назначение и т.д. Эти дескрипторы при сплошном просмотре массива документов также включаются в список встретившихся слов. Данный метод нередко используют для организации работы поисковых машин в Интернете и в полнотекстовых справочных правовых системах, таких как «Консультант Плюс» и др.

Перечисленные способы отличаются еще по одному параметру: Поиск только с помощью дескрипторов, как правило, очень точно выделяет нужные документы, хотя некоторые из них могут не попасть в выборку из-за недостатков систематизации или предметизации. Правильно сформулированный контекстный поиск даст все нужные документы – но, к сожалению, и большое количество ненужных (велик «информационный шум»).

Для изменения результатов поиска (расширения или сужения) могут применяться специальные операторы:

· замены символа: • (одного) или * (нескольких);

· усечения слова (слева, справа);

· больше, меньше, равно;

· операторы буквального соответствия;

· операторы диапазона значений;

· логические операторы: И (и то, и это), ИЛИ (или то, или это, или оба вместе), НЕ, исключительное ИЛИ (или только то – или только это);

· операторы близости расположения и порядка следования слов.

Может задаваться старшинство операторов (как в алгебраических выражениях, с помощью скобок).

Развитые системы поиска и базы данных позволяют сохранять результаты поисков и не только производить логические операции над выражениями, но и комбинировать с помощью логических операторов результаты предыдущих поисков, уточняя и дополняя запрос сколь угодно долго, вплоть до получения удовлетворительного результата.

 







Дата добавления: 2015-07-04; просмотров: 510. Нарушение авторских прав; Мы поможем в написании вашей работы!



Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...

Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...

Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Понятие о синдроме нарушения бронхиальной проходимости и его клинические проявления Синдром нарушения бронхиальной проходимости (бронхообструктивный синдром) – это патологическое состояние...

Опухоли яичников в детском и подростковом возрасте Опухоли яичников занимают первое место в структуре опухолей половой системы у девочек и встречаются в возрасте 10 – 16 лет и в период полового созревания...

Способы тактических действий при проведении специальных операций Специальные операции проводятся с применением следующих основных тактических способов действий: охрана...

Основные симптомы при заболеваниях органов кровообращения При болезнях органов кровообращения больные могут предъявлять различные жалобы: боли в области сердца и за грудиной, одышка, сердцебиение, перебои в сердце, удушье, отеки, цианоз головная боль, увеличение печени, слабость...

Вопрос 1. Коллективные средства защиты: вентиляция, освещение, защита от шума и вибрации Коллективные средства защиты: вентиляция, освещение, защита от шума и вибрации К коллективным средствам защиты относятся: вентиляция, отопление, освещение, защита от шума и вибрации...

Задержки и неисправности пистолета Макарова 1.Что может произойти при стрельбе из пистолета, если загрязнятся пазы на рамке...

Studopedia.info - Студопедия - 2014-2024 год . (0.008 сек.) русская версия | украинская версия