Студопедия — Подходы к поиску информации
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Подходы к поиску информации






 

Обозначим два подхода к поиску информации:

1. Использование списков специальных дескрипторов (ключевых слов, систематических индексов), заранее присвоенных вручную каждому элементу информации (справке об организации, книге, газетной статье) в соответствии с некоторыми правилами. Эти дескрипторы могут встречаться или не встречаться в тексте документа. Они могут иметь обобщающий или аналитический характер, как, например, библиотечные предметные рубрики или систематические индексы УДК и ББК. Этот способ применяется в обычных записных книжках, телефонных и иных справочниках, указателях, картотеках, библиотечных каталогах, реляционных базах данных и т.п. Дескрипторы могут выстраиваться в линейный список (алфавит фамилий в каталоге, хронология публикаций в газете, адреса строений вдоль улицы) или образовывать древовидную структуру. Например, дерево предметных рубрик в предметном указателе или библиотечном каталоге, дерево рубрик в систематическом каталоге, выстроенное вручную дерево ссылок на тематические сайты в интернет-каталогах.

2. Контекстный поиск, т.е. поиск нужной информации путем сплошного просмотра массива документов. При этом, разумеется, весь массив не «пролистывают» заново при каждом обращении к нему. Поисковая машина (локальная или в Интернете) заранее просматривает его и строит по особым правилам список встречающихся в нем слов. Этот список периодически обновляется и используется для поиска при запросе. Такой список является формально правильным, но не может нести элемента обобщения или анализа информации. Этот способ применяется поисковыми машинами в Интернете и локальными «искалками».

Кроме того, широко применяется комбинированный способ, когда каждому документу из массива вручную, в соответствии с правилами, присваивается некоторый набор дескрипторов, характеризующих содержание документа, раскрывающих его смысл, назначение и т.д. Эти дескрипторы при сплошном просмотре массива документов также включаются в список встретившихся слов. Данный метод нередко используют для организации работы поисковых машин в Интернете и в полнотекстовых справочных правовых системах, таких как «Консультант Плюс» и др.

Перечисленные способы отличаются еще по одному параметру: Поиск только с помощью дескрипторов, как правило, очень точно выделяет нужные документы, хотя некоторые из них могут не попасть в выборку из-за недостатков систематизации или предметизации. Правильно сформулированный контекстный поиск даст все нужные документы – но, к сожалению, и большое количество ненужных (велик «информационный шум»).

Для изменения результатов поиска (расширения или сужения) могут применяться специальные операторы:

· замены символа: • (одного) или * (нескольких);

· усечения слова (слева, справа);

· больше, меньше, равно;

· операторы буквального соответствия;

· операторы диапазона значений;

· логические операторы: И (и то, и это), ИЛИ (или то, или это, или оба вместе), НЕ, исключительное ИЛИ (или только то – или только это);

· операторы близости расположения и порядка следования слов.

Может задаваться старшинство операторов (как в алгебраических выражениях, с помощью скобок).

Развитые системы поиска и базы данных позволяют сохранять результаты поисков и не только производить логические операции над выражениями, но и комбинировать с помощью логических операторов результаты предыдущих поисков, уточняя и дополняя запрос сколь угодно долго, вплоть до получения удовлетворительного результата.

 







Дата добавления: 2015-07-04; просмотров: 512. Нарушение авторских прав; Мы поможем в написании вашей работы!



Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...

Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Расчетные и графические задания Равновесный объем - это объем, определяемый равенством спроса и предложения...

Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...

Билет №7 (1 вопрос) Язык как средство общения и форма существования национальной культуры. Русский литературный язык как нормированная и обработанная форма общенародного языка Важнейшая функция языка - коммуникативная функция, т.е. функция общения Язык представлен в двух своих разновидностях...

Патристика и схоластика как этап в средневековой философии Основной задачей теологии является толкование Священного писания, доказательство существования Бога и формулировка догматов Церкви...

Основные симптомы при заболеваниях органов кровообращения При болезнях органов кровообращения больные могут предъявлять различные жалобы: боли в области сердца и за грудиной, одышка, сердцебиение, перебои в сердце, удушье, отеки, цианоз головная боль, увеличение печени, слабость...

Растягивание костей и хрящей. Данные способы применимы в случае закрытых зон роста. Врачи-хирурги выяснили...

ФАКТОРЫ, ВЛИЯЮЩИЕ НА ИЗНОС ДЕТАЛЕЙ, И МЕТОДЫ СНИЖЕНИИ СКОРОСТИ ИЗНАШИВАНИЯ Кроме названных причин разрушений и износов, знание которых можно использовать в системе технического обслуживания и ремонта машин для повышения их долговечности, немаловажное значение имеют знания о причинах разрушения деталей в результате старения...

Различие эмпиризма и рационализма Родоначальником эмпиризма стал английский философ Ф. Бэкон. Основной тезис эмпиризма гласит: в разуме нет ничего такого...

Studopedia.info - Студопедия - 2014-2024 год . (0.009 сек.) русская версия | украинская версия