Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Задачи поиска информации. Критерии поиска информации




  • Полнотекстовый поиск — поиск по всему содержимому документа.
  • Поиск по метаданным — это поиск по неким атрибутам документа, поддерживаемым системой — название документа, дата создания, размер, автор и т. д.
  • Поиск по изображению — поиск по содержанию изображения. Поисковая система распознает содержание фотографии.

Методы поиска

  • Адресный поиск - процесс поиска документов по чисто формальным признакам, указанным в запросе (условия - наличие у документа точного адреса, обеспечение строгого порядка расположения документов в запоминающем устройстве или в хранилище системы)
  • Семантический поиск - процесс поиска документов по их содержанию. (условия: перевод содержания с естественного языка на информационно-поисковый язык и составление поисковых образов документа и запроса, составление поискового описания, в котором указывается дополнительное условие поиска)
  • Документальный поиск - процесс поиска в хранилище информационно-поисковой системы первичных документов или в базе данных вторичных документов, соответствующих запросу пользователя (виды: библиотечный, направленный на нахождение первичных документов; библиографический, направленный на нахождение сведений о документах, представленных в виде библиографических записей)
  • Фактографический поиск - процесс поиска фактов, соответствующих информационному запросу. (виды: документально-фактографический, заключается в поиске в документах фрагментов текста, содержащих факты; фактологический (описание фактов), предполагающий создание новых фактографических описаний в процессе поиска путем логической переработки найденной фактографической информации)

Критерии поиска

  • Критерий соответствия - Признак или совокупность признаков, по которым определяется степень соответствия между запросом или поисковым предписанием и поисковым образом документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой.
  • Критерий смыслового соответствия, критерий релевантности (документов, данных) - Признак или совокупность признаков, по которым определяется степень смыслового соответствия между содержанием поискового предписания и поискового образа документа, самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос , обрабатываемый системой.
  • Критерий формального соответствия - Признак или совокупность признаков, по которым определяется степень формального соответствия между поисковым предписанием и поисковым образом документа , самим документом или записью его части для принятия решения о выдаче или не выдаче конкретного документа на информационный запрос, обрабатываемый системой.
  • Релевантность - Характеристика степени соответствия смыслового содержания документа, найденного в результате поиска, содержанию информационного запроса.
  • Пертинентность - Характеристика степени соответствия документа или данных, найденных в результате поиска, информационной потребности пользователя, выраженной в его запросе .
  • Точность поиска, коэффициент точности поиска/выдачи - Количественная характеристика результатов информационного поиска . Точность поиска определяется путем деления количества выданных в результате выполнения поиска релевантных (см. релевантность ) документов на общее число выданных документов (релевантных и не релевантных). Данный показатель используется также для оценки качества информационно-поисковых систем .
  • Коэффициент информационного шума, коэффициент шума - Количественная характеристика информационного поиска. Коэффициент информационного шума (ИШ) определяется путем деления количества выданных в результате выполнения поиска нерелевантных документов (см. релевантность ) на общее число выданных документов (релевантных и не релевантных). Будучи выраженным в процентах, ИШ = 100%;- ТП=0 . Данный показатель используется также для оценки качества информационно-поисковых систем .
  • Полнота поиска, коэффициент полноты поиска - Количественная характеристика результатов информационного поиска, которая определяется путем деления количества выданных в результате выполнения поиска релевантных (см. релевантность) документов на общее число релевантных документов, имеющихся в информационно-поисковой системе (выданных и не выданных). Данный показатель используется также для оценки качества информационно-поисковых систем,
  • Коэффициент потерь - Количественная характеристика результатов информационного поиска . Коэффициент потерь (КП) определяется путем деления количества не выданных в результате выполнения поиска релевантных документов (см. релевантность ) на общее число релевантных документов, имеющихся в информационно-поисковой системе (выданных и не выданных). Будучи выраженным в процентах, КП = 100% - полнота поиска . Данный показатель используется также для оценки качества информационно-поисковых систем.
  • Оперативность (время) поиска - время, затрачиваемое на выполнение поиска, с момента формирования задания и выдачи команды на производство поиска до момента получения его результатов; в ЭВМ - Время, затрачиваемое головкой чтения/записи дисковода (накопителя), для того, чтобы достичь определенного элемента данных, записанного на диске, дискете или другом носителе данных внешней памяти ЭВМ.

 

 







Дата добавления: 2015-04-19; просмотров: 1120. Нарушение авторских прав; Мы поможем в написании вашей работы!


Рекомендуемые страницы:


Studopedia.info - Студопедия - 2014-2021 год . (0.002 сек.) русская версия | украинская версия