Понятие релевантности и пертинентности в документальных ИПС
Документальные и фактографические системы прежде всего отличаются степенью предварительной интеллектуальной обработки хранимой информации. В документальных ИПС объекты хранения и выдачи – документы и тексты целиком. При фактографическом поиске объекты хранения и выдачи – это представленные в специальной форме сведения (факты) об определенном объекте. Например, на запрос “какова скорость света” в документальных ИПС будут выданы статьи и книги, в которых говорится о скорости света, и возможно, содержится ответ на поставленный вопрос. В фактографической же системе в той или иной форме будет выдано сообщение о том, какова скорость света. Этот пример показывает главное различие между документальным и фактографическим поиском – в подходе к семантике документов и характеру предварительной их обработки для нужд последующего поиска. В документальных системах анализируется и описывается, “о чем говорится в документе”, а в фактографических – “что именно сообщается в документе”. Соответственно, следует различать два типа запросов: документальные (тематические – найти, документы в которых говорится о скорости света) и фактографические (найти, какова скорость света). В документальных системах описывается смысл документов в целом с точки зрения их тематического, предметного содержания. В этом случае важно выявить и как-то зафиксировать основные темы и объекты, которым посвящен документ. В фактографических системах при анализе содержания документа фиксируются признаки объектов и значения этих признаков. Нередко ИПС представляют собой смешанные системы, в которых фактографическая информация используется как дополнительное средство документального поиска, и наоборот. Библиографический поиск можно считать разновидностью документального поиска с элементами фактографии. Этот поиск осуществляется по элементам библиографического описания документов (автор, год, место издания, вид издания, издательство). В ответ можно получить, например, библиографические сведения о книгах конкретного автора или изданных в определенный год в определенном издательстве по определенной тематике, либо сами эти книги в электронном виде. Основной задачей документальных информационных систем является накопление и предоставление пользователю документов, содержание, тематика, реквизиты и т.п. которых адекватны его информационным потребностям. Поэтому можно дать следующее определение документальной ИС - единое хранилище документов с инструментарием поиска и отбора необходимых документов. Поисковый характер документальных информационных систем исторически определил еще одно их название — информационно-поисковые системы (ИПС), хотя этот термин не совсем полно отражает специфику документальных ИС. Информационная потребность: Характеристики предметной области, значения которых необходимо установить для выполнения поставленной задачи в практической деятельности
Соответствие найденных документов информационным потребностям пользователя называется пертинентностъю. В силу теоретических и практических сложностей с формализацией смыслового содержания документов пертинентность относится скорее к качественным понятиям, хотя, как будет рассмотрено ниже, может выражаться определенными количественными показателями Система на основе определенных критериев и способов ищет документы, поисковые образы которых соответствуют или близки поисковым образам запроса пользователя, и выдает соответствующие документы. Информационный запрос: Текст, выражающий информационную потребность
Соответствие найденных документов запросу пользователя называется релевантностью. Схематично общий принцип устройства и функционирования документальных ИПС на основе индексирования иллюстрируется на Рисунок 1. Рисунок 2. Общий принцип функционирования документальных ИПС на основе индексирования Поиск информации предполагает сравнение смыслового содержания запроса со смысловым содержанием документов. Такая операция возможна только в том случае, когда существует некоторый язык представления информации, позволяющий однозначно описывать смысловое содержание документов и запросов. Релевантность; релевантный:Соответствие полученной информации информационному запросу n Релевантность - степень соответствия содержания документа, найденного в результате информационного поиска, содержанию информационного запроса. n Пертинентность - степень соответствия содержания документа, найденного в результате информационного поиска, информационной потребности пользователя, сформулированной в виде информационного запроса.
|