Понятие полноты и точности информационного поиска
Информационный поиск: Действия, методы и процедуры, позволяющие осуществлять отбор определенной информации из массива данных Пертинентность; пертинентный:Соответствие полученной информации информационной потребности Показатели эффективности информационно-поисковых систем: Полнота информационного поиска R определяется отношением числа найденных пертинентных документов А к общему числу пертинентных документов С, имеющихся в системе или в исследуемой совокупности документов: Точность информационного поиска Р определяется отношением числа найденных пертинентных документов А к общему числу документов L, выданных на запрос пользователя: Наличие среди отобранных на запрос пользователя нерелевантных документов называется информационным шумом системы. Коэффициент информационного шума К, соответственно, определяется отношением числа нерелевантных документов (L-A), выданных в ответе пользователю к общему числу документов L, выданных на запрос пользователя: В идеале полнота информационного поиска и точность информационного поиска должны приближаться к единице, хотя на практике их значения колеблются в пределах от 60 до 90%.
В реальных системах невозможно достичь одновременно высокой полноты и точности. Поэтому при настройке и оценке используются комбинированные метрики
|