Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Эффективность ИПС





Эффективность информационного поиска (от лат. effectus - завершённый, законченный) – техническая оценка качества информационного поиска в ИПС. Основными параметрами, характеризующими её, считаются коэффициент полноты поиска R и коэффициент точности поиска Р (или эквивалентные им коэффициенты потерь информации Q и поискового шума S). Наиболее распространённый способ оценки эффективности поиска основывается на сопоставлении выдачи ИПС с результатами определения релевантности (соответствия) документов, входящих в информационный массив системы, которое производит группа специалистов-экспертов. Этот подход используется в большинстве известных методов определения потерь информации при поиске и поискового шума, несмотря на неоднозначность результатов такого определения релевантности, связанную с элементами субъективности при экспертной оценке. Идеальной считается ИПС, характеризуемая нулевыми значениями коэффициента потерь информации при поиске и поискового шума (или, что то же, значениями коэффициента полноты и точности равными единице). В реальных системах такие показатели недостижимы. Коэффициент полноты поиска обычно колеблется в пределах 0,7-0,9, а коэффициент точности поиска – в очень широких пределах, снижаясь до 0,1. величины коэффициента полноты и точности поиска зависят от ряда факторов: объёма и характеристик информационного массива, степени специфичности информационных запросов, свойств, используемых в системе информационно-поискового языка, критерия семантического соответствия.

Основным способом снижения потерь информации при поиске при заданных условиях функционирования ИПС является введение парадигматических отношений между словами информационного языка.

основным способом снижения поискового шума является введение синтагматических отношений между словами информационного языка в поисковых образах документов и запросов. При этом в критерии семантического соответствия должно быть учтено введение этих отношений. Английским учёным С. Клевердоном установлена обратная зависимость между полнотой и точностью поиска в одной системе (при использовании одного и того же ИПЯ).

Поэтому в ИПС иногда применяют ИПЯ, позволяющие в разной степени использовать парадигматические и синтагматические отношения. Это позволяет достигнуть приемлемых с точки зрения потребителя значений коэффициентов полноты и точности поиска или приемлемого соотношения этих значений. Следует учитывать, что достижение максимально возможной полноты поиска связано с огромными сложностями. Последние 5-10% требуют такого же усложнения языкового аппарата системы, как и предыдущие 90-95%, что влечёт за собой увеличение трудоёмкости обработки входной информации и времени поиска. Поэтому к максимальной полноте поиска стремятся лишь в особых случаях (напр., при патентной экспертизе).

Эффективность информационного поиска в документальной ИПС оценивается, в основном, коэффициентом точности поиска и коэффициентом полноты поиска.

коэффициент точности поиска – один из параметров, характеризующих техническую эффективность поиска

,

где а – число релевантных документов, выданных ИПС в ответ на информационный запрос;

b – число нерелевантных документов, выданных при этом системой. Коэффициент точности поиска связан с коэффициентом поискового шума S соотношением P = 1 – S.

Коэффициент полноты поиска - один из параметров, характеризующих техническую эффективность информационного поиска

где а – число релевантных документов, выданных ИПС в ответ на информационный запрос;

c – число релевантных документов в поисковом массиве системы, не выданных системой.

Этот коэффициент связан с коэффициентом потерь информации при поиске Q соотношением R = 1 – Q.

Потери информации при поиске – это невыдача ИПС документов или фактов, релевантных данному запросу. Коэффициент потерь Q связан с коэффициентом полноты поиска R соотношением Q = 1 – R.

Поисковый шум – выдача ИПС документов, нерелевантных данному запросу информационного языка.

Релевантный документ – документ является релевантным по отношению к информационному запросу, если между запросом и документом существует отношение релевантности.

Релевантность (от лат. relevo – поднимаю, облегчаю) семантическое соответствие пары текстов, один из которых представляет собой информационный запрос, а другой – документ в документальной ИПС или описание факта в фактографической ИПС.

Различают релевантность содержательную и релевантность формальную. Содержательная релевантность трактуется как соответствие документа или фактографической записи информационному запросу, определяемое неформальным путём, а формальная – как соответствие, определяемое алгоритмически путём сравнения ПОЗ с ПОД или с фактографической записью на основании применяемого в ИПС критерия семантического соответствия. В неавтоматизированных ИПС процесс поиска основан на определении персоналом системы содержательной релевантности, а в автоматизированных ИПС отбор документов или фактов основан на определении формальной релевантности.

Содержательная релевантность в автоматизированных ИПС, определяемая, например, методом экспертных оценок выдачи, используется для получения данных об эффективности информационного поиска в системе.

Контрольные вопросы по разделу 7

1. Что такое информационно-поисковая система (ИПС)?

2. Что такое информационно-поисковый язык (ИПЯ), тезаурус, грамматика языка?

3. Что такое поисковый образ документа, поисковый образ запроса, поисковый массив?

4. Из каких компонентов состоит ИПС? Абстрактная ИПС, информационно-поисковое устройство.

5. Какие существуют виды ИПС, чем отличается документальный поиск от фактографического?

6. Для чего нужны поисковые признаки, как они используются в информационном поиске?

7. Описать по блок-схеме ИПС работу документальной и фактографической ИПС.

8. В чем отличие документальной и фактографической ИПС?

9. Дать определение понятиям дескриптор, парадигма, тезаурус, индекс, индексирование, координатное индексирование?

10. Что такое поиск информационный автоматизированный, ретроспективный информационный поиск, избирательное распределение информации?

11. Что такое парадигматическое отношение, какими способами оно задаётся?

12. Что такое синтагматическое отношение, отношение подчинения, пертинентность?

13. Что такое эффективность информационного поиска, как она оценивается?

14. Как определяются коэффициенты точности и полноты поиска, коэффициент поискового шума, как они связаны между собой?

15. Что такое потери информации при поиске, поисковый шум, релевантность, релевантный документ?

 







Дата добавления: 2015-09-19; просмотров: 2507. Нарушение авторских прав; Мы поможем в написании вашей работы!




Практические расчеты на срез и смятие При изучении темы обратите внимание на основные расчетные предпосылки и условности расчета...


Функция спроса населения на данный товар Функция спроса населения на данный товар: Qd=7-Р. Функция предложения: Qs= -5+2Р,где...


Аальтернативная стоимость. Кривая производственных возможностей В экономике Буридании есть 100 ед. труда с производительностью 4 м ткани или 2 кг мяса...


Вычисление основной дактилоскопической формулы Вычислением основной дактоформулы обычно занимается следователь. Для этого все десять пальцев разбиваются на пять пар...

Интуитивное мышление Мышление — это пси­хический процесс, обеспечивающий познание сущности предме­тов и явлений и самого субъекта...

Объект, субъект, предмет, цели и задачи управления персоналом Социальная система организации делится на две основные подсистемы: управляющую и управляемую...

Законы Генри, Дальтона, Сеченова. Применение этих законов при лечении кессонной болезни, лечении в барокамере и исследовании электролитного состава крови Закон Генри: Количество газа, растворенного при данной температуре в определенном объеме жидкости, при равновесии прямо пропорциональны давлению газа...

Неисправности автосцепки, с которыми запрещается постановка вагонов в поезд. Причины саморасцепов ЗАПРЕЩАЕТСЯ: постановка в поезда и следование в них вагонов, у которых автосцепное устройство имеет хотя бы одну из следующих неисправностей: - трещину в корпусе автосцепки, излом деталей механизма...

Понятие метода в психологии. Классификация методов психологии и их характеристика Метод – это путь, способ познания, посредством которого познается предмет науки (С...

ЛЕКАРСТВЕННЫЕ ФОРМЫ ДЛЯ ИНЪЕКЦИЙ К лекарственным формам для инъекций относятся водные, спиртовые и масляные растворы, суспензии, эмульсии, ново­галеновые препараты, жидкие органопрепараты и жидкие экс­тракты, а также порошки и таблетки для имплантации...

Studopedia.info - Студопедия - 2014-2025 год . (0.011 сек.) русская версия | украинская версия