Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Информационный поиск в среде интернет





 

Программы, поддерживающие HTML-стандарты, обеспечивающие квалифицированное представление материалов пользователям и навигацию по ссылкам, называются броузерами. С целью упрощения процедуры во многих случаях поиск информации осуществляется простым использованием ключевых слов.

Машины поиска используют сетевые роботы – спайдеры (боты) и индексы. Первые перемещаются в сети от сайта к сайту. Оказавшись на сайте, спайдер посылает отчет поисковой машине. Поисковые механизмы индексируют содержание страниц полностью или отдельные их части, такие, например, как заголовки документов. Основными характеристиками машин поиска являются язык запросов, представление исходных и выходных документов, время индексации и поиска, объем индекса, качество представления материала.

Как правило, поисковые машины обеспечивают интерфейс типа меню, с помощью которого пользователь может скомпоновать запрос на поиск информации, используя ключевые слова, фразы и логические связки. Большинство машин поиска находят очень большое число «релевантных» документов и страниц. Обычно эти материалы ранжируются по степени корреляции с запросом.

Типичный цикл работы машины поиска состоит в следующем:

- найти новый документ;

- отметить документ как извлеченный;

- расшифровать ссылки;

- проиндексировать содержание документа.

Агенты в системе отвечают за извлечение документов из сети. Для выполнения этой работы поисковый механизм находит свободного агента и передает ему задание на поиск. Агент приступает к работе и возвращает либо содержание документа, либо объяснение, почему данный документ нельзя доставить. Агенты запускаются как отдельные процессы, что позволяет изолировать основной процесс от ошибок и проблем с памятью. Одновременно используется много агентов. В развитых системах поиска имеются такие возможности:

- сохранения параметров поиска для повторного использования, а часто и полной истории запросов пользователя;

- параллельного поиска на множестве ресурсов Интернета;

- оформления результатов в виде отчетов (HTML-файлов) и сохранения их в базе данных;

- слежения за обновлением информационных ресурсов Интернета, в том числе с частотой, задаваемой пользователем.

Прогресс систем поиска идет по пути увеличения интеллектуализации агентов и механизмов обучения, создания совершенных моделей знаний и правилам выводов на знаниях, анализа естественно-языковых текстов и т. д.

 







Дата добавления: 2014-11-10; просмотров: 672. Нарушение авторских прав; Мы поможем в написании вашей работы!




Кардиналистский и ординалистский подходы Кардиналистский (количественный подход) к анализу полезности основан на представлении о возможности измерения различных благ в условных единицах полезности...


Обзор компонентов Multisim Компоненты – это основа любой схемы, это все элементы, из которых она состоит. Multisim оперирует с двумя категориями...


Композиция из абстрактных геометрических фигур Данная композиция состоит из линий, штриховки, абстрактных геометрических форм...


Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

Классификация ИС по признаку структурированности задач Так как основное назначение ИС – автоматизировать информационные процессы для решения определенных задач, то одна из основных классификаций – это классификация ИС по степени структурированности задач...

Внешняя политика России 1894- 1917 гг. Внешнюю политику Николая II и первый период его царствования определяли, по меньшей мере три важных фактора...

Оценка качества Анализ документации. Имеющийся рецепт, паспорт письменного контроля и номер лекарственной формы соответствуют друг другу. Ингредиенты совместимы, расчеты сделаны верно, паспорт письменного контроля выписан верно. Правильность упаковки и оформления....

Тема 5. Анализ количественного и качественного состава персонала Персонал является одним из важнейших факторов в организации. Его состояние и эффективное использование прямо влияет на конечные результаты хозяйственной деятельности организации.

Билет №7 (1 вопрос) Язык как средство общения и форма существования национальной культуры. Русский литературный язык как нормированная и обработанная форма общенародного языка Важнейшая функция языка - коммуникативная функция, т.е. функция общения Язык представлен в двух своих разновидностях...

Патристика и схоластика как этап в средневековой философии Основной задачей теологии является толкование Священного писания, доказательство существования Бога и формулировка догматов Церкви...

Studopedia.info - Студопедия - 2014-2025 год . (0.012 сек.) русская версия | украинская версия