Студопедия — SEARCH ENGINE
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

SEARCH ENGINE






Search Engine — 1) Search Engine — система, предназначенная для поиска и доставки информации. Организована с целью каталогизации информации. Обычно использует индексацию HTML-страниц, чтобы в дальнейшем было легко находить данную информацию. Как правило, работа поисковой машины состоит из двух этапов. Специальная программа (поисковый робот, автомат, агент, паук, червяк, crawler) постоянно обходит сеть и собирает информацию с веб-страниц (индексирует их). Когда пользователь задает запрос, поиск идет по предварительно построенному индексу. Результатом поиска является так называемая поисковая выдача — список ссылок на документы (веб-страницы), соответствующие запросу. Поисковые машины различаются по области действия на локальные (ограничивающиеся национальным доменом, определенным языком) и глобальные. Обычно глобальные искалки хорошо покрывают американский интернет (который действительно является значительной частью мирового) и несколько хуже "знают" остальную часть. Поэтому, если ваш поиск заведомо ограничен страной или языком, лучше пользоваться локальной искалкой. Интернет — живая динамическая система, которая меняется быстрее, чем об этом успевает узнать робот поисковой машины. Поэтому иногда найденные документы могут оказаться измененными или вообще не существовать. Некоторые поисковые машины при индексации сохраняют у себя образ индексируемого документа и могут показать его пользователю даже после того, как оригинал перестал соответствовать образу. Скорость обновления индекса и полнота покрытия (размер поисковой базы) являются важной характеристикой поисковой машины. Ссылки на документы в результатах поиска сортируются по по мере соответствия запросу. Этот критерий называется "релевантность". Способ вычисления релевантности является собственным know-how каждой поисковой машины, поэтому выдача по одному и тому же запросу в разных искалках может заметно отличаться. Поисковые машины обычно имеют специальный язык запросов, с помощью которого можно точнее объяснить машине, что именно надо искать. Однако большинство искалок не требуют от пользователя знания этого языка, как правило, достаточно просто написать в строке запроса несколько ключевых слов, определяющих область вашего интереса. Самым современным искалкам можно задавать запросы просто на естественном, "человеческом" языке. Система сама разберется, какие слова и словосочетания являются ключевыми. Основной объект индексации поисковой машины — тексты. Однако существуют искалки, позволяющие делать поиск по картинкам, по mp3, по архивам программ, по новостям и т. д. Все поисковые машины сталкиваются с проблемой так называемого поискового спама. С большинством сайтов-спамеров удается бороться с помощью специальных алгоритмов, и меры, принимаемые к спамерам, могут быть довольно суровыми — вплоть до полного исключения сайта из поисковой базы

2) Поисковый механизм сети Интернет

 







Дата добавления: 2015-09-07; просмотров: 395. Нарушение авторских прав; Мы поможем в написании вашей работы!



Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Логические цифровые микросхемы Более сложные элементы цифровой схемотехники (триггеры, мультиплексоры, декодеры и т.д.) не имеют...

Весы настольные циферблатные Весы настольные циферблатные РН-10Ц13 (рис.3.1) выпускаются с наибольшими пределами взвешивания 2...

Хронометражно-табличная методика определения суточного расхода энергии студента Цель: познакомиться с хронометражно-табличным методом опреде­ления суточного расхода энергии...

ОЧАГОВЫЕ ТЕНИ В ЛЕГКОМ Очаговыми легочными инфильтратами проявляют себя различные по этиологии заболевания, в основе которых лежит бронхо-нодулярный процесс, который при рентгенологическом исследовании дает очагового характера тень, размерами не более 1 см в диаметре...

Ганглиоблокаторы. Классификация. Механизм действия. Фармакодинамика. Применение.Побочные эфффекты Никотинчувствительные холинорецепторы (н-холинорецепторы) в основном локализованы на постсинаптических мембранах в синапсах скелетной мускулатуры...

Шов первичный, первично отсроченный, вторичный (показания) В зависимости от времени и условий наложения выделяют швы: 1) первичные...

Предпосылки, условия и движущие силы психического развития Предпосылки –это факторы. Факторы психического развития –это ведущие детерминанты развития чел. К ним относят: среду...

Studopedia.info - Студопедия - 2014-2024 год . (0.008 сек.) русская версия | украинская версия