Средства поиска в Интернете
Сначала диктуй со слов "Поисковые механизмы в интернете..." Правильный выбор инструмента поиска - ключевой момент поисковой стратегии. Если не помогает одна служба, можно попробовать другие. В табл. 1. дается краткий перечень существующих сегодня в Internet поисковых служб. В правой колонке перечислены названия служб, в левой - задачи, которые они позволяют решать. Поиск страниц пониженного спроса Yahoo! Поиск максимального количества источников, удовлетворяющих заданному условию AltaVista, InfoSeek Поиск по темам и ключевым словам Excite, InfoSeek Поиск по образцу Excite Поиск по именам собственным AltaVista, Excite, InfoSeek Полный обзор Web AltaVista, InfoSeek Просмотр отдельные серверов Excite, InfoSeek Поиск по названиям и URL-адресам AltaVista, Yahoo! Обзор UseNet AltaVista, Excite, InfoSeek Если же вы ищите информацию заведомо русскоязычную, то имеет смысл использовать российские каталоги. Принцип работы с ними идентичен, тому который мы рассмотрели на примере с Yahoo!. 2.2. Роботы индексов или поисковые машины. Наиболее развитый сервис поиска русскоязычной информации предоставляет сервер Яndex (http://www.yandex.ru/). В Яndex можно просто написать по-русски фразу, описывающую то, что вы хотите найти. Система самостоятельно проанализирует и обработает ваш запрос, а затем постарается найти все, что относится к заданной теме Стоит вспомнить о еще одной популярной российской поисковой машине Rambler (http://www.rambler.ru/). У этого сервера еще более полная база данных адресов URL, чем у Яndex. Отличительной чертой Rambler является то, что этот сервер ведет статистику посещаемости ссылок из собственной базы данных. Вы всегда можете зайти в раздел "Рейтинг" на главной странице Rambler и увидеть содержимое тематического каталога, отсортированного по убыванию числа посещений сайтов и следовательно их популярности. Тем самым отсекаются явные аутсайдеры и вы не тратите на них свое время. Поисковые машины и тематические каталоги сегодня имеют много общего. У каталогов присутствует возможность поиска информации по строке запроса с использованием логических операторов, а поисковые машины содержат свои собственные тематические каталоги. И тем не менее лучше всего эти поисковые сервисы проявляют себя в своей первоначальной категории. Новости разделены по иерархически организованным тематическим группам, и имя каждой группы состоит из имен подуровней иерархии, разделенных точками, причем более общий уровень пишется первым.. 2.5. Службы поиска людей.
Поисковые системы обычно состоят из трех компонент: · агент (паук или кроулер), который перемещается по Сети и собирает информацию; · база данных, которая содержит всю информацию, собираемую пауками; · поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных. Поисковые механизмы в Интернете. Чтобы получить информацию или услугу в WWW, ее надо прежде всего разыскать. Поиск информации — непростая задача, ведь по состоянию на начало XXI в. ресурсы Web оцениваются более чем в 850 млн Web-страниц. Разумеется, рост Web-пространства в геометрической прогрессии не будет продолжаться вечно, когда-то наступит момент насыщения. Можно предположить, что темпы развития WWW замедлятся на рубеже 34 млрд Web-страниц. Одной из причин замедления, в частности, станет ограниченность поля IP-адресов. Впрочем, к этому времени, наверное, заработает Интернет-2, и все будет по-другому. Для поиска информации в Сети используются специальные поисковые службы. Обычно поисковая служба — это компания, имеющая свой сервер, на котором работает некая поисковая система. Услуги абсолютного большинства поисковых служб бесплатны, но тем не менее по темпам роста сегодня это самый эффективный бизнес в мире. Мощная поисковая система принимает в сутки 30...50 млн посетителей и демонстрирует им сотни миллионов рекламных баннеров. При том, что каждый щелчок пользователем на рекламном баннере оплачивается не менее чем одним центом, совокупный доход только от демонстрации рекламных баннеров может составлять до 100000 долл. в сутки. Это одна из причин огромной прибыльности ≪бесплатных≫ услуг. Для упрощения поиска можно воспользоваться каталогами. Существуют и специальные каталоги, например каталоги новых поступлений. В Сети поиск обеспечивают специальные поисковые службы. Умение пользоваться ими, собственно говоря, и составляет умение пользоваться Интернетом. Все поисковые системы WWW основаны на гиперссылках. Обращаясь к поисковой службе, мы формулируем запрос, в котором формально описываем то, что хотим найти. Проведя нужные операции, служба формирует Web-документ, состоящий из гиперссылок, ведущих к ресурсам WWW, соответствующим нашему запросу. Какой из гиперссылок мы воспользуется —дело наше. Результат поиска всегда един: клиент получает список рекомендованных гиперссылок, хотя принцип действия у разных поисковых служб может быть различным. Кто хоть раз обращался к поисковым серверам, знает, что в ответ на поставленный запрос они иной раз выдают данные о нескольких тысячах разделов, так или иначе связанных с интересующей тематикой. Неудивительно, что решение этой проблемы для миллионов пользователей Интернета стало одной из наиболее актуальных задач. На сегодняшний день существует два основных способа ≪ориентации≫ в Web-пространстве: во-первых, с помощью так называемых поисковых систем (Rambler, AltaVista, Yandex) и, во-вторых, по электронным каталогам (Weblist, Yahoo, DMOZ, MavicaNet). Последние отличаются от поисковых серверов тем, что ссылки на конкретные сведения в них составляют люди, а не компьютерные программы. Такой метод обработки информации значительно повышает точность поиска. Поисковые электронные каталоги-классификаторы. Классификаторы хранят упорядоченные списки ссылок на Web-узлы. Обычно каждой ссылке соответствует краткое описание. Списки упорядочены по тематическим размерам на поисковом сервере(рис. 14.3). Они похожи на предметные каталоги общественных библиотек. На начальной странице поискового каталога мы выбираем тему, которая нас интересует, затем в рамках темы выбираем категорию, потом подкатегорию, и так далее, пока не получим конкретный список Web-ресурсов, рекомендованных для просмотра. Основным недостатком и в то же время достоинством каталогов является ≪человеческий фактор≫. Данные, которые заносятся в каталог, проходят ≪ручную≫ обработку. Поисковые системы-указатели. В них пользователь формирует запрос с помощью ключевых слов, выражающих объект его поиска, а поисковая система выдает ему список ссылок на Web-страницы, содержащие данные ключевые слова. Основное отличие поисковых указателей от поисковых каталогов состоит в полной автоматизации всех этапов работы (рис. 14.4). Здесь отсутствует ≪человеческий фактор≫, и поэтому количество Web-страниц, ккоторым ведет поисковый указатель, намного больше.
|