Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Средства поиска в Интернете




Сначала диктуй со слов "Поисковые механизмы в интернете..."

Правильный выбор инструмента поиска - ключевой момент поисковой стратегии. Если не помогает одна служба, можно попробовать другие. В табл. 1. дается краткий перечень существующих сегодня в Internet поисковых служб. В правой колонке перечислены названия служб, в левой - задачи, которые они позволяют решать.
Таблица 1.
Службы поиска в Internet Задача Рекомендуемый
инструмент
Поиск по тематическим разделам Excite, InfoSeek, Yahoo!

Поиск страниц пониженного спроса Yahoo!

Поиск максимального количества источников, удовлетворяющих заданному условию AltaVista, InfoSeek

Поиск по темам и ключевым словам Excite, InfoSeek

Поиск по образцу Excite

Поиск по именам собственным AltaVista, Excite, InfoSeek

Полный обзор Web AltaVista, InfoSeek

Просмотр отдельные серверов Excite, InfoSeek

Поиск по названиям и URL-адресам AltaVista, Yahoo!

Обзор UseNet AltaVista, Excite, InfoSeek
Параметры броузера можно изменить так, чтобы некоторая Web-страница отображалась всякий раз, когда происходит запуск Internet (стала начальной страницей по умолчанию). Сделав начальной Web-страницу какой-либо поисковой службы, вы получите немедленный доступ ко всему набору средств поиска, которыми располагает данная служба. Excite, InfoSeek и Yahoo! являются для этого лучшими кандидатами.
2.1. Тематические каталоги.
Наиболее популярным во всем мире признан тематический каталог Yahoo! (http://www.yahoo.com/). Он представляет собой огромную базу данных URL-адресов сайтов самой различной тематики. Yahoo! предлагает вам воспользоваться иерархическим деревом при поиске информации. То есть вы выбираете сначала общую тематику, удовлетворяющую вашему запросу информации, и далее конкретизируете, следуя подсказкам каталога. В конечно результате вы получаете список сайтов, содержащих информацию, соответствующую вашему запросу. На Yahoo! вы также можете пойти и по другому пути. Проанализируйте предполагаемое содержание запрашиваемой информации и выберите ключевые слова, которые обязательно встретятся в интересующих вас материалах или их заголовках. Набираете эти слова через пробел в строке ввода на главной странице Yahoo! и нажимаете Enter. Система попытается сама подобрать интересующую вас информацию

Если же вы ищите информацию заведомо русскоязычную, то имеет смысл использовать российские каталоги. Принцип работы с ними идентичен, тому который мы рассмотрели на примере с Yahoo!.

2.2. Роботы индексов или поисковые машины.
Поисковые машины устроены несколько иначе. По сути это сервер с огромной базой данных URL-адресов, который автоматически обращается к страницам WWW по всем этим адресам, изучает содержимое этих страниц, формирует и прописывает ключевые слова со страниц в свою базу данных (индексирует страницы). Более того, этот сервер обращается по всем встречаемым на страницах ссылками и переходя к новым страницам, проделывает с ними тоже самое. Так как почти любая страница WWW имеет множество ссылок на другие страницы, то при подобной работе поисковая машина в конечном результате теоретически может обойти все сайты в Интернет. Самая популярная поисковая машина AltaVista (http://www.altavista.com/) содержит 11 миллиардов слов, извлеченных из 30 миллионов WWW-страниц. Как пользоваться этим сервисом? Необходимо продумать строку запроса информации (не более чем 5 слов), как в случае с Yahoo! и также набрать ее в поле ввода. Над кнопкой Search (Поиск) находится ниспадающее меню с выбором языка. Перед нажатием Enter или кнопки Search необходимо выбрать язык представления информации. Кроме того, в запрос информации можно включать специальный символ *, расширяющий диапазон поиска. Скажем, что бы Altavista могла найти не только все вхождения слова "легкая", но слова "легкую", "легкой" и т. д., в запросе надо писать "легк**". То есть изменяющиеся буквы окончания заменяем на символ *.
Как и предыдущем случае, для поиска в русскоязычном Интернет Altavista не очень подходит

Наиболее развитый сервис поиска русскоязычной информации предоставляет сервер Яndex (http://www.yandex.ru/). В Яndex можно просто написать по-русски фразу, описывающую то, что вы хотите найти. Система самостоятельно проанализирует и обработает ваш запрос, а затем постарается найти все, что относится к заданной теме

Стоит вспомнить о еще одной популярной российской поисковой машине Rambler (http://www.rambler.ru/). У этого сервера еще более полная база данных адресов URL, чем у Яndex. Отличительной чертой Rambler является то, что этот сервер ведет статистику посещаемости ссылок из собственной базы данных. Вы всегда можете зайти в раздел "Рейтинг" на главной странице Rambler и увидеть содержимое тематического каталога, отсортированного по убыванию числа посещений сайтов и следовательно их популярности. Тем самым отсекаются явные аутсайдеры и вы не тратите на них свое время.

Поисковые машины и тематические каталоги сегодня имеют много общего. У каталогов присутствует возможность поиска информации по строке запроса с использованием логических операторов, а поисковые машины содержат свои собственные тематические каталоги. И тем не менее лучше всего эти поисковые сервисы проявляют себя в своей первоначальной категории.
2.3. Системы мета-поиска.
Читая обо всех перечисленных поисковых службах, по неволе задумаешься: "а если для поиска необходимой информации не достаточно одной поисковой службы, то неужели придется входить на все здесь перечисленные сервера и каждый раз повторять один и тот же запрос?!". Наиболее качественный результат как раз будет именно при таком подходе. Но можно, исходя из экономии времени и денег, воспользоваться системами мета-поиска. Наиболее популярная в мире система такого класса Search.com (http://www.search.com/), но если мы работаем преимущественно с русскоязычными документами, то можно использовать Savvy Search (http://guaraldi.cs.colostate.edu:2000/form?lang = russian). Это достаточно мощная система отсылающая ваш запрос на 13 крупнейших поисковых машин (в том числе и российских) и возвращающая вам их отчеты. Другая российская система мета поиска "Следопыт" (http://www.medialingua.ru/www/Wwwsearc.htm) работает только с пятью англоязычными поисковыми машинами и одной русскоязычной, но интересна тем, что переводит ваш русскоязычный запрос на английский язык для англоязычных поисковых машин.
Также существуют так называемые мультипоисковые страницы:
"Все в одном" (http://www.tpi.ac.ru/~mike/search/index.htm);
Search (http://www.informika.ru/windows/intern/poisk/main.html);
БКФ Поиск (http:/bforum.virtualave.net/index09.htm) и другие.
Эти сервера не умеют посылать запросы и получать отчеты от поисковых служб как системы мета-поиска. Мультипоисковые страницы загружают во множестве окон поисковые службы и передают им ваш запрос. К тому же такие системы работают не стабильно.
2.4. Системы поиска в конференциях Usenet.
Во всем мире считается самым лучшим сервисом для поиска информации в конференциях Usenet сервер DejaNews (http://www.dejanews.com/). Среди русскоязычных выделяется сервер RusNews (http://news.corvis.ru/), являющийся также новостным сервером, содержащим более 2000 новостных групп. Точно также как и в других поисковых службах мы набираем строку запроса, а сервер нам формирует список конференций, содержащих наши ключевые слова.

Новости разделены по иерархически организованным тематическим группам, и имя каждой группы состоит из имен подуровней иерархии, разделенных точками, причем более общий уровень пишется первым..
Существуют глобальные иерархии, как-то comp, и иерархии, локальные для какой-либо организации, страны или сети. Вообще говоря, набор групп, которые получает Ваш локальный сервер Usenet, определяется администратором этого сервера и наличием этих групп на других серверах, с которыми обменивается новостями Ваш сервер

2.5. Службы поиска людей.
У вас появилась возможность работать с электронной почтой, но вы не знаете адресов электронной почты партнеров вашей организации. Благодаря, так называемым, службам поиска людей в Интернет, указав ФИО вашего оппонента теоретически вы можете получить его адрес электронной почты и URL-адрес. Почему теоретически? Дело в том, что системы поиска людей, в основном берут информацию о электронных адресах из открытых источников, таких как конференции Usenet.

 


Поисковые системы обычно состоят из трех компонент:

· агент (паук или кроулер), который перемещается по Сети и собирает информацию;

· база данных, которая содержит всю информацию, собираемую пауками;

· поисковый механизм, который люди используют как интерфейс для взаимодействия с базой данных.

Поисковые механизмы в Интернете.Чтобы получить информацию или услугу в WWW, ее надо прежде всего разыскать. Поиск информации — непростая задача, ведь по состоянию на начало XXI в. ресурсы Web оцениваются более чем в 850 млн Web-страниц.

Разумеется, рост Web-пространства в геометрической прогрессии не будет продолжаться вечно, когда-то наступит момент насыщения. Можно предположить, что темпы развития WWW замедлятся на рубеже 34 млрд Web-страниц. Одной из причин замедления, в частности, станет ограниченность поля IP-адресов.

Впрочем, к этому времени, наверное, заработает Интернет-2, и все будет по-другому.

Для поиска информации в Сети используются специальные поисковые службы. Обычно поисковая служба — это компания, имеющая свой сервер, на котором работает некая поисковая система. Услуги абсолютного большинства поисковых служб бесплатны, но тем не менее по темпам роста сегодня это самый эффективный бизнес в мире.

Мощная поисковая система принимает в сутки 30...50 млн посетителей и демонстрирует им сотни миллионов рекламных баннеров. При том, что каждый щелчок пользователем на рекламном баннере оплачивается не менее чем одним центом, совокупный доход только от демонстрации рекламных баннеров может составлять до 100000 долл. в сутки. Это одна из причин огромной прибыльности ≪бесплатных≫ услуг.

Для упрощения поиска можно воспользоваться каталогами.

Существуют и специальные каталоги, например каталоги новых поступлений.

В Сети поиск обеспечивают специальные поисковые службы.

Умение пользоваться ими, собственно говоря, и составляет умение пользоваться Интернетом.

Все поисковые системы WWW основаны на гиперссылках. Обращаясь к поисковой службе, мы формулируем запрос, в котором формально описываем то, что хотим найти. Проведя нужные операции, служба формирует Web-документ, состоящий из гиперссылок, ведущих к ресурсам WWW, соответствующим нашему запросу. Какой из гиперссылок мы воспользуется —дело наше.

Результат поиска всегда един: клиент получает список рекомендованных гиперссылок, хотя принцип действия у разных поисковых служб может быть различным.

Кто хоть раз обращался к поисковым серверам, знает, что в ответ на поставленный запрос они иной раз выдают данные о нескольких тысячах разделов, так или иначе связанных с интересующей тематикой. Неудивительно, что решение этой проблемы для миллионов пользователей Интернета стало одной из наиболее актуальных задач.

На сегодняшний день существует два основных способа ≪ориентации≫ в Web-пространстве: во-первых, с помощью так называемых поисковых систем (Rambler, AltaVista, Yandex) и, во-вторых, по электронным каталогам (Weblist, Yahoo, DMOZ, MavicaNet). Последние отличаются от поисковых серверов тем, что ссылки

на конкретные сведения в них составляют люди, а не компьютерные программы. Такой метод обработки информации значительно повышает точность поиска.

Поисковые электронные каталоги-классификаторы.Классификаторы хранят упорядоченные списки ссылок на Web-узлы.

Обычно каждой ссылке соответствует краткое описание. Списки упорядочены по тематическим размерам на поисковом сервере(рис. 14.3).

Они похожи на предметные каталоги общественных библиотек.

На начальной странице поискового каталога мы выбираем тему, которая нас интересует, затем в рамках темы выбираем категорию, потом подкатегорию, и так далее, пока не получим конкретный список Web-ресурсов, рекомендованных для просмотра.

Основным недостатком и в то же время достоинством каталогов является ≪человеческий фактор≫. Данные, которые заносятся в каталог, проходят ≪ручную≫ обработку.

Поисковые системы-указатели.В них пользователь формирует запрос с помощью ключевых слов, выражающих объект его поиска, а поисковая система выдает ему список ссылок на Web-страницы, содержащие данные ключевые слова. Основное отличие поисковых указателей от поисковых каталогов состоит в полной автоматизации всех этапов работы (рис. 14.4). Здесь отсутствует ≪человеческий фактор≫, и поэтому количество Web-страниц, ккоторым ведет поисковый указатель, намного больше.


 







Дата добавления: 2015-06-12; просмотров: 636. Нарушение авторских прав; Мы поможем в написании вашей работы!


Рекомендуемые страницы:


Studopedia.info - Студопедия - 2014-2022 год . (0.003 сек.) русская версия | украинская версия