Студопедия — Индексные поисковые системы.
Студопедия Главная Случайная страница Обратная связь

Разделы: Автомобили Астрономия Биология География Дом и сад Другие языки Другое Информатика История Культура Литература Логика Математика Медицина Металлургия Механика Образование Охрана труда Педагогика Политика Право Психология Религия Риторика Социология Спорт Строительство Технология Туризм Физика Философия Финансы Химия Черчение Экология Экономика Электроника

Индексные поисковые системы.






Индексные поисковые системы (например, Google), в отличие от поисковых каталогов, обновляют информацию в автоматическом режиме, просматривая в Интернет содержимое серверов, индексируя информацию, содержащуюся в них и внося информацию о расположении слов на страницах сайтов в свои базы данных.

Поисковая система работает в следующем порядке:

  1. Сбор данных поисковым роботом пауком(Web crawling)
  2. Индексация найденных данных(Indexing)
  3. Поиск по индексированным данным(Searching)

Первая составляющая поисковой системы - это так называемый "паук", поисковый робот. Каковы его функции? Он странствует по всей Сети, просматривая интернет - страницы, посещая ссылки. Он заносит в индекс поисковой системы абсолютно все страницы, которые просмотрел. Заносит их в виде значащих слов, которые встречаются на странице.

Таким образом, получается, что индекс, вторая составляющая поисковой машины, представляет собой огромнейшую базу данных, при помощи которой есть возможность быстро узнать, на каких страницах в Сети встречается слово поиска. Информация для справки - весь объем индекса известной всем поисковой системы Yandex составляет более восьмидесяти гигабайт.

Третья составляющая после индекса - собственно сама поисковая машина. Ее назначение - поиск нужных слов или фраз в индексе. Она в соответствии с запросом пользователя «просматривает» индекс на предмет наличия нужной информации и возвращает ссылки на найденные документы.

Множество ссылок на выходе системы распределяется программой в порядке убывания от наибольшей степени соответствия ссылки запросу к наименьшей.

Запомните, что поисковая система не занимается поиском во всем интернете - это не так. Только представьте, что это действительно так: например, весь объем проиндексированной информации на Yandex составляет 269 гигабайт. И если бы не было индекса после ввода вашего запроса, системе бы пришлось загрузить и просмотреть 260 гигабайт информации. Это нереально. Только подумайте, сколько времени уйдет на обработку одного единственного запроса.

Следуя из того, что поиск осуществляется не во всей Сети, а по индексу, напрашиваются два вывода. Во-первых, если поисковая система не нашла какой-то информации, это вовсе не означает, что этой информации в Сети нет, ее нет в индексе конкретно этого поисковика. Во-вторых, системы поиска информации в сети отличаются друг от друга не только интерфейсом, но и, к примеру, индексом и методами его составления. Следовательно, если вы не нашли нужной вам информации в одной поисковой системе, необходимо поискать ее в другой.

Поисковый робот, который составляет индекс, обходит все сайты по кругу и очень регулярно - таким образом, индекс всегда правильно показывает изменения, которые произошли на сайте. Сайты, которые только появились "паук" может найти самостоятельно, попав на них по ссылке с других сайтов. Также авторы сайтов могут дать знать о своем сайте "пауку".

Последняя составляющая поисковой системы - ее World Wide Web-сервер, который является лицом системы. Это интерфейс, при помощи которого пользователи делают запросы и получают на них ответы. World Wide Web-сервер - это лишь одна из частей системы, причем не самая крупная.

Одной из наиболее полных и мощных поисковых систем является Google (www.google.ru), в базе данных которой хранятся более 12 миллиардов Web-страниц, и каждый месяц программы-роботы заносят в нее 5 миллионов новых страниц. В Рунете (российской части Интернета) обширные базы данных, содержащие примерно по 200 миллионов документов, имеют поисковые системы Яндекс (www.yandex.ru) и Rambler (www.rambler.ru).

ДЛЯ СОЗДАНИЯ ОТЧЕТА О РАБОТЕ НА РАБОЧЕМ СТОЛЕ СОЗДАЙТЕ ФАЙЛ ваша_фамилия.docx. РЕЗУЛЬТАТЫ ВЫПОЛНЕНИЯ ЗАДАНИЙ 2-7 ВНОСИТЕ В НЕГО. Выполнение каждого задания иллюстрируйте скриншотами.

Задание 2. Используя Яндекс каталог, найдите гороскоп своего знака Зодиака на текущий день.

Задание 3. Используя Яндекс помощь, найдите информацию о языке запросов Яндекса. Составьте запрос, который позволит вам найти произведение, из которого взята фраза «и он опять … притих». Цитата точная, на месте многоточия находится какое-то неизвестное слово.

Задание 4. Используя оператор поиска документов определенного типа из языка запросов Яндекса, найдите файл авансового отчета с расширением xls.

Задание 5. Поиск по картинкам. Используя поиск картинок Google, найдите название водоема, изображенного на картинке по ссылке. http://www.svastour.ru/upload/resize_cache/iblock/257/1200_700_182a6294a1dbd427487cf8a88fc4e74dd/0025.jpg

Задание 6. Используя расширенный поиск на Яндекс Маркете, подберите наиболее подходящий для вас смартфон, выберите магазин с наиболее низкой ценой на данную модель.

Задание 7. Конвертер величин. Используя встроенный в поисковую строку конвертер Google, переведите 57 фунтов в килограммы.

Задание 8. Найдите информацию и кратко опишите проблему поискового спама. Задание выполнять в тетради.

 

 







Дата добавления: 2015-08-27; просмотров: 2837. Нарушение авторских прав; Мы поможем в написании вашей работы!



Важнейшие способы обработки и анализа рядов динамики Не во всех случаях эмпирические данные рядов динамики позволяют определить тенденцию изменения явления во времени...

ТЕОРЕТИЧЕСКАЯ МЕХАНИКА Статика является частью теоретической механики, изучающей условия, при ко­торых тело находится под действием заданной системы сил...

Теория усилителей. Схема Основная масса современных аналоговых и аналого-цифровых электронных устройств выполняется на специализированных микросхемах...

Логические цифровые микросхемы Более сложные элементы цифровой схемотехники (триггеры, мультиплексоры, декодеры и т.д.) не имеют...

Внешняя политика России 1894- 1917 гг. Внешнюю политику Николая II и первый период его царствования определяли, по меньшей мере три важных фактора...

Оценка качества Анализ документации. Имеющийся рецепт, паспорт письменного контроля и номер лекарственной формы соответствуют друг другу. Ингредиенты совместимы, расчеты сделаны верно, паспорт письменного контроля выписан верно. Правильность упаковки и оформления....

БИОХИМИЯ ТКАНЕЙ ЗУБА В составе зуба выделяют минерализованные и неминерализованные ткани...

Хронометражно-табличная методика определения суточного расхода энергии студента Цель: познакомиться с хронометражно-табличным методом опреде­ления суточного расхода энергии...

ОЧАГОВЫЕ ТЕНИ В ЛЕГКОМ Очаговыми легочными инфильтратами проявляют себя различные по этиологии заболевания, в основе которых лежит бронхо-нодулярный процесс, который при рентгенологическом исследовании дает очагового характера тень, размерами не более 1 см в диаметре...

Примеры решения типовых задач. Пример 1.Степень диссоциации уксусной кислоты в 0,1 М растворе равна 1,32∙10-2   Пример 1.Степень диссоциации уксусной кислоты в 0,1 М растворе равна 1,32∙10-2. Найдите константу диссоциации кислоты и значение рК. Решение. Подставим данные задачи в уравнение закона разбавления К = a2См/(1 –a) =...

Studopedia.info - Студопедия - 2014-2024 год . (0.057 сек.) русская версия | украинская версия