Глобальная сеть Интернет и ее информационные сервисы (электронная почта, Всемирная паутина, файловые архивы и пр.) Поиск информации
Одной из наиболее полезных возможностей, предоставляемых современным компьютером, является возможность использования его для автоматизированного обмена информацией с другими компьютерами по линиям связи. Реализуется эта возможность с помощью компьютерных сетей — объединений компьютеров. Под компьютерной телекоммуникационной (вычислительной) сетью понимается программно-аппаратный комплекс, обеспечивающий автоматизированный обмен данными между компьютерами по линиям связи. Любые информационные ресурсы в том или ином виде можно передавать по сети. Современная сеть, состоящая из компьютеров (возможно специализированных), представляет собой некий комплекс узлов и каналов связи — аппаратуры и программ, обеспечивающих прием и передачу данных. Большая часть возможностей, обеспечиваемых современными телекоммуникационными сетями, опирается на то, что эти сети могут обмениваться данными между собой, создавая межсетевую среду. Самое крупное такое объединение общедоступных сетей — это межсетевая среда Интернет (Internet). Огромная распространенность сетей, их многофункциональность, в первую очередь, опираются на ряд принципов, соблюдение которых обеспечивает: открытость, т. е. возможность разработки различных сетевых приложений, в том числе не предусмотренных ранее; использование для обмена данными сетей на базе различных технологий, с самыми разними каналами связи; возможность подключения новых абонентов и новых сетей, а также расширения существующих без принципиальной перестройки; возможность обеспечения автоматического перепланирования схемы обмена (изменение маршрутизации) при возникновении технической необходимости (например, отказе канала связи); контроль обмена данными и минимизацию потерь в случае возникновения ошибок. Основным принципом, лежащим в основе современных телекоммуникационных сетей, является принцип пакетной коммутации. Этот принцип состоит в том, что для доставки данные разбиваются на независимые фрагменты (пакеты), каждый пакет снабжается служебной информацией и передается отдельно от других пакетов. Итоговое сообщение (последовательность пакетов) восстанавливается при необходимости к конечной точке. Основой конструирования и функционирования современных сетей являются их модели. Модель сети — это схема разделения функций между компонентами сети, определяющая основы их взаимодействия. В основе Интернета лежит сетевая модель DOD (Department of Defence, министерство обороны США). Эта модель подразумевает, что все функции делятся на четыре уровня — от непосредственных клиентских программ до средств обмена сигналами. За каждым уровнем закреплены определенные задачи, выполняя их, уровень обменивается данными только с выше- и нижележащими уровнями. С логической точки зрения каждый уровень одного узла посылает данные такому же уровню другого узла. За каждым уровнем закреплены следующие функции: За уровнем доступа к среде — функции приема и передачи сигналов, преобразования их в цифровую форму и/или перекодирование. Этот уровень характеризует каждую сетевую технологию, применяемую для создания отдельной сети. Именно здесь осуществляется фактические прием и передача сигнала.
За сетевым уровнем закреплены функции организации межсетевого взаимодействия, он связывает отдельные сети. Протоколы этого уровня определяют маршруты следования пакетов (т. е. выполняют операцию перенаправления пакетов из одной сети в другую) и обмениваются необходимой технической информацией о пересылке. Узлы, выполняющие пересылку, называются шлюзами; выполняющие обработку пакетов и маршрутизацию, — маршрутизаторами. У таких специализированных узлов могут не задействоваться другие уровни, кроме первых двух. За транспортным уровнем — задачи транспорта данных. Этот уровень связывает между собой программы, запущенные на конкретных узлах, т. е. позволяет определить, какая конкретно программа должна обработать полученный поток данных или обеспечить программе возможность отправки данных. Некоторые протоколы этого уровня позволяют также определять, получены ли отправленные данные. К прикладному уровню отнесены все программы, взаимодействующие с пользователем и формирующие поток данных для обмена. Основным набором протоколов, реализующих эту модель и обеспечивающим работу среды Интернет, является стек протоколов TCP/IP. Этот набор протоколов не предусматривает никаких стандартов на уровень доступа к среде, что позволяет использовать любые каналы передачи данных. Стек протоколов предусматривает механизм, позволяющий разрабатывать различные сетевые приложения и использовать для их работы существующую инфраструктуру без модернизации. На основе этого стека протоколов уже разработано большое количество программ, реализующих разнообразные сервисы (службы, программы для предоставления специализированных услуг). Большинство телекоммуникационных служб предполагают обмен данными между двумя основными типами программ: клиентом (программа, взаимодействующая с пользователем) и сервером (программа, обслуживающая запросы). Наиболее популярны следующие сетевые службы: Служба электронной почты. Этот сервис позволяет обмениваться сообщениями в асинхронном режиме, т. е. отправить сообщение можно даже если адресат не работает с сетью в момент отправки и получит его только через некоторое время. Основу инфраструктуры электронной почты составляют почтовые отделения — серверы, принимающие почту и обрабатывающие ее (либо пересылая, либо помещая в хранилище до обращения пользователя). Индивидуальный «раздел» пользователя в такой системе называется почтовым ящиком. Для обращения к содержимому своего почтового ящика или при отправке новой почты пользователь должен использовать специальную программу - клиент. Во многих случаях этот клиент реализован как web-приложение. Служба World Wide Web (Всемирная паутина). В этой службе информация представляется в виде отдельных объектов, связанных между собой. Структура такого рода называется гипертекстом. Для описания отдельных объектов и связей между ними применяется специальный язык разметки гипертекста — HTML. Основу функционирования этой службы составляют программы, выдающие объекты-страницы (и/или их составляющие) по запросу клиента (web-серверы), и программы, демонстрирующие полученные страницы (браузеры). Содержимое такой страницы может быть подготовлено заранее, а может быть создано WEB-сервером по запросу, с помощью специальных программ. Это позволяет применять эту службу как универсальное средство создания интерфейсов к большинству других служб, а также как средство создания специализированных приложений. В качестве примера таких приложений можно привести форумы (приложения, в которых посетители обмениваются мнениями по различным вопросам, оставляя в выделенных разделах, хранящихся в БД на серверах, свои комментарии), чаты (приложения, позволяющие организовать беседу в режиме реального времени, непосредственно передавая всем пользователям отправляемые каждым сообщения). Телеконференции и Интернет-телефония. Эти сервисы опираются на возможность передавать по сети потоки (т. е. не сообщения фиксированной длины, а некоторое количество данных за определенное время) аудио- и видеоинформации. С помощью телеконференций организуется обсуждение в режиме реального времени (это проще и эффективнее во многих случаях чатов и пр.), а с помощью Интернет-телефонии — передача звуковой информации телефонной сети между узлами Интернет в виде потока IP-пакетов. Такими узлами могут быть специальные телефонные станции или просто компьютеры. Передача такого потока обходится значительно дешевле междугородного канала связи. Служба WWW, выполняя роль универсального интерфейса к большей части современных сетевых служб, позволяет добиться сходства в представлении информации из самых разных источников. Тем не менее, поскольку сам язык подготовки страниц ориентирован на оформление текста (а не на отражение его логической структуры), и в каждом конкретном случае авторы отдельных наборов страниц сами принимают решение о том, что и как отображать на своих страницах, не уведомляя об этом никого, то возникает проблема поиска информации в среде Интернет. С ростом общего количества страниц и объема представленной в такой форме информации, эта проблема становится все острее. Для поиска нужной информации в среде Интернет применяют несколько способов: Применение классификации и каталогизации. В соответствии с этим подходом создаются специальные ресурсы-рубрикаторы, на которых аннотированные ссылки разносят по некоторым категориям. Поиск информации в этом случае осуществляется постепенным уточнением области до тех пор, пока набор страниц не будет сокращен до обозримого минимума. К сожалению, сам поисковый рубрикатор должен пополняться с помощью людей. В результате, в таких рубрикаторах просто не упомянуто подавляющее большинство страниц. Применение методов полнотекстового поиска и поиска по ключевым словам. В этом случае автоматизированными средствами готовится поисковый индекс — фактически, база данных, содержащая информацию о наполнении страниц. Пользователь, обращаясь к этому индексу, просит найти страницу, на которой содержатся определенные слова. Постепенно уточняя область поиска, снова получаем обозримый набор документов. Поисковый индекс формируется, в основном, автоматически, что резко увеличивает количество участвующей в поиске информации. К сожалению, это также увеличивает и количество «мусора», попадающего в результаты обработки запросов. Для борьбы с этим применяют систему ранжирования результатов на основе релевантности — некоторого вычисленного коэффициента «соответствия» найденной страницы запросу. Поиск информации в специализированных источниках. Если точно известна область поиска, то вполне возможно, что существуют специализированные хранилища информации, имеющие специально разработанные поисковые системы. Такая система позволит найти нужное существенно быстрее, чем использование поисковых систем общего назначения.
|