Семантические технологии Web
К семантическим технологиям Web относятся следующие[4]: – XML; – глобальная схема идентификации (URI); – стандартный синтаксис описания данных (RDF); – стандартные способы описания свойств данных (схема RDF, RDFS); – стандартные способы описания связей между объектами данных (онтология, определяемая с помощью онтологического языка Web (Web Ontology Language)). XML В начале февраля 1998 года международная организация World Wide Web Консорциум – W3C – рекомендовала спецификацию Extensible Markup Language 1.0, за которой закреплена аббревиатура XML. Эта спецификация является основой для построения грамматики языков разметки, и лишь условно сам XML можно назвать языком разметки. По своему замыслу технология XML должна обеспечить отделение информации от разметки, что позволяет производить обработку, поиск и представление информации на более высоком технологическом уровне. Спецификация XML используется как средство для построения грамматики других языков. В настоящее время создан ряд языков разметки, являющихся подмножествами XML, и, в частности, язык MathML. 1.4.2 Глобальная схема идентификации – URI [5] URI (Uniform Resource Identifier) – унифицированный (единообразный) идентификатор ресурса –предоставляет простой и расширяемый способ идентификации ресурсов. Расширяемость URI означает, что уже существуют несколько схем идентификации внутри URI, и ещё больше будет создано в будущем. Самые известные примеры URI – это URL и URN. URL – это URI, который помимо идентификации ресурса предоставляет ещё и информацию о местонахождении этого ресурса. А URN – это URI, который идентифицирует ресурс в определённом пространстве имён (и, соответственно, в определённом контексте). Например, urn:ISBN 0‑395‑36341‑1 – это URI, который указывает на ресурс (книгу) 0‑395‑36341‑1 в пространстве имён ISBN, но, в отличие от URL, URN не указывает на местонахождение этого ресурса. Структура URI: <схема>:<идентификатор-в-зависимости-от-схемы>; <схема> – схема обращения к ресурсу, например, http, mailto, urn, tel; <идентификатор-в-зависимости-от-схемы> – непосредственный идентификатор ресурса, вид которого зависит от выбранной схемы обращения к ресурсу. Универсальный указатель ресурсов (Uniform Resource Locator, URL) стал фундаментальным нововведением в интернете, поэтому принципы URI документально закреплялись так, чтобы обеспечить полную совместимость с URL. Отсюда появился и большой недостаток URI, пришедший как наследство от URL. В URI, как и в URL, можно использовать только ограниченный набор латинских символов и знаков препинания. 1.4.3 Стандартный синтаксис описания данных – RDF RDF – это спецификация, которая определяет модель представления мира и синтаксис для сериализации и обмена в рамках этой модели. RDF обеспечивает стандартный способ описания и работы практически с любыми web-ресурсами: от текстовых страниц и графиков до аудио-файлов и видео-клипов. Он предлагает синтаксические возможности для взаимодействия и формирует базовый слой для создания Semantic Web. Базовый строительный блок модели данных – утверждение, представляющее собой тройку: ресурс, именованное свойство и его значение. В терминологии RDF эти три части утверждения называются соответственно: субъект, предикат и объект(7). Ресурсом называют все, что описывается средствами RDF. Это может быть обыкновенная Web-страница или какая-то ее часть, например, отдельный элемент HTML или XML разметки, являющийся частью описываемого документа. Также ресурсом может быть целая коллекция страниц, такая как отдельно взятый web-сайт. И, наконец, в качестве ресурса может выступать нечто, не являющееся доступным непосредственно через Интернет, например, произвольный предмет из мира вещей. Одним словом, все, чему можно приписать некоторый URI может стать ресурсом и быть описано при помощи RDF. Консорциум W3C разработал XML-представление для RDF. 1.4.4 Стандартные способы описания свойств данных – схема RDF Схема RDF – это семантическое расширение RDF. Она обеспечивает механизмы описания связанных ресурсов, а также собственно этих связей. Система классов и свойств схемы RDF похожа на систему классов языков объектно-ориентированного программирования, таких, например, как Java, но отличается от многих других систем. Так, описательный язык словаря RDF определяет свойства в терминах того класса ресурсов, к которому эти свойства относятся. Другие системы же описывают класс в терминах свойств его элементов. RDF и схема RDF основаны на XML и схеме XML. Существование стандартов для описания данных (RDF) и их атрибутов (схема RDF) позволяет создавать пакеты легко доступных инструментов для чтения и использования данных из многочисленных источников. То, насколько глубоко различные приложения могут обмениваться данными и использовать их, называется синтаксическим взаимодействием (syntactic interoperability). Чем более стандартизированными и распространенными являются эти инструменты работы с данными, тем выше степень синтаксического взаимодействия и тем легче и привлекательнее становится использование подхода на основе Semantic Web по сравнению с точечными интеграционными решениями.
|