Виртуальные хранилища.
Хранилище данных – автоматизированная информационно-технологическая система организации, которая собирает данные из существующих баз и внешних источников, формирует, хранит и эксплуатирует информацию в виде наборов данных. При использовании виртуальных хранилищ данные хранятся в удаленных источниках, а запросы транслируются через систему интеграции. ВХ рассматриваются на логическом и физическом уровнях. Логический уровень ВХ определяется выбором модели данных и языка запросов для этой модели. Модель используется для представления данных, извлекаемых из всех источников. Модель данных должна обеспечить прозрачность доступа к внешним источникам. Пользователь получает возможность унифицированного доступа ко всем интегрируемым данным, т.е. видит внешние данные как локальные в выбранной модели и не заботится об управлении доступом к источнику На физическом уровне ВХ действует следующая схема обработки данных:
На этом уровне архитектура ВХ основана на концепции посредников. Простейший вид посредника – обертка - используется для хранения информации о внешнем источнике и организации к нему доступа, а посредник осуществляет интеграцию данных из различных источников. Существует 3 уровня знаний, извлекаемых из данных: 1) поверхностный, аналитическим инструментом которого является язык простых запросов, 2) неглубокий, инструмент - оперативная аналитическая обработка; 3) скрытый, инструмент- Data Mining («раскопка данных»).
|