Структурные компоненты хранилища данных
Кратко охарактеризуем основные компоненты технологий хранилищ данных на примере описания хранилища данных для предприятия (Рис. 4.7).
Оперативные данные могут собираться из различных источников:
иерархические и сетевые базы данных первого поколения, хранящие корпоративные данные;
реляционные базы данных, хранящие оперативные данные различных подразделений;
закрытые сервера; внешние системы (Интернет, базы данных поставщиков и т. д.).
Поступившие оперативные данные очищаются, интегрируются и складываются в реляционное хранилище. Такие данные доступны для анализа при помощи средств построения отчетов. Затем данные (полностью или частично) подготавливаются с использованием средств переноса и трансформации данных для OLAP-анализа, который реализуется применением средств доступа и анализа данных. Назначение систем класса OLAP (Online Analytical Processing - оперативная аналитическая обработка) — предоставить пользователям гибкий, интуитивно понятный и простой доступ к данным.
Источники оперативных данных
Входной поток
Средства переноса и трансформации
Хранилище
Реляционное хранилище
Метапоток
Рис. 4.7. Основные компоненты и потоки хранилища данных
Важнейшим элементом хранилища являются так называемые метаданные.
Метаданные описывают структуру,размещение,трансформацию данных,используемых любыми процессами хранилища.
Метаданные могут быть востребованы для различных целей,например:извлечения изагрузки данных; обслуживания хранилища и запросов.
Метаданные для различных процессов могут иметь различную структуру,т.е.для одного и того же элемента данных может существовать несколько вариантов метаданных.
|