ИХ позволяется обеспечить: 1)хранение разнородных данных из различных источников в течение больших периодов времени; 2)быстрый доступ к данным и поиск релевантной запросу информации. Причины появления ИХ: 1)осознание руководством предприятий того, что в данных содержатся скрытые закономерности (знания), характеризующие процесс управления в целом, способные повысить его эффективность; 2)снижение стоимости средств хранения информации, дающее возможность хранить данные, накопленные за длительные интервалы времени; 3)снижение стоимости элементной базы сложных архитектур; 4)переход от массового обслуживания к индивидуальному (учет разнообразных требований заказчика).
Концепция информационных хранилищ позволяет решить следующие проблемы: хранение разнородных данных из различных источников в течение больших периодов времени; быстрый доступ к данным и поиск релевантной запросу информации. Концепция информационных хранилищ подразумевает использование систем интеграции данных. Источники могут использовать различные модели данных и предоставлять различные интерфейсы для доступа к своим данным (реляционные, объектные или унаследованные СУБД). Данные источника могут быть неструктурированными (HTML файлы, текстовые файлы). Источники могут быть автономными. Решение задачи интеграции данных. ИХ: 1.Хранилища данных – данные из различных источников поступают в хранилище, все запросы к системе интеграции обрабатыаются с использованием этих данных. Хранилище данных – это АИС организации, которая собирает данные из существующих баз и внешних источников, формирует, хранит и эксплуатирует информацию в виде наборов данных. 2.Виртуальные хранилища – данные хранятся в источниках, а запросы к системе интеграции транслируются в запросы или операции, понятные источнику. Данные полученные в ответ на эти запросы к источниками, объединяются и предоставляются пользователю. Виртуальное хранилище данных — это система, предоставляющая интерфейсы и методы доступа к регистрирующей системе, которые эмулируют работу с данными в этой системе, как с хранилищем данных. Концепция хранилищ данных. Цель – подготовка данных к всестороннему анализу. В основе концепции лежат 2 идеи: 1.Интеграция ранее разъединенных детализированных данных в едином хранилище, их согласование и предварительная обработка; 2.Разделение хранящихся данных по их назначению – для операционной обработки и для использования в задачаханализа.
Процесс обработки данных в хранилище физически разделяется на 2 этапа: 1)Обработка транзакций в реальном времени (OLTP – Online Transaction Processing), в результате чего в БД накапливается первичная информация о функционировании предприятия; 2.Аналитическая обработка данных в реальном времени (OLAP – Online Analytical Processing).