Сравнительный анализ хранилищ и витрин данных.
Хранилище данных – автоматизированная информационно-технологическая система организации, которая собирает данные из существующих баз и внешних источников, формирует, хранит и эксплуатирует информацию в виде наборов данных. Цель хранилища данных – подготовка данных к всестороннему анализу. В основе концепции ХД 2 идеи: 1) интеграция разъединенных детализированных данных; 2) разделение хранящихся данных по их назначению – для операционной обработки и для использования в задачах анализа. Свойства данных: 1) предметная ориентированность; 2) интегрируемость; 3) неизменяемость и целостность (возможны только операции чтения); 4) поддержка хронологии; 5) Единство представления и удобство использования форм. Требования к ХД: 1) высокая скорость загрузки; 2) обеспечение полной функциональной технологии загрузки (преобразование; фильтрация; переформатирование; проверка целостности; организация физического хранения; индексирование; обновление метаданных); 3) высокое качество ХД; 4) поддержка различных видов данных; 5) высокая скорость обработки запросов; 6) масштабируемость; 7) Широкие возможности администрирования. Преимущества: 1) Единый источник информации: компания получает выверенную единую информационную среду. Эта среда будет обладать единым интерфейсом, унифицированными структурами хранения, общими справочниками и другими корпоративными стандартами, что облегчает создание и поддержку аналитических систем. Также, при проектировании информационного хранилища данных особое внимание уделяют достоверности информации, которая попадает в хранилище. 2) Производительность - позволяют строить действительно быстрые системы запросов. 3) Быстрота разработки; 4) Интегрированность: интеграция данных из разных источников уже сделана, поэтому не надо каждый раз производить соединение данных для запросов, требующих информацию из нескольких источников. 5) Историчность и стабильность - нацелено на долговременное хранение информации в течение 10-15 лет. Стабильность означает, что фактическая информация в хранилище данных не обновляется и не удаляется, а только специальным образом адаптируется к изменениям бизнесс-атрибутов. 6) Независимость. Недостатки: 1)дорогостоящие в обслуживании; 2)если организация небольшая, то она может и не нуждаться в создании хранилища данных; 3)достаточно длительный период обучения персонала работе с ним; 4)слишком продолжительное время и слишком высокая стоимость подготовки данных. Витрина – тематическая БД, содержащая информацию по отдельному аспекту деятельности п/п. Витрина данных является частью хранилища данных, специфицированной для использования конкретным подразделением или определенной группой пользователей. Т.е. витрины данных содержат подмножество корпоративных данных и строятся для отделов или подразделений внутри организации. Витрины данных часто строятся силами самого отдела и охватывают конкретный аспект, интересующий сотрудников данного отдела. Преимущества: 1) простота, низкая стоимость; 2) Экономия технических ресурсов; 3) Более высокий уровень безопасности данных; 4) Высокая производительность. Недостатки: 1) дублирование данных; 2) Необходимость синхронизации данных; 3) Трудности расширения и объединения витрин; 4) Ограниченность данных.
|