Историчность, агрегируемость, прогнозируемость данных в многомерной СУБД
Многомерная модель появилась практически одновременно с реляционными БД, но реально работающих многомерных СУБД до настоящего времени было очень мало. С середины 90-хх годов интерес к этим системам стал приобретать массовый характер. Толчком к этому послужил выход в 1993 году программная статья Кодда, в которой он сформулировал 12 основных требований к системам OLAP (оперативная аналитическая проходка), важнейшие из которых связаны с возможностью концептуального представления и обработки многомерных данных. Многомерные системы позволяют оперативно обрабатывать информацию для проведения анализа и принятия решения. В развитии концепции информационных систем можно выделить 2 направления: 1) Системы оперативной транзакционной обработки OLTP 2) Системы аналитической обработки OLAP Реляционные СУБД предназначались для информационных систем оперативной обработки и были весьма эффективны в этой области. В системах аналитической обработки они себя показали недостаточно гибкими. Более эффективными здесь оказались многомерные СУБД. Многомерные СУБД являются узкоспециализированными СУБД предназначенными для интерактивной аналитической обработки информации. Можно выделить основные понятия в многомерных СУБД: агрегируемость, историчность и прогнозируемость. · Агрегируемость данных означает рассмотрение информации на различных уровнях ее обобщения. В этих системах степень детальности представления информации для пользователя зависит от уровня пользователя. · Историчность данных предполагает обеспечение высокого уровня статичности (неизменности) данных и их взаимосвязи, а так же обязательна привязка данных ко времени. Статичность данных позволяет использовать при обработке специализированные методы загрузки, хранения, индексации и выбора. Временная привязка данных необходима для частого использования запросов имеющих значение времени и даты в составе выбора. Необходимость упорядочивания данных по времени в процессе обработки и представления данных пользователю накладывает требования на механизмы хранения и доступа к данным. Так для уменьшения времени обработки необходимо, чтоб данные всегда были отсортированы в том порядке, в котором они наиболее часто используются. · Прогнозируемость подразумевает задание функций прогнозирования и применения этих функций к различным временным интервалам. Измерение и ячейка в многомерной модели данных. Многомерность модели данных означает не многомерность визуализации данных, а многомерное логическое представление информации при описании и в операциях манипулирования данными. По сравнению с реляционной моделью многомерная организация обладает более высокой наглядностью и информативностью. Реляционное представление:
Многомерное представление:
Если речь идет о многомерной модели с мерностью больше 2, то необязательно представлять визуальную информацию в виде многомерных объектов. Пользователю более удобно иметь дело с 2-мерными моделями данных. Данные в этом случае представляются в виде среза. Рассмотрим основные понятия многомерной модели – ячейка и измерение. Измерение – множество однотипных данных, образующих 1 из граней гиперкуба. Примеры наиболее часто используемых измерений, например для даты: дни, месяцы, годы. В многомерно й модели данных измерения играют роль индексов, служащих для идентификации конкретных значений гиперкуба. Ячейка или показатель – поле, значение которого однозначно определяется фиксированным набором измерений. В зависимости от того как формируются значения ячейки, обычно это может быть переменная, то есть значение изменяется и может загружаться из внешнего источника, либо сформированные каким-то образом программы.
|