Стратегии распределения данных
Определение и размещение фрагментов БД на узлах сети должно проводиться с учетом особенностей использования БД. Эмпирически установлено, что в большинстве БД 20% запросов создают 80% нагрузки на БД. Эти запросы и нужно анализировать для того, чтобы определить целесообразное разбиение БД на фрагменты и размещение этих фрагментов. При анализе БД с целью определения схемы размещения по узлам учитывают: 1) количественные показатели (в первую очередь, объем данных): они влияют на размещение данных. 2) качественные показатели: они определяют схему фрагментации. При этом, обычно, учитываются следующие параметры: · частота запуска приложений; · узел, на котором запускается приложение; · требования к производительности транзакций и приложений; · требования к времени реакции системы за запросы и т.д. Критерии, по которым производится определение и размещение фрагментов БД: 1) Локальность ссылок. 2) Повышение надежности и доступности (репликация). 3) Производительность (наличие "узких" мест или неэффективное использование ресурсов системы). 4) Баланс между ёмкостью и стоимостью внешней памяти. 5) Минимизация расходов на передачу данных. Стратегия распределения данных по узлам сети ЭВМ могут классифицироваться в зависимости от количества узлов, содержащих данные, и наличия дублирования информации, а также архитектурой системы и программным обеспечением СУБД. Рассмотрим четыре альтернативные стратегии распределения данных: 1. Централизация (единственная копия базы данных, расположенная в одном узле). Достоинства: Все операции под контролем центрального узла. Недостатки: Затраты на связь и временные задержки. Ограничения при параллельной обработке: · ограничения объема; · ограничения доступа к данным и надежности. 2. Сегментация (единственная копия БД, непересекающиеся подмножества распределены по различным узлам).
|