Лекция 2. Базы данных и СУБД. Информация и данные. Информационные отношения и взаимосвязи данных. База данных как информационная модель предметной области
Одним из условий успешного функционирования любого предприятия является наличие необходимой информации, которую необходимо обрабатывать. Именно эти требования привели к возникновению системы базы данных. Каждой цивилизации приходится иметь дело с обработкой информации. С развитием экономики и ростом численности населения возрастает и объем взаимосвязанных данных, необходимых для решения коммерческих и административных задач. Взаимосвязанные данные называют систему. Всякая система, призванная облегчить труд человека, кроме обычных форм знаний, требует создания очень сложной модели реального мира. Ядром информационной системы являются хранимые данные. На любом предприятии данные различных отделов, как правила, пересекаются. Например, для целей управления часто нужна информация по всему предприятию. Принятие решений по производственным вопросам невозможно без информации о товарах, о полученных заказах, о стратегии сбыта и т.д. Это означает, что описывающие конкурентную предметную область данные должны храниться в легко доступном виде. Сегодня мы можем встретить систему обработки данных старого типа, в которой служащий в ручную помещает данные в скоросшиватель, и рядом с ней – современную систему с применением самой быстродействующей ЭВМ, сложнейшего оборудования и программного обеспечения. Но обе они обязаны предоставлять достоверную информацию в определенное время, определенному лицу, в определенном месте и за определенную плату. Такая система может потребоваться банку, заводу, предприятию сферы обслуживания, университету, больнице, универмагу и многим другим потребителям. Базы данных [1] – совокупность связанных данных, правила, организации которых основаны на общих принципах описания, хранения и манипулирования данными. Для интеграции файлов базу данных и обеспечения различными пользователями различных представлений отданных, необходима система. Программное обеспечение, аппаратные средства, программируемая логика и процедуры, осуществляющие управление базой данных, образуют систему управления базы данных. СУБД создает возможность доступа к интегрированным данным, которые пересекают операционные, функциональные и организационные границы в предметной области. Система управления БД – это специальный пакет программ, посредством которого реализуется централизованное управление базой данных, и обеспечивают доступ к данным. Банк данных (БнД) – это система специальным образом организованных данных – база данных, программных, технических, языковых, организационно-методических средств, предназначенных для обеспечения централизованного накопления и коллективного многоцелевого использования данных. База данных (БД) – именованная совокупность данных, отражающая состояние объектов и их отношений в рассматриваемой предметной области. Система управления базами данных (СУБД) – совокупность языковых и программных средств, предназначенных для создания, ведения и совместного использования БД многими пользователями. Словарь данных представляет собой подсистему БнД предназначенную для централизованного хранения информации о структурах данных, взаимосвязях файлов БД, типах данных и форматах их представления, принадлежности данных пользователям, кодах защиты и разграничения доступа и т.п. Под базой данных (БД) понимают хранилище структурированных данных, при этом данные должны быть непротиворечивы, минимально избыточны и целостны. Что понимается под непротиворечивостью, минимальной избыточностью и целостью информации в БД будет рассмотрено ниже. Обычно БД создаются для хранения и доступа к данным, содержащим сведения о некоторой предметной области, то есть реального мира. Всякая БД должна представлять собой систему данных о предметной области. БД, относящиеся к одной и той же предметной области, в различных случаях содержат более или менее детализированную информацию о ней. Степень детализации определяется рядом факторов, прежде всего целью использования информации из базы данных и сложностью производственных (деловых) процессов, существующих в пределах предметной области в конкретных условиях. При рассмотрении требований конечных пользователь необходимо принимать во внимание следующее: § БД должна удовлетворять актуальным информационным потребностям. § БД должна удовлетворять актуальным требованиям за приемлемое время, т.е. заданным требованиям производительности. § БД должна удовлетворять выявленным и вновь возникающим требованиям конечных пользователей. § БД должна легко расширять при реорганизации и расширении предметной области. § БД должна легко изменяться при изменении программной и аппаратной среды. § Загруженные в БД корректные данные должны оставаться корректными. § Данные до включения в БД должны проверяться на достоверность. Доступ к данным, размещаемым в БД, должны иметь только лица с соответствующими полномочиями Рассмотрим в качестве предметной области отпуск товаров со склада. Пусть существуют две изолированные друг от друга организации, испытывающие потребности в автоматизации своих производственных (деловых) процессов. Организация А характеризуется не высоким ассортиментом хранимых и отпускаемых товаров. Ассортимент отличается стабильностью. Состав реальных покупателей товаров исчисляются несколькими лицами (только юридическими). Предоплаты за еще не отпущенный товар не допускается, отпуск товара в кредит не практикуется, система скидок отсутствует. Оплата производится в тенге. Отпуск товаров осуществляется с одного склада. Потребности в автоматизации учета отпуска товаров определяются двумя целями: - быстрый выдачей информации о текучих остатках на складе; - ежемесячной выдачей отчета об общих суммарных отпусках товара. Организация Б характеризуется множеством территориально распределенных складов, в том числе в различных государствах ближнего зарубежья. Ассортимент отпускаемых товаров высок и быстро изменчив в силу изменчивости спроса. Состав покупателей крайне разнообразен, в число покупателей входят как физические, так и юридические лица. Практикуется система скидок постоянным покупателям, и покупателям, приобретающим товар свыше определенного количество и (или) суммы. Развита система предоплат, отпуска товаров в кредит. Оплата производится в местной валюте по текущему курсу доллара, реже - в тенге. Потребности в автоматизации учета отпуска товаров определяются широким диапазоном целей: - быстрым получением информации о текущих остатках товара, в том числе: - на конкретном складе; - по регионам; - по всей организации. - получением отчета об общих суммарных отпусках товара за любой временной интервал в любой валюте, в том числе: - по всей организации; - по конкретному региону, где расположены склады; - по конкретному складу; - по конкретному покупателю: - отдельно для физических и юридических лиц; - по группам покупателей, объединенным по одному признаку, например, территориальному; - зачетом предоплаты и задолженностей отдельных покупателей - автоматическим переводом покупателей в льготные категории, имеющим право на тот или иной вид скидки - прогнозированием с определенным уровнем вероятности будущего спроса (по покупателю, товару, региону) и т.д. Ввиду различия целей внедрения БД и содержания деловых процессов в организациях А и Б, созданные в этих организациях более других будут существенно отличаться друг от друга - прежде всего детализацией хранимой информации, и следовательно, структурой данных. Если для организации А в БД достаточно хранить сведения о приходе и расходе товаров и о ценах на них, то в БД организации Б необходимо хранить десятки таблиц и в процессе работы тратить дополнительные усилия (реализуемые как вручную, так и автоматически) для того, чтобы поддерживать их в согласованном состоянии. Логическое проектирование заключается в определении числа и структуры таблиц, формировании запросов к БД, определением типов отчетных документов, разработке алгоритмов обработки информации, создании форм ввода и редактирования данных в базе и решении ряда других задач. При проектировании структуры новой БД определяют сущности (объекты, явления) предметной области, которые должны найти свое отражение в базе данных. Анализ предметной области обычно осуществляется: - на основании существующих сведений о предметной области в широком и узком смысле, т.е. в масштабах, в которых она должна быть представлена в создаваемой базе и работающих с ней приложениях; - исходя из целей проектирования БД; - на основании представления о том, какое место БД и работающие с ней приложения займут в структуре эксплуатирующей ее организации; - на основании представления о том, какие изменения деловых потоков организации последуют после внедрения проектируемой системы в эксплуатацию. Таким образом, при анализе предметной области наиболее важной является структуризация данных. При проектировании структур данных (моделей данных) для автоматизированных систем можно выделить три основных подхода: Сбор информации об объектах решаемой задачи в рамках одной таблицы (одного отношения) и последующая декомпозиция ее на несколько взаимосвязанных таблиц на основе процедуры нормализации отношений. Сиситема управления базами данных обладает следующими возможностями: 1) позволяет определять базу данных, что обычно осуществляется с помощью языка определения данных (DDL – Data Definition Language). Язык DDL предоставляет пользователям средства указания типа данных и их структуры, а также средства задания ограничений для информации, хранимой в базе данных; 2) позволяет вставлять, обновлять, удалять и извлекать информацию из базы данных, что обычно осуществляется с помощью языка управления данными (DML – Data Manipulation Language). Наличие централизованного хранилища всех данных и их описаний позволяет использовать язык DML как общий инструмент организации запросов, который иногда называютязыком запросов (query language). Наличие языка запросов позволяет устранить присущие файловым системам ограничения, при которых пользователям приходится иметь дело только с фиксированным набором запросов или постоянно возрастающим количеством программ, что порождает другие, более сложные проблемы управления программным обеспечением. Существует две разновидности языков DML –процедурные (procedural) и непроцедурные (non-procedural) языки, – которые отличаются между собой способом извлечения данных. Основное отличие между ними заключается в том, что процедурные языки обычно обрабатывают информацию в базе данных последовательно, запись за записью, а непроцедурные оперируют сразу целыми наборами записей. Поэтому с помощью процедурных языков DML обычно указывается, как можно получить желаемый результат, тогда как непроцедурные языки DML используются для описания того, что следует получить. Наиболее распространенным типом непроцедурного языка является язык структурированных запросов (Structured Query Language – SQL), который в настоящее время определяется специальным стандартом и фактически является обязательным языком для любых реляционных СУБД 3 ) предоставляет контролируемый доступ к базе данных с помощью перечисленных ниже средств: • системы обеспечения безопасности, предотвращающей несанкционированный доступ к базе данных со стороны пользователей; • системы поддержки целостности данных, обеспечивающей непротиворечивое состояние хранимых данных; • системы управления параллельной работой приложений, контролирующей процессы их совместного доступа к базе данных; • системы восстановления, позволяющей восстановить базу данных до предыдущего непротиворечивого состояния, нарушенного в результате сбоя аппаратного или программного обеспечения; • доступного пользователям каталога, содержащего описание хранимой в базе данных информации. На рис. 11 показан пример применения базы данных: физическая структура и способ хранения данных в этом случае контролируются с помощью СУБД.
Рис 11. Применение базы данных СУБД обладают как многообещающими потенциальными преимуществами, так и недостатками.
|