КЛАССИФИКАЦИЯ И КОДИРОВАНИЕ
Рассмотрим системы классификаций и кодирований, применяемых для обозначения объектов в БД вместо их полных названий. 1. Если классификация вообще не требуется, то производится нумерация и кодом каждого объекта служит его порядковый номер N. Такая система кодирования – порядковая. 2. Если все множество объектов классифицировано по одному признаку, то коды целесообразно разделить на несколько частей (серий) по количеству значений этого признака и в пределах каждой пользоваться последовательными номерами. Когда используется несколько классификационных признаков и их взаимная подчиненность соответствует определению классов объектов, далее подклассов внутри каждого класса и т.д., то удобно использовать разрядную систему кодирования. Пример. Рассмотрим различные системы кодирования значений атрибута с именем Код студента, Порядковый номер студента. 3 формы обучения: заочная, дневная и вечерняя. Предположим, что необходимо их различать с использованием серийной системы кодирования. 1 -1000 1001 – 2000 2001 – 3000 Можно ввести признак – вид обучения, выбрать первый разряд кода и номер обучения 1-1000. Можно ввести еще 1 признак – курс обучения. В разрядном коде можно учесть больше признаков: код 1) отделения; 2) факультета; 3) курса; 4) группы; 5) порядковый номер студента в группе. · При увеличении числа различимых признаков в коде увеличивается и длина значения атрибута с именем, код студента. Разрядная система кодирования применяется для кодирования объектов, определяемых несколькими соподчиненными признаками. Кодируемые объекты систематизируются по классификационным признакам для каждой ступени классификации. Каждому признаку классификации отводится определенное число разрядов, в пределах которых кодирование начинается с 1, с младшего признака кодирования. Если значения нескольких атрибутов определены на одном домене, то они наз. ролевыми атрибутами. На домене с именем ФИО могут быть определены атрибуты с именами Студент, Преподаватель, Сотрудник. Атрибуты с именами Фамилия рабочего и Табельный номер – не ролевые, хотя и описывают одних и тех же людей. Домен значений, как правило не храниться в БД как самостоятельный информационный объект, однако среди ролевых атрибутов домена в БД безусловно существует атрибут с наиболее полным перечнем знании, именно его необходимо использовать для контроля достоверности любой вводимой информации. Пример. На предприятии наиболее полный список сотрудников должен храниться в БД отдела кадров. СЕИ наз. набор из атрибутов и возможно др. СЕИ. Определение СЕИ построено рекурсивно, но противоречия здесь нет, поскольку «др. СЕИ» в конце концов будут состоять только из атрибутов в виду конечности сообщений. Множество атрибутов объединяются в одну СЕИ по след. признакам: 1) соответствующие атрибуты описывают один и тот же факт или экономический объект; 2) значения атрибутов, входящих в СЕИ возникают одновременно и связаны логически или арифметическими соотношениями. Простейшие характеристики СЕИ: - имя; - структура; - значение. Имя СЕИ – условное обозначение в процессе обработки; - вхождение одних СЕИ в другие. Аппарат СЕИ рассчитан на описание структуры экономических документов. Документ – материальный носитель информации, содержащий в установленном порядке сообщения, имеющие юридическую силу. Существует много способов описания структуры СЕИ для описания независимых от конкретных языков программирования и СУБД. Достаточно указать после имени СЕИ список имен, входящих в нее атрибутов и др. СЕИ. Такой список помещают в «()», перечисляя имена внутри через запятую, т.е. имя СЕИ сопровождается размерностью, т.е. указанием на количество одинаковых по структуре СЕИ. Размерность указывается в скобках после имени. Пример. Документ «Приходный ордер» с сокращенным составом АТР.
ПОСТ – код поставщика ННМ – номенклатурный номер материалов Кво-док – количество материалов, принятое по товарно-транспортной накладной Кво-пр – количество материалов, принятых на склад Сумма – Кво-пр * Цена Прих (2). (Дата, Пост, Склад, Табл (ННМ, Кво-док, Квл-пр, Цена, Сумма) Определение значения составной единицы информации можно дать, опираясь на значение единицы информации, входящей в структуру рассматриваемой единицы информации. При этом значения атрибутов, входящих в составную единицу информации, определяются непосредственно. Значение составной же единицы информации (СЕИ), входящую в другую составную единицу информации можно определять рекурсивно. Однако, для множества значений таких составных единиц информации, входящих в другие, необходимо дать самостоятельное понятие. Собранием составных единиц информации наз. множество значений составной единицы информации более высокого уровня. Значением составной единицы информации наз. набор значений непосредственно входящих в нее атрибутов и набор собраний, непосредственно входящих в нее составных единиц информации. В рассматриваемом примере, одно значение СЕИ приходного ордера содержит по одному значению атрибутов (Дата, Пост, Склад и собрание СЕИ Табл.) Собрание ТАБЛ включает в себя несколько значений атрибутов ННМ, Кво-док, Кво-пр, Цена, Схема. Одно значение СЕИ при хранении в ЭВМ и памяти часто наз. записью. Отметим, что все языки программирования содержат средства описания структуры СЕИ. С СЕИ можно выполнять определенные действия: 1) переименование единицы информации (присвоение нового имени, объявление синонима – установление второго, третьего и т.д. равноценного имени для единицы информации); 2) операция над значением атрибута всего одна – перекодирование (замена существующего кода значений на новый для всех значений); 3) выборка – выделение подмножества значений СЕИ, которые удовлетворяют заранее поставленным условиям выборки; 4) корректировка – выполнение одной из операций: а) добавление нового значения СЕИ; б) исключение существующего значения; в) замена некоторого значения СЕИ на новое значение; 5) декомпозиция – преобразование исходной СЕИ в несколько единиц информации с различными структурами. Декомпозиция приходного ордера может привести, например, к двум следующим СЕИ: Цены (ННМ, Цена) Приход (Дата, Пост, Склад, ННМ, Кво-док, Кво-пр, Цена, Сумма) Декомпозиция, как и др. операции, одновременно производит преобразование всего множества значений. 6) композиция – преобразование нескольких единиц информации с различными структурами в одну СЕИ. Декомпозиция и композиция – взаимообратные операции. 7) Нормализация – операция перехода от СЕИ с произвольной структурой к единице информации с 2-х уровневой структурой. Так нормализация приходного ордера приводит к следующему результату:
8) свертка – операция преобразования СЕИ с двухуровневой структурой в СЕИ с произвольно многоуровневой структурой. Так свертка нормализированного приходного ордера может быть произведена в исходную структуру, а так же в другие документы, имеющие экономический смысл (карточку складского учета).
КАРТОЧКА СКЛАДСКОГО УЧЕТА
|