Проектирование процесса загрузки и ведения информационной базы
Система загрузки и ведения информационной базы – это некоторый комплекс программной, методической и технической документации, с помощью которой пользователь может осуществить своевременную загрузку, хранение и обновление данных, обеспечивать их секретность, защиту от сбоев ЭВМ и своевременное восстановление утраченной информации.
Проектирование системы загрузки и ведения информационной базы ведется по следующим направлениям: · загрузка и актуализация данных; · обеспечение достоверности вводимых данных; · обеспечение защиты данных; · обеспечение надежности хранения данных.
Достоверность хранения данных в информационной базе подразумевает отсутствие ошибок, своевременность внесения изменений и непротиворечивость информации. Для обеспечения достоверности вводимых и хранимых данных необходимо выполнить следующие работы: · обеспечить контроль вводимой информации; · обеспечить защиту хранимых данных от несанкционированного доступа; · обеспечить одновременность обновления одних и тех же данных, находящихся в разных файлах.
В процессе создания (загрузки) и обновления информационной базы используются интерактивный и пакетный режимы. Интерактивный режим предполагает ввод или обновление отдельных записей файлов по мере необходимости. Процессы первоначального ввода данных и их последующей корректировки имеют небольшие технологические отличия, например, в первом случае заполняется пустая экранная формата, во втором случае сначала вызывается заполненная экранная форма, а затем корректируется. В том и другом случае выполняются одинаковые методы контроля. Пакетный режим предполагает предварительный сбор пакета документов или подготовку входного файла первичной информации, с которых осуществляется загрузка основного файла или его обновление. Пакетный режим обычно используется для создания файлов условно-постоянной информации, т.к. в этом случае производится одноразовый ввод большого объема данных, а также при обновлении этих файлов вследствие, как правило, массового характера таких обновлений. В других случаях пакетный режим используется редко, например, если требуется ведение централизованной базы данных из локальных источников при невозможности подключения этих источников к вычислительной сети.
Загрузка информационной базы – это совокупность операций по приему, контролю и регистрации поступившей информации, вводу информации в ЭВМ, контролю и исправлению ошибок и записи данных в информационный файл.
Содержание операций приема, контроля и регистрации поступившей информации зависит от типа носителя первичной информации. Если поступающая информация представлена на бумажном носителе, то во время ее выполнения осуществляется следующая совокупность действий: · контроль количества поступивших документов, полноты и качества их заполнения; · отбор правильно заполненных документов и их регистрация в регистрационном журнале; · отбраковка документов, не соответствующих требованиям, предъявляемым к документам; · формирование запроса на исправление документов с ошибками и отсылка их к источнику информации, т.е. в то подразделение, из которого они поступили. Если информация поступает на машинном носителе, то в этом случае проверяется качество записи на носитель, регистрируются имя файла, объем, источник и время поступления. При поступлении информации по каналам связи определяются источник поступления, время, количество поступивших записей.
Операция ввода информации в ЭВМ может осуществляться несколькими методами: · ручной ввод данных с бумажных документов с использованием макетов экранных форм; · автоматизированное чтение данных, содержащихся в документах на бумажных носителях, и загрузка их в информационную базу.
При вводе больших объемов информации в ЭВМ с клавиатуры оператором допускается значительное количество ошибок, которые необходимо выявить и устранить. При этом контроль вводимой информации может производиться с использованием следующих методов: · визуальный контроль на экране дисплея; · метод контрольных сумм, рассчитываемых по каждой строке документа или по всему документу до ввода в ЭВМ и после ввода, которые затем сверяются между собой; · метод верификации, при котором осуществляется сверка ранее введенных данных, записанных в файл, и данных первичных документов, вводимых оператором второй раз; · метод двойного массива, при котором файлы по первичным документам создаются двумя разными операторами и после ввода сверяются по контрольным числам, вычисляемым для каждого из них.
Проверенные и исправленные данные заносятся в файл информационной базы. Особое внимание при формировании информационной базы уделяется разработке программы синтаксического и семантического контроля загружаемой информации в информационную базу. Синтаксический контроль может осуществляться на уровне структуры файла, записи и отдельного поля. Контроль на уровне файла сводится к контролю типов записей, соподчиненности различных типов записей (заголовок, подзаголовок), количества экземпляров каждого типа записи. Контроль на уровне записи сводится к контролю числа полей, их последовательности и длины записи. Контроль на уровне поля включает в себя контроль типа и формата поля. Семантический контроль сводится к арифметическому и логическому контролю содержимого отдельных полей. Арифметический контроль осуществляется следующими методами: · контрольных сумм по документу; · контрольных сумм по отдельной записи; · контрольного числа по файлу; · балансовый контроль. Логический контроль применяется для реквизитов-признаков и оснований, и при его построении используют следующие виды контроля: · контроль на конкретное значение; · контроль на диапазон значений; · контроль путем сравнения с некоторой константой; · контроль зависимостей значений реквизитов; · контроль по списку значений (справочнику).
Для поддержания надежности хранимых данных при сбоях в работе ЭВМ и разрушениях информационной базы требуется система резервирования и восстановления. Обычно используется несколько методов хранения информации в информационной базе, которые позволяют в дальнейшем производить восстановление данных: · метод дублирования основных файлов и хранения нескольких их копий; · метод создания и хранения нескольких поколений каждого основного файла ИБ и файлов корректур к ним; · комбинированную систему нескольких поколений с дублированием последнего поколения и файлов корректур.
|