Гайдамакин Н. А. 2 страница
Занесение данных в информационную систему заключается в добавлении новых сведений и, при необходимости, их отождествлении, слиянии и установлении взаимосвязи новых данных с ранее накопленными. Принципиальное значение при этом имеет вопрос идентификации новых данных с возможно уже имеющимися в системе. Важным моментом при занесении новой информации является также установление ее логической взаимосвязи с ранее введенными данными. В некоторых видах АИС (информационно-поисковые) такая задача является одной из основных, так как позволяет искать и устанавливать не всегда очевидные связи между информационными объектами и категориями сведений информационной системы. Комплектование информацией в таких случаях неотделимо от обработки и выдачи информации. В информационных службах, обеспечивающих создание и эксплуатацию информационных систем, сбор и комплектование информации осуществляют работники группы отбора («отборщики», «индексаторы»), квалификация которых помимо информационной должна включать также знание конкретной предметной области информационных систем. Поиск и выдача данных включают установление специального организационно-технологического порядка удовлетворения информационных потребностей абонентов информационной системы в управленческой деятельности и технологических процессах. Удовлетворение информационных потребностей осуществляется через периодический плановый поиск и выдачу сведений, оповещение и обработку запросов, выполняемую организационными структурами (СлДОУ, информационная служба), организующими и эксплуатирующими информационную систему. Периодический плановый поиск и выдача сведений осуществляются в целях обеспечения процессов организации, планирования и осуществления конкретного вида деятельности, т. е. в основном для информационного обеспечения организационно-управленческой деятельности. Данного рода задачи включаются в функции и обязанности информационных, информационно-аналитических и других информационно-обеспечивающих служб и заключаются, как правило, в формировании и выдаче статистических и сводных данных по периодически повторяющимся ситуациям в управленческой и производственной сфере. Оповещение и обработка запросов представляют собой формы информационного обслуживания управленческих и производственно-технологических структур. Оповещение может осуществляться в форме инициативно-сигнального оповещения, объектового и планово-периодического оповещения. Объектовое оповещение обычно осуществляется через выдачу абонентам информационной системы любых новых данных по определенному объекту, тематике, событию и т. п., появляющихся в АИС из любых источников. Планово-периодическое оповещение производится через выдачу абонентам всех новых данных, поступивших к определенному плановому сроку из всех источников в информационную систему по определенному объекту, тематике, событию, проблеме. Обработка запросов и выдача по ним сведений является одной из основных функций информационных служб. Данная деятельность регламентируется по вопросам инициирования, санкционирования и формы подачи запросов, форм и способов выдачи информации по запросам, учета запросов и т. д. Поддержание целостности и сохранности информации, пересмотр, ревизия и отсеивание утратившей актуальность информации являются неотъемлемой функцией информационных подразделений, создающих и поддерживающих информационные системы. Данные задачи решаются категорией работников, называемых администраторами АИС. Администраторы обеспечивают создание и поддержание банков данных АИС, организацию разграничения доступа к ним, защиту информации от несанкционированного доступа (НСД), ее резервирование и восстановление при разрушении или утрате ее целостности вследствие преднамеренных и непреднамеренных воздействий или ситуаций. Подобного рода задачи требуют высокой квалификации персонала и выполняются наиболее подготовленными информационными работниками. Периодическая ревизия информации в банках данных АИС призвана проверить целостность (не нарушены ли внутренние взаимосвязи информационных объектов) и сохранность данных, а также удалить из АИС информацию, потерявшую свою актуальность. Удаление информации из АИС, как и ее занесение в АИС, регламентируется специальными нормативно-инструктивными документами. 1.2. Структура и классификация информационных систем В составе информационной системы можно выделить три подсистемы, представленные на рис. 1.2. Рис. 1.2. Состав и функциональные группы информационной системы Организационно-технологическая подсистема сбора информации обеспечивает отбор и накопление данных в информационную систему и включает совокупность источников информации, организационно-технологические цепочки отбора информации для накопления в системе. Без правильно организованной, оперативно и эффективно действующей организационно-технологической подсистемы сбора информации невозможна эффективная организация функционирования всей информационной системы в целом. Подсистема представления и обработки информации составляет ядро информационной системы и является отражением представления разработчиками и абонентами системы структуры и картины предметной области, сведения о которой должна отражать информационная система. Подсистема представления и обработки информации является одним из наиболее сложных компонентов при разработке информационной системы. Нормативно-функциональная подсистема выдачи информации определяет пользователей, или иначе абонентов, системы, реализует целевой аспект назначения и выполнения задач информационной системы. Информационным ядром (информационным фондом) подсистемы представления и обработки информации АИС, или, говоря иначе, внутренним носителем знаний о предметной области является база данных (БД). Понятие базы данных является центральным в сфере технологий автоматизированных информационных систем. В справочной литературе по информатике приводится следующее определение базы данных — «совокупность данных, организованных по определенным правилам, предусматривающим общие принципы описания, хранения и манипулирования данными, независимая от прикладных программ».* Нормативно-правовая трактовка понятия базы данных представлена в законе «О правовой охране программ для ЭВМ и баз данных», согласно которому «база данных — это объективная форма представления и организации совокупности данных (например, статей, расчетов), систематизированных таким образом, чтобы эти данные могли быть найдены и обработаны с помощью ЭВМ». * Толковый словарь по информатике.—М.: Финансы и статистика, 1991.
Другим фундаментальным понятием, непосредственно связанным с АИС, является система управления базами данных (СУБД), которая по ГОСТу определяется как «совокупность программ и языковых средств, предназначенных для управления данными в базе данных, ведения базы данных и обеспечения взаимодействия ее с прикладными программами». В настоящее время развитие СУБД как специального вида программного обеспечения для создания и эксплуатации АИС приводит к более широким санкциям СУБД. Ввиду этого в расширенном толковании СУБД можно определить как комплекс программных средств, реализующих создание баз данных, их поддержание в актуальном состоянии, а также обеспечивающих различным категориям пользователей возможность получать из БД необходимую информацию. Совокупность конкретной базы данных, СУБД, прикладных компонентов АИС (набор входных и выходных форм, типовых запросов для решения информационно-технологических задач в конкретной предметной области), а также комплекса технических средств, на которых они реализованы, образуют банк данных (БнД), или иначе автоматизированный банк данных (АБД). Таким образом, соотношение понятий БнД, СУБД и БД можно проиллюстрировать схемой, приведенной на рис. 1.3. По характеру представления и логической организации хранимой информации АИС разделяются на фактографические, документальные и геоинформационные. Фактографические АИС накапливают и хранят данные в виде множества экземпляров одного или нескольких типов структурных элементов (информационных объектов). Каждый из таких экземпляров структурных элементов или некоторая их совокупность отражают сведения по какому-либо факту, событию и т. д., отделенному (вычлененному) от всех прочих сведений и фактов.* Структура каждого типа информационного объекта состоит из конечного набора реквизитов, отражающих основные аспекты и характеристики сведений для объектов данной предметной области. К примеру, фактографическая АИС, накапливающая сведения по лицам, каждому конкретному лицу в базе данных ставит в соответствие запись, состоящую из определенного набора таких реквизитов, как фамилия, имя, отчество, год рождения, место работы, образование и т. д. Комплектование информационной базы в фактографических АИС включает, как правило, обязательный процесс структуризации входной информации из документального источника. Структуризация при этом осуществляется через определение (выделение, вычленение) экземпляров информационных объектов определенного типа, информация о которых имеется в документе, и заполнение их реквизитов. * Отсюда и название—«фактографические системы». Рис. 1.3. Соотношение понятий БнД, СУ БД и БД В документальных АИС единичным элементом информации является нерасчлененный на более мелкие элементы документ и информация при вводе (входной документ), как правило, не структурируется, или структурируется в ограниченном виде. Для вводимого документа могут устанавливаться некоторые формализованные позиции — дата изготовления, исполнитель, тематика и т. д. Некоторые виды документальных АИС обеспечивают установление логической взаимосвязи вводимых документов — соподчиненность по смысловому содержанию, взаимные отсылки по каким-либо критериям и т. п. Определение и установление такой взаимосвязи представляет собой сложную многокритериальную и многоаспектную аналитическую задачу, которая не может в полной мере быть формализована. В геоинформационных АИС данные организованы в виде отдельных информационных объектов (с определенным набором реквизитов), привязанных к общей электронной топографической основе (электронной карте). Геоинформационные системы применяются для информационного обеспечения в тех предметных областях, структура информационных объектов и процессов в которых имеет пространственно-географический компонент, например маршруты транспорта, коммунальное хозяйство и т. п. Разработка и проектирование информационной системы начинаются с построения концептуальной модели ее использования. Концептуальная модель использования информационной системы определяет, прежде всего, круг конкретных задет и функций, обеспечиваемых созданием и эксплуатацией информационной системы, а также систему сбора, накопления и выдачи информации. Поэтому другим критерием классификации АИС являются функции и решаемые задачи, основными из которых могут являться: • справочные; • поисковые; • расчетные; • технологические. Справочные функции являются наиболее распространенным типом функций информационных систем и заключаются в предоставлении абонентам системы возможностей получения установочных данных на определенные классы объектов (Лица, Организации, Телефоны, Адреса и т. п.) с жестко или произвольно заданным набором сведений. Видами информационных систем, реализующих чисто справочные функции, являются всевозможные электронные справочники, картотеки, программные или аппаратные «электронные записные книжки» и их более развитые аналоги в виде т.н. персональных информационных систем. Системы, реализующие поисковые функции, являются наиболее широко распространенным классом информационных систем, которые чаще всего называют информационно-поисковыми системами (ИПС). ИПС в общем виде можно рассматривать как некое информационное пространство, задаваемое в терминах информационно-логического описания предметной области — «информационные объекты», «информационные связи». Пользователям ИПС предоставляется возможность поиска и получения сведений по различным поисковым образам в таком информационном пространстве. Расчетные функции информационных систем заключаются в обработке информации, находящейся в системе, по определенным расчетным алгоритмам для различных целей. К числу подобных задач относится вычисление определенных статистических характеристик и показателей по экземплярам различных типов объектов и отношений, данные по которым накапливаются в системе. Широко применяющейся разновидностью расчетных информационных систем являются различные системы автоматического проектирования, всевозможные бухгалтерские и финансово-экономические системы. Технологические функции информационных систем заключаются в автоматизации всего технологического цикла или отдельных его компонент, какой-либо производственной или организационной структуры. К системам, обеспечивающим подобные задачи, относится широкий класс автоматизированных систем управления (АСУ, АСУ ТП). Другой разновидностью технологических информационных систем являются системы автоматизации документооборота. Рассмотренная классификация автоматизированных информационных систем, как и всякая классификация, условна и на практике конкретная АИС может характеризоваться комплексным характером представления информации (например, являться фактографически-документальной системой) и решать комплекс справочных, поисковых, расчетных и технологических задач. 1.3. Система представления и обработки данных фактографических АИС В архитектуре подсистемы представления и обработки информации фактографических АИС можно выделить различные уровни представления информации, отображенные на рис. 1.4. Рис. 1.4. Уровни представления информации в АИС Начальный уровень определяется локальными представлениями о предметной области пользователей-абонентов информационной системы и их представлениями о своих информационных потребностях. На основе анализа этих представлений определяется информационно-логическая или сокращенно инфологическая схема предметной области, подлежащей отображению информационной системой, и концептуальная модель использования информационной системы. Инфологическая схема представляет собой формализованное представление (описание) объектов и отношений фрагмента действительности. Наиболее часто формализация представлений о предметной области осуществляется в рамках модели «объекты-связи» (так называемая ER-людель — от англ. Entity Relationship). При этом под информационным объектом в общем плане понимается некоторая сущность фрагмента действительности, например организация, документ, сотрудник, место, событие и т. д. В предметной области выделяются различные типы объектов, представляемые в информационной системе в каждый момент времени конечным набором экземпляров данного типа. Каждый тип объекта включает (идентифицируется) присущий ему набор атрибутов (свойств, характерных признаков, параметров). Атрибут представляет логически неделимый элемент структуры информации, характеризующийся множеством атомарных значений. Для примера можно привести атрибут «Имя» объекта типа «Лицо», который характеризуется множеством всех возможных имен, и атрибут «Текст» объекта типа «Документ», который характеризуется множеством средств смыслового выражения в определенном национальном языке. Экземпляр объекта образуется совокупностью конкретных значений атрибутов данного типа объекта. Один или некоторая группа атрибутов объекта данного типа могут исполнять роль ключевого атрибута, по которому идентифицируются (различаются) конкретные экземпляры объектов. К примеру, для объектов типа «Лицо» ключом может являться совокупность атрибутов «Фамилия», «Имя», «Отчество» или один атрибут, выражающий номер паспорта (удостоверения личности). Различные типы объектов и различные экземпляры одного типа объекта могут быть охвачены определенными отношениями, которые в рамках ER-модели выражаются т. н. связями. Так, например, объекты «Сотрудник» и «Организация» могут быть охвачены отношением «Работа», т. е. связаны этим отношением. При этом связи могут быть двух типов — иерархические, или, иначе говоря, структурные (владелец-подчиненный) и одноуровневые, например, родственная связь «Брат-сестра» между двумя экземплярами объекта типа «Лицо» (в отличие от иерархической родственной связи—«Отец-сын»). Объекты-владельцы иерархических связей-отношений иногда называют структурными объектами, в противовес простым объектам, которые таковыми не являются (не являются владельцами). Структурные и одноуровневые связи (отношения), в свою очередь, по признаку множественности могут быть трех типов — «один-к-одному» (например, отношение «Лицо-Паспорт», имея в виду под «Паспортом» не атрибут объекта Лицо, а самостоятельный объект, состоящий из атрибутов «Номер», «Вид паспорта», «Владелец», «Место выдачи», «Дата выдачи» и т. д.), «один-ко-многим» (например, отношение «Подразделение-Сотрудник», имея в виду, что в одном подразделении может работать много сотрудников, но каждый сотрудник работает только в одном подразделении) и «многие-ко-многим» (например, отношение «Лицо-Документ», имея в виду, что один человек может быть автором, или иметь какое-либо другое отношение ко многим документам, и, в свою очередь, один документ может иметь много авторов. Помимо этого информационные потребности абонентов информационной системы могут включать также и оперирование опосредованными (т. е. косвенными, непрямыми, ассоциативными) связями. Примерами таких непрямых связей является совместная работа нескольких человек на одном предприятии (подразделении). Прямая непосредственная связь в данном случае, как правило, устанавливается только между объектами «Лицо» и «Организация», но не между различными экземплярами объекта «Лицо». Одним из способов представления формализованного описания предметной области информационной системы в рамках модели «объекты-связи» является использование техники специальных диаграмм, которая была предложена известным американским специалистом в области баз данных Ч. Бахманом. В диаграммах Бахмана объекты (сущности) представляются вершинами некоторого математического графа, а связи —дугами графа. Виды и свойства связей-отношений объектов отображаются направленностью, специальным оформлением дуг и расположением вершин графа. В качестве примера можно привести инфологическую схему предметной области сведений информационной системы, предназначенной для накопления данных о научной работе в каком-либо учебном или исследовательском учреждении (см. рис. 1.5). Рис. 1.5. Мифологическая схема предметной области информационной системы со сведениями о научной работе На приведенном рисунке однонаправленность дуг означает структурность связи «владелец-подчиненный», двунаправленность дуг означает одноуровневые связи, двойные стрелки означают множественность отношения «один-ко-многим», двунаправленность двойных стрелок означает одноуровневые отношения «многие-ко-многим». Одним из недостатков использования ER-диаграмм Бахмана для описания формализованных схем (моделей) предметных областей информационных систем является их статичность, не позволяющая наглядно и непосредственно отображать процессы, в которые вовлечены сущности и которым подвержены отношения (связи). Отчасти подобные проблемы преодолеваются введением дополнительных сущностей, выражающих собственно процессы и ситуации — событие, действие, момент времени. Аналогичным образом в некоторых случаях вводятся пространственные сущности для адекватного представления сущностей и отношений предметной области—маршрут, место, населенный пункт, здание, элемент здания, зона и т. д. Вторым уровном представления информации в информационной системе (см. рис. 1.4) является схема базы дачных, (называемая еще логической структурой данных), представляющая описание средствами конкретной СУБД инфологической схемы предметной области (информационные объекты, реквизиты, связи). Совокупность средств и способов реализации схемы базы данных в конкретной СУБД составляет модель организации данных. Схема базы данных содержит также ограничения целостности данных. Ограничения целостности представляют собой набор установок и правил по типам, диапазонам, соотношениям (и т. д.) значений атрибутов объектов, характеристик и особенностей связей между объектами. К примеру, диапазон значения атрибута «Дата рождения» объекта лицо не может выходить за рамки текущей даты, значение атрибута «Дата приобретения» объекта «Имущество» не может быть позднее значения атрибута «Дата продажи», значение атрибута «Количество» объекта «Материал» не должно быть меньше минимально необходимого на складе и т. п. Ограничения целостности данных лежат в основе контроля корректности информации при ее вводе в систему и периодического контроля наличия смысловых и других ошибок в базе данных после проведения операций добавления, удаления и изменения данных. Третий и самый «низкий» уровень представления информации в фактографических информационных системах выражается внутренней схемой базы данных, определяющей структуру организации и особенности хранения информационных массивов, в которых и находятся собственно сами данные (см. рис. 1.4). Более конкретные особенности представления и организации данных определяются конкретным типом и особенностями СУБД, используемой для создания фактографической информационной системы. Вопросы и упражнения 1. Разъясните соотношение и взаимосвязь понятий «информация», «знания», «сведения» и «данные». 2. Охарактеризуйте в терминах информационного обеспечения листок по учету кадров и автобиографию, заполняемые и составляемые сотрудником при приеме на работу. 3. Бланк заказа заполняется клиентом, подписывается работником организации, регистрируется, исполняется и подшивается в соответствующее дело. Охарактеризуйте в терминах информационного обеспечения указанные операции и процессы. 4. Является ли обязательным использование СВТ в информационных системах? Каковы главные признаки информационной системы и чем она отличается от простой совокупности информационных ресурсов? 5. Одной из задач работника информационно-аналитической службы является поиск, сбор и систематизация всех публикаций по определенной проблеме. Как можно охарактеризовать эти функции с точки зрения структуры и этапов информационного обеспечения? 6. К какому этапу цикла функционирования информационных систем относится извещение абонента читального зала об исполнении заказа на интересующую его книгу, журнал? 7. Чем отличается база данных от информационного массива? 8. Каково соотношение понятий банка данных и базы данных? 9. К какому типу информационных систем можно отнести картотеку личных дел сотрудников организации? 10. Какого типа информационную систему наиболее целесообразно создавать для информационного обеспечения снабжения товарами сети магазинов торговой компании? 11. Чем отличается инфологическая схема предметной области информационной системы от схемы ее базы данных? 12. Какие атрибуты или совокупности атрибутов объектов «Образование» (наименование учебного заведения, год поступления, год окончания, квалификация, специальность, № диплома), «Имущество» (инв. №, наименование, тип, дата приобретения) могут исполнять роль ключей? 13. Каковы типы отношений-связей между объектами (сущностями) «Счет»—«Банк», «Товары»—«Поставщики», «Студенты»—«Преподаватели» и «Автомобиль»—«Паспорт транспортного средства (ПТС)»? 2. Системы управления базами данных фактографических информационных систем История СУБД как особого вида программного обеспечения неразрывно связана с историей начала использования электронно-вычислительных машин для организации хранения и обработки информации. Именно в то время (конец 60-х, начало 70-х годов) были разработаны основы программного обеспечения для создания и эксплуатации фактографических информационных систем. В конце 70-х, начале 80-х годов направление программного обеспечения под общим названием «СУБД» превратилось в одну из наиболее бурно развивающихся отраслей программной индустрии. При этом основные программно-математические и технологические решения по СУБД были разработаны в 70-х годах в ряде крупных исследовательских проектов. Наиболее известными из них являются проект «Рабочей группы по базам данных» КОДАСИЛ (DBTG CODASY L) с участием уже упоминавшегося Ч. Бахмана, пионерские работы основателя теории реляционных баз данных Е. Кодда, проект разработки системы управления реляционными базами данных «System R» фирмы IBM (1975-1979 гг.) и проект разработки СУБД «Ingres» (Interactive Graphics and Retrieval System) в университете Беркли (1975-1980 гг.) под руководством известного специалиста в области баз данных М. Стоунбрейкера. 2.1. Функции, классификация и структура СУБД С начала своего возникновения в конце 60-х годов автоматизированные информационные системы ориентировались на хранение и обработку больших объемов данных, которые не могли быть одновременно и полностью размещены в оперативной памяти ЭВМ. В структуре программного обеспечения ЭВМ, как в то время, так и сейчас, за организацию, размещение и оперирование данными во внешней (долговременной) памяти отвечает операционная система ЭВМ, соответствующий компонент которой чаще всего называется «файловой системой». Данные во внешней памяти компьютера представлены именованными совокупностями, называемыми файлами. В большинстве случаев операционная (файловая) система не «знает» внутренней смысловой логики организации данных в файлах и оперирует с ними как с однородной совокупностью байтов или строк символов. С точки зрения смысла и назначения АИС файлы данных имеют структуру, отражающую информационно-логическую схему предметной области АИС. Эта структура данных в файлах должна обязательно учитываться в операциях обработки (собственно, в этом и заключается одна из основных функций АИС). Вместе с тем, в силу невозможности в большинстве случаев размещения файлов баз данных сразу целиком в оперативной памяти компьютера, структуру данных в файлах баз данных приходится учитывать при организации операций обращения к файлам во внешней памяти. Отсюда вытекает основная особенность СУБД как вида программного обеспечения. Будучи по природе прикладным программным обеспечением, т. е. предназначенным для решения конкретных прикладных задач, СУБД изначально выполняли и системные функции — расширяли возможности файловых систем системного программного обеспечения. В общем плане можно выделить следующие функции, реализуемые СУБД: • организация и поддержание логической структуры данных (схемы базы данных); • организация и поддержание физической структуры данных во внешней памяти; • организация доступа к данным и их обработка в оперативной и внешней памяти. Организация и поддержание логической структуры данных (схемы базы данных) обеспечивается средствами модели организации данных.* Модель данных определяется способом организации данных, ограничениями целостности и множеством операций, допустимых над объектами организации данных. Соответственно модель данных разделяют на три составляющие — структурную, целостную и манипуляционную. * В обиходе просто «модель данных».
Известны три основные модели организации данных: • иерархическая; • сетевая; • реляционная. Модель данных, реализуемая СУБД, является одной из основных компонент, определяющих функциональные возможности СУБД по отражению в базах данных информационно-логических схем предметных областей АИС. Модель организации данных, по сути, определяет внутренний информационный язык автоматизированного банка данных, реализующего автоматизированную информационную систему. Модели данных, поддерживаемые СУБД, довольно часто используются в качестве критерия для классификации СУБД. Исходя из этого, различают иерархические СУБД, сетевые СУБД и реляционные СУБД.
|