Система класифікації та кодування економічної інформації
Важлива складова інформаційного забезпечення — система класифікації та кодування. Класифікація — обов'язковий етап попередньої підготовки економічних даних до автоматизованого оброблення, а також передумова раціональної організації інформаційної бази та моделювання інформаційних процесів. Її можна визначити як складову інформаційного забезпечення будь-якої інформаційної системи, що належить до мовних засобів управління. Тому класифікація є основою для кодування інформації та наступного її пошуку. Система класифікації — це сукупність методів і правил розподілу множини об'єктів (М) на підмножину(Му) відповідно до ознак схожості або несхожості. Об'єкт класифікації — елемент класифікаційної множини. Класифікаційне групування — підмножина об'єктів, отриманих у результаті класифікації. Розрізняють два методи класифікації — ієрархічний і фасетний. Ієрархічний метод класифікації (рис.1) — це послідовний поділ множини об'єктів на підлеглі класифікаційні угруповання. Переваги: логічність побудови, чіткість визначення ознак, великий обсяг інформації, зручність використання. Недоліки: жорстка структура, брак резервного обсягу.
Рис.1 - Ієрархічна класифікація. [20] Фасетний метод класифікації — паралельний поділ множини об'єктів на незалежні класифікаційні угруповання. Фасет — набір значень однієї ознаки класифікації. Фасети взаємно незалежні. Кожний об'єкт може одночасно входити в різні класифікаційні угруповання (рис.2). ФАСЕТИ
Рис. 2 - Фасетна класифікація [20] Переваги: гнучкість структури (пристосування до змін у задачах), дає можливість вводити нові фасети чи видаляти старі. Недоліки: недостатньо повне використання обсягу. Кодування — процес присвоєння умовного позначення різним позиціям номенклатури. Код — це знак чи сукупність знаків, прийнятих для позначення класифікаційного угруповання чи об'єкта класифікації. Для кодування інформації в інформаційних системах застосовують порядковий, серійно-порядковий, послідовний і паралельний методи кодування. Порядковий метод кодування — найпростіший і найпоширеніший. Побудова кодів виконується в міру зростання або спадання ознак без пропуску номерів. Серійно-порядковий метод кодування на кожну групу ознак має серію порядкових номерів із резервом номерів. Послідовний метод кодування передбачає відокремлення певних розрядів коду під певні ознаки. Паралельний метод кодування теж передбачає виокремлення розрядів, але значення ознаки, записаної на будь-якому розряді коду, не залежить від значення ознак, записаних на інших розрядах. Вибір методів класифікації та кодування об'єктів передбачає: ¾ можливість розширення кодової множини об'єктів і внесення відповідних змін; ¾ однозначність ідентифікованих об'єктів; ¾ мінімальну довжину коду; ¾ можливість оброблення інформації за допомогою ЕОМ; ¾ простоту методу кодування; ¾ застосування загальноприйнятих позначень.
2. 4 Організація баз і банків даних АІС. Ресурси БД Для задоволення інформаційних потреб користувачів в інформаційної системи існує банк даних (БнД). До складу БнД (рис.3) входять такі складові: сукупність технічного і програмного забезпечення, база даних, СУБД, словник даних, адміністратор БД.
Рис. 3 – Структура банку даних Банк даних (БнД)— це автоматизована система, сукупність інформаційних, програмних, технічних засобів і персоналу, що забезпечує зберігання, нагромадження, оновлення, пошук і видачу даних. База даних (БД)—організоване зберігання інформаційних ресурсів у вигляді інтегрованої сукупності файлів, що забезпечує взаємодію між ними та доступ до даних. Система управління базами даних (СУБД) — програмні засоби, за допомогою яких можна створювати БД, поповнювати їх і працювати з ними. В основу організації БД покладено принцип єдності. На всіх етапах життєвого циклу БД складається з двох компонентів: структури і даних. На різних рівнях опису БД її структура зображується: ¾ на інфологічному рівні (сутність — зв'язок); ¾ на датологічному рівні вона може бути однією з моделей даних — ієрархічною, мережевою, реляційною, об'єктно-орієтованою, об'єктно-реляційною, багатовимірною, змішаною; ¾ на фізичному рівні (структура файлів даних і допоміжних файлів). [22] Файли даних також складаються із структури та даних. Структура охоплює такі компоненти: ім'я поля, тип поля, довжина поля. Дані — це компонент БД, над яким виконуються в ІС дії. Використання принципів бази і банку даних передбачає організацію зберігання інформації у вигляді БД, де всі дані зібрано в єдиному інтегрованому середовищі, і до інформації як важливого ресурсу забезпечено широкий доступ користувачів. Така організація даних усуває цілий ряд проблем: ¾ відпадає потреба в кожній прикладній програмі детально вирішувати питання організації файлів; ¾ усуває багаторазове введення й дублювання одних і тих самих даних; ¾ не виникає проблеми зміни прикладних програм у зв'язку із заміною фізичних пристроїв або зміни структури даних; підвищує рівень надійності та захищеності інформації і зменшує надлишок даних. Розвиток технологій баз і банків даних визначається рядом чинників: ростом інформаційних потреб користувачів, вимогами доступу до інформації, появою видів масової пам'яті та збільшенням її об'ємів. База даних — це динамічний об'єкт, який змінює значення зі зміною стану предметної сфери, яка відображається (зовнішніх умов стосовно бази). Словник метаданих є інструментом адміністратора БД і БнД та відіграє особливу роль. Важливе завдання адміністратора БД — захист даних від злому, несанкціонованого доступу[21]. Для виконання функції адміністратора в СУБД передбачено різні службові програми. Адміністрування БД передбачає виконання функцій для забезпечення надійної та ефективної роботи бази даних, задоволення інформаційних потреб користувача, відображення в БД динаміки предметної сфери. [23]. До обов'язків адміністратора БД належать: визначення інформаційного змісту БД, структури зберігання та стратегії доступу, взаємодія з користувачами, визначення контролю повноважень процедур перевірки вірогідності даних, а також стратегії даних.
|