Теоретична частина. Поняття бази даних (data base) як засобу опрацювання інформації з’явилось на етапі застосування комп’ютерних систем у сфері бізнесу
База даних Поняття бази даних (data base) як засобу опрацювання інформації з’явилось на етапі застосування комп’ютерних систем у сфері бізнесу, фінансів та управління. Початково базою даних називався будь який масив, в якому дані накопичувались для подальшого опрацювання. З часом сам термін набув більш конкретного поняття, а технології створення, зберігання і застосування баз даних розвинулись в окрему галузь комп’ютерних наук. Особливостями сучасних баз даних є: - структурування і класифікація даних за певною множиною формальних та змістовних ознак; - наявність спеціального програмного забезпечення – системи управління базами даних; - незалежність методів і засобів зберігання даних (технологій фізичного рівня) від методів та засобив опрацювання та сприйняття даних (технологій логічного рівня); - незалежність способів представлення і обробки даних від їх змісту та галузі застосування; - незалежність методів і процедур опрацювання від обсягів даних; - можливість застосування однієї бази даних для розв’язання різноманітних задач. Термін “база даних” в цілому є достатньо об’ємним, складним та багатостороннім для однозначного визначення. Попередньо визначимо, що база даних - це множина взаємопов’язаних даних, об’єднаних спільним середовищем зберігання, спільним застосуванням, єдиною формою представлення, єдиними методами і засобами керування. У подальшому це визначення буде уточнюватись, розширюватись та доповнюватись з метою якнайповнішого вивчення технологій опрацювання інформації на основі баз даних.
Управління даними За допомогою програми обслуговування баз даних (управління базами даних) можна зберегти дані у спеціальному форматі, вибрати з них потрібні, опрацювати, роздрукувати і т.д. При наявності готової бази даних за допомогою Microsoft Access можна здійснити у ній пошук даних по заданих користувачем критеріях. Добрим прикладом є телефонний довідник. Для уніфікації механізмів пошуку даних зміст набору даних зберігається у стандартній формі. Мова йде про табличну форму, причому кожний запис даних (блок даних) являє собою окремий рядок таблиці. Отже набір даних складається з записів, а кожний запис даних - із окремих полів. Структура всіх записів бази однакова: всі вони мають одну і ту ж саму послідовність полів, але значення поля у кожного запису своє. Створення бази даних проводиться у декілька етапів. Перший етап полягає у визначенні структури бази даних. На ньому встановлюється, з яких елементів (полів) складається окремий запис бази даних, і задається тип кожного елементу. Розрізняють, зокрема, текстові і числові типи. Перші призначені для зберігання тексту і можливості обробки у них значно слабші ніж у числових, у яких можна навіть проводити обчислення. Разом з типом поля вказуються різноманітні його характеристики, наприклад, довжина. Кожне поле має своє ім’я. Після розробки структури бази даних здійснюють ввід даних - це другий етап. Використання спеціальних форм (бланків) спрощує як ввід так і вивід окремих записів. За допомогою форм можна також вивести на екран значення не всіх полів кожного запису, а тільки потрібних. Пошук інформації у базі даних здійснюється на основі критеріїв пошуку, які застосовуються до значень певних полів бази. Запити можуть бути збережені для повторного використання. Завдяки точно визначеним запитам здійснюється швидка вибірка з бази. Наступний етап це оформлення отриманої відселектованої інформації.
Реляційні бази даних Для вирішення складних задач одного файлу з даними буває недостатньо. Припустимо, що необхідно скласти заявку на товари, в якій повинні бути найменування товару і адреса постачальників. Якщо всю цю інформацію зберігати тільки в одній таблиці, поруч з найменуванням товарів, варто було б передбачити також поле для адреси постачальників. Якщо ж один і той самий постачальник має декілька видів товару то дуже багато записів будуть зберігати інформацію, що дублюється: одна і та ж адреса постачальника для різних найменувань товару. Цей спосіб організації бази даних має такі недоліки: · При додаванні у базу даних інформації про новий товар вже відомого постачальника доведеться знову вводити його адресу. · Якщо адреса постачальника зміниться необхідно буде перевірити і обновити всі записи, що містять дану адресу. · При збереженні у кожному записі повної адреси постачальника збільшується об’єм пам’яті, що використовується і затрати часу на управління даними, а пошук записів відповідно сповільнюється. · Підвищується ймовірність помилки (при вводі та опрацюванні). У подібних ситуаціях більш ефективною є база даних побудована на основі реляційної моделі. Перевага її у тому, що для кожного самостійного набору даних створюється власний файл (таблиця). У описаному прикладі це був би окремий файл найменувань товару і окремий файл постачальників. У файлі найменувань адреса постачальника вказується у вигляді посилання - номер запису файла постачальників, що містить реальну адресу. Номер запису називається також, первинним ключем. Первинний ключ являє собою індекс, тобто відсортований список, який встановлює відповідність між значенням поля та записом в якому це значення міститься. Індекс полегшує пошук всередині великих наборів даних.
Основні терміни та визначення На сьогодні реляційна модель бази даних є домінуючою у різноманітних застосуваннях, тому доцільно розглянути основну термінологію та поняття які застосовуються саме для цього типу баз даних. Запропонований у 1971 р. Е. Коддом підхід до зберігання даних у вигляді двомірних файлів-таблиць за кілька десятиліть став визнаним теоретичним базисом для великої кількості технологій, а також засобів розробки прикладних систем, управління та зберігання даних. Реляційна модель ґрунтується на понятті відношення (relation). З певним наближенням відношенням можна вважати таблицю, яка володіє специфічними властивостями, хоча, у загальному випадку, поняття відношення і таблиці не слід ототожнювати. Основні властивості відношення: 1. Стовпчикам присвоюються однозначні імена, і у кожному з них розміщуються однотипні значення окремих елементів даних (дати, прізвища, ціле число або грошові суми, тощо). У відношенні не може бути двох однакових стовпчиків. 2. Відношення складається з однотипних рядків і має унікальне ім'я. 3. Рядки мають фіксоване число полів (стовпчиків) і значень (множинні поля, повторювані групи та інші агрегатні значення неприпустимі). 4. Рядки обов'язково відрізняються один від одного хоча б єдиним значенням, що дозволяє однозначно ідентифікувати будь-який рядок такої таблиці. 5. У кожній позиції на перетині рядка і стовпчика розміщене атомарне значення або нічого. Поняття атомарності означає неможливість бути поділеним на дрібніші складові без втрати своїх властивостей. 6. Порядок рядків і стовпчиків у відношенні може бути довільним. У термінології баз даних стовпчики таблиць називають атрибутами (attribute), а рядки – кортежами (tupple). Формально, кожен атрибут це поєднання імені деякого інформаційного показника та множини його допустимих значень. Множина значень атрибута називається доменом (domain). Кожен кортеж відношення – це елемент узагальненого декартового добутку доменів деякої множини атрибутів. Кортеж уявляє собою впорядкований n -мірний вектор, кожна компонента якого вибирається із множини значень одного атрибута. У прикладних системах і технологіях, які ґрунтуються на теорії реляційних баз даних застосовується паралельна термінологія для позначення деяких об'єктів. Зокрема, синонімом терміну "атрибут" є терміни поле (field) і стовпчик (column), терміну "кортеж" – запис (record) або рядок (row), відношення у системах управління базами даних позначаються терміном таблиця (table). Відношення реляційної бази даних може розглядатись як поєднання двох складових: · множини атрибутів, яка визначає якісні параметри таблиці і називається схемою відношення; · множини кортежів у яких зберігаються значення відповідних атрибутів (інформаційного наповнення). Кількість атрибутів відношення називають його порядком або ступенем, кількість кортежів – об'ємом або кардинальним числом. Оскільки відношення у базах даних, у загальному випадку є динамічними об'єктами, вводиться поняття стану відношення. Станом називають значення схеми та інформаційного наповнення зафіксовані у деякий момент часу. Реляційна база даних – це множини взаємопов'язаних відношень, які зберігають значення інформаційних показників деякої сукупності об'єктів реального світу. Частина реального світу, що відображається у базі даних називається предметною областю. Схема бази даних – множина схем відношень, які входять до її складу, а стан бази даних – це множина станів всіх її відношень, визначених на один момент часу.
|