Технологія збереження
Уперше проблема опису мережевих ресурсів була представлена в доповіді Б. Тіллет (Бібліотека Конгресу США). Вирішення проблеми схилилося на користь уніфікації й структурування відомостей про електронні ресурси у такому новому середовищі, як метадані. Метадані — це інформація, що формується видавцями електронних ресурсів як обов'язковий мінімум відомостей, що дає каталогізатору можливість використати їх при систематизації в чітко регламентованому середовищі електронного каталогу з відповідними правилами й стандартами. Термін "метадані" прийнято тлумачити, як "дані про дані", однак його значення поширюється, крім опису складу даних, їхньої структур (формату) подання, місця зберігання й інших ознак опису, також й на інформаційні системи, що їх підтримують, технології, користувачів, методи доступу тощо [1, 4]. Про метадані сьогодні говорять багато — як на захист їхнього використання, так і проти них. Їх вважають універсальним форматом і пропонують використовувати для каталогізації всіх електронних ресурсів. Поняття "метадані" з'явилося в середині 1990-х років. Це бібліотечний каталог, який може розглядатися як набір метаданих у тому розумінні, що каталожний запис є інформацією про інформацію. Так виникла потреба у створенні адаптованих рекомендацій для опису мережевих ресурсів. Це зумовило розробку формату Дублінського ядра метаданих (Dublin Core Metadata Element Set), метою розробки було створення простого набору елементів метаданих, що не вимагає професійної підготовки і розрахований на тих, хто надає у глобальній мережі електронні матеріали з описом власних результатів. Стандарт Dublin Core Metadata Element Set (вимовляється "даблін кор" або DC "дісі") є форматом опису практично будь-яких ресурсів інтернет, нескладний за структурою, відносно легкий у застосуванні, інтернаціональний, тобто застосовується в усьому світі. В лютому 2000 року Європейський комітет із стандартизації CEN розробив документ під назвою CWA 13874 який пропонував використання стандарту Дублінського ядра метаданих для музеїв, бібліотек, державних агенцій та комерційних установ щодо опису веб-ресурсів. У вересні 2001 року набір Дублінського ядра метаданих був затверджений в США Американським Інститутом Національних Стандартів як стандарт Z39.85. В Австралії, Канаді, Данії, Фінляндії, Ірландії і Великобританії в тому самому році формат рекомендований і прийнятий як державний стандарт для онлайнових ресурсів та е-комерції. В березні 2003 року Міжнародна організація стандартів ISO ухвалила фінальний текст документу під назвою ISO 15836, яким набір елементів Дублінського ядра метаданих затверджено як міжнародний стандарт. Спочатку Дублінське ядро метаданих виникло як невеличкий набір ідентифікаторів, що швидко привернув увагу широкого загалу інформаційних спеціалістів галузей мистецтва, науки, освіти, бізнесу та державного сектору. Практичне використання його стандарту забезпечило створення конче потрібних, семантично змістовно багатих описів цифрових ресурсів [2-3, 9]. Канада Першим проектом, який створив постійну електронну колекцію веб-документів у бібліотеці, став проект EPPP (Electronic Publication Pilot Project) Національної бібліотеки Канади, який стартував у червні 1994 г. [25]. США У 2000 р. Бібліотека Конгреса США розпочала втілення проекту MINERVA (Mapping the Internet Electronic Resources Virtual Archive) [31], що став можливим завдяки тісному співробітництву між бібліотекою й некомерційною організацією Internet Archive [32] (Сан-Франциско), яка зберігає й забезпечує доступ до світових Інтернет-ресурсів. Ядро архіву становлять html-файли, які передає в Internet Archive компанія Alexa Internet через шість місяців після автоматичного зберігання інформації [33]. На сьогодні Internet Archive зберігає понад 80 млрд. веб-сторінок (це терабайти інформації), що в декілька разів більше обсягу всіх матеріалів, наявних у Бібліотеці Конгресу США [34]. У жовтні 2001 р. Internet Archive запустив програму за назвою "Wayback Machine", яка забезпечує вільний доступ до архівів в усій мережі. Для створення "дзеркал" веб-сайтів використовувалася вільно доступна програма HTTrack [35]. Internet Archive організується як електронна бібліотека. Поряд з файлами, що утворюють "дзеркало" веб-сайту, в електронній бібліотеці зберігаються метадані, пов'язані з файлами (об'єктами) архіву, і метадані, пов'язані із процесом архівування. The Wayback Machine – в базе сохраняется содержимое веб-страниц, и можно посмотреть, как выглядела та или иная страница раньше, даже если сайт больше не существует. В октябре 2004-го впервые было зафиксировано использование The Wayback Machine в качестве доказательства в американском суде.[11] Характерное отличие большинства специализированных проектов кэширования веб-ресурсов -- избирательность архивирования. Все-таки вряд ли возможно, да и нужно архивировать весь контент Сети. Наполнение баз Wayback Machine происходит выборочно, проект архивирует в основном крупные и популярные ресурсы. Прежде всего обрабатываются ресурсы, входящие в большие веб-каталоги. «Классический» интерфейс предлагает простой и расширенный режимы поиска. В качестве простого запроса выступает адрес интересующей веб-страницы. Расширенный режим предлагает неплохой выбор дополнительных фильтров. В частности, можно указать точный временной диапазон, в котором будет вестись поиск сохраненных копий страниц. Доступны и другие инструменты, помогающие включать и отключать переадресации на найденных веб-страницах, а также выбирать типы файлов, по которым будет вестись поиск. Система умеет не только выводить страницы по точному URL, но и предлагать близкие значения. Переключатель этой опции также присутствует на странице расширенного поиска. Если появится необходимость, в результатах поиска можно включить показ всех снимков страницы за один день. И тогда по умолчанию, если их было сделано несколько, в выдачу попадет лишь один.
Біблітека Конгресу США в процесі вивчення проблеми архівування Інтернет-ресурсів у рамках проекту MINERVA прийшла до висновку, що їй необхідно архівувати всі мережеві інформаційні ресурси, оскільки майбутні покоління можуть інакше оцінювати інформацію, яка зараз легко може бути проігнорована й не уведена до архіву. У США в 1999 р. Асоціація наукових бібліотек заснувала SPARC (The Scholarly Publishing and Academic Resources Coalition) [36] — Коаліцію наукових публікацій й академічних ресурсів з метою залучення вчених до процесу самоархівування й самопублікації. Головна мета SPARC — допомагати новим незалежним науковим видавництвам, науковим товариствам і університетам у забезпеченні відкритого доступу. Коаліція виникла як орган колективних дій порівняно невеликої кількості бібліотекарів і видавців, які задумали змінити систему наукових публікацій. Було вирішено сконцентруватися на проблемах випуску наукової, технічної й медичної літератури — тих галузей, де середня ціна журналів вдвічі вища вартості журналів тих, що виходили у сфері суспільних наук і вп'ятеро — гуманітарних видань. У доповідях Коаліції повідомляється про нові ініціативи в цьому напрямі, узагальнюється передовий досвід, даються практичні поради бібліотекарям, як вести агітаційну роботу серед вчених і адміністрацій зі створення власних архівів відкритого доступу. За підтримкою SPARC до 2001 р. з'явилися десять нових журналів, вісім з них були альтернативою журналам видавництва Elsevier. Як приклад можна навести "Organic Letters" Американського хімічного товариства, що склав конкуренцію журналу "Tetrahedrom Letters". Зараз до SPARC входять близько 300 наукових, університетських бібліотек і наукових установ Північної Америки, Великобританії, Європи й Азії. Програми SPARC спрямовані на створення видань, конкурентних дорогим науковим і медичним журналам. SPARC підтримує здійснення проектів технологічних змін у процесі наукового спілкування та проектів інноваційних змін у бізнес-моделі поширення знань. Зразком такого роду моделі комунікації може бути доступний тільки в електронному форматі реферативний журнал Internet Journal of Chemistry. Це ініціатива незалежної групи вчених-хіміків, які прагнуть створити в Інтернеті середовище для наукових публікацій. Технологія уможливлює зниження вартісті публікації й реалізацію схеми авторського права, більш відкриту для повторного наукового використання. Ще одна інновація — спільне з Інститутом фізики Великобританії й Німецьким фізичним товариством видання електронного реферативного журналу New Journal of Physics, доступ до якого надається через Інтернет безоплатно. Бізнес-модель допускає оплату статей, що публікуються, самими авторами. SPARC взяв на себе лідируючу роль у створенні коаліції BioOne [37] — безприбуткового товариства наукових журналів з біології, екології й охорони навколишнього середовища; ці журнали видаються невеликими науковими товариствами, що організовані при Американському інституті біологічних наук. Журнали, про які йдеться, поки що доступні тільки в друкованій формі й занадто дорогі для багатьох членів згаданого інституту. За допомогою BioOne нечисленні наукові товариства отримають можливість доступу до електронних ресурсів.
|