Финляндия
В Финляндии с 1997 года для сбора, регистрации и долговременного хранения интернет-публикаций функционирует архивная система EVA[xx]. Это объединенный проект библиотек, издателей и экспертного сообщества страны, который координирует библиотека Университета Хельсинки (Национальная библиотека Финляндии). Собираются публично доступные статические веб-страницы финского домена. Целями проекта являются формулирование критериев отбора электронных документов, создание депозитарной системы для издателей и разработка надежной системы долговременного сохранения информации. С 2002 года система периодически собирает статические образы страниц домена.fi. Кроме того, собираются тематические материалы (например, связанные с выборами). Налажено сотрудничество с порталом финского информационного центра, который передает в EVA адреса финских серверов, расположенных в других доменах. Изменения в закон об обязательном экземпляре и в закон о копирайте, которые разрабатывались параллельно, вступили в силу в 2005 году. Национальная библиотека получила право собирать цифровые материалы онлайн и оффлайн, а также радио- и телепрограммы.
Франция Решение о распространении французского закона об обязательном экземпляре на сетевые материалы принято парламентом в 2006 году. Закон дает полномочия Национальной библиотеке Франции и Национальному институту аудиовизуальной информации (INA), ответственному за сохранение радио- и телепрограмм, автоматически собирать сетевые материалы, а также требовать материалы у издательств, если автоматический харвестинг невозможен, и предоставлять доступ к архиву. Еще до внесения изменений в законодательство Национальная библиотека Франции с 2000 года разрабатывала комбинированную методику, включающую в себя: 1. Автоматический широкомасштабный харвестинг несколько раз в год. 2. Более частый сбор 10% автоматически отобранных сайтов. 3. Глубокое архивирование веб-сайтов, которые нельзя собрать автоматически. 4. Сбор тематических коллекций, связанных с определенными событиями. Осознавая необходимость международного сотрудничества по проблемам веб-архивирования, Национальная библиотека Франции инициировала Международный семинар по веб-архивированию (IWAW[xxi]) и активно участвовала в создании Международного консорциума сохранения Интернета (IIPC).
Чехия Проект создания архива веб-ресурсов Чешской республики[xxii] реализуется Национальной библиотекой[xxiii] при сотрудничестве с Моравской библиотекой и Институтом информатики Университета Масарика с 2000 года. Первоначально средства на реализацию проекта выделяло Министерство культуры, но затем он развивался почти исключительно благодаря грантовому финансированию. Цель проекта – сохранение культурного веб-наследия Чехии, например, веб-ресурсы Богемии и Чешская национальная библиография. Используются как технологии автоматического сбора всех национальных веб-ресурсов, так и выборочный сбор тематических коллекций. В Чешской республике законодательная база еще недостаточно эффективна. Закон об обязательном экземпляре не включает сетевые ресурсы, хотя соответствующие изменения находятся в стадии подготовки. С июня 2006 года закон об авторском праве приведен в соответствие с Директивой ЕС 2001/29/EC, т.е. весь архив можно предоставлять в открытый доступ в помещениях библиотеки. Кроме того, в отношении самых важных интернет-ресурсов заключаются договора с издателями, которые дают библиотеке право делать эти архивы доступными в сети. Сбор веб-ресурсов – это автоматизированный процесс, осуществляемый программными комплексами, которые обеспечивают сбор, индексирование и сохранение данных в соответствии с заранее установленными параметрами. Большая часть программного обеспечения – это открытые программные системы (например, Heritrix), разрабатываемые Международным Консорциумом сохранения Интернета, остальные программные средства разрабатываются самими участниками проекта. Собранные файлы и метаданные сохраняются в стандартном архивном формате, который поддерживается консорциумом IIPC. Информация хранится на сервере, а также в резервной системе RAID. Объем данных, собранных с сентября 2001 года, составляет 15,5 Тбайт. Отдельный сервер используется для доступа к тем ресурсам, которые покрываются соглашениями с издателями. Полнотекстовое индексирование реализуется системой с открытым кодом Nutch, для доступа используются системы Nutchwax и WERA. Для описания и идентификации ресурсов используются международные стандарты (MARC21, Dublin Core, ISSN и URN), а для архивирования – стандарт ARC. Отдельные веб-документы каталогизируются в системе ALEPH[xxiv], которая поддерживает протокол Z39.50[xxv] (как для клиента, так и для сервера) и протокол OAI-PMH[xxvi] (для репозитария и для автоматического сбора данных) с профилями для MARC21 и квалифицированного Dublin Core. Записи регистрируются в Чешской национальной библиографии. Выводы
1. Национальные библиотеки многих стран мира уже более 10 лет занимаются проблемами архивирования сетевых ресурсов, создавая архивы, которые комплектуются путем сочетания технологий веб-харвестинга и глубокого тематического архивирования. 2. Законодательство некоторых стран допускает веб-харвестинг и/или глубокое тематическое архивирование сетевых ресурсов. Если эти процессы не обеспечены законодательно, национальные библиотеки занимаются долговременным сохранением сетевых ресурсов на основе договоров с издателями и при ограничении доступа к архивам. 3. Архивирование и долговременное сохранение сетевых ресурсов требуют серьезных научных исследований и технологических разработок, в которых ключевую роль играет международное сотрудничество. 4. В результате международного сотрудничества разработаны стандарты, схемы метаданных и открытое программное обеспечение для долговременного сохранения сетевой информации, которые необходимо использовать и в России.
Вітчизняні національні бібліотеки, своєю чергою, долучились до процесу архівування інтернет-контенту.
Концепція «Мережевої Україніки» Перед організацією робіт зі створення архіву принципово важливо було визначитися з інформаційними ресурсами, які підлягають архівуванню. Засновники Національної бібліотеки України наголошували на тому, що в ній "має бути найповнішим чином розроблений відділ "Ucrainica"; бібліотека повинна бути книгозбірнею, в якій мають бути зібрані всі пам'ятки духовного життя українського народу і України (рукописні і друкарські). В ній повинні бути зібрані книги, часописи, газети, гравюри, листівки, ноти, літографії і інші твори друкарень, літографій і металографій, видані на Україні та за кордоном". Сучасну концепцію фонду "Україніки" було запропоновано на Першому конгресі Міжнародної асоціації україністів (вересень, 1990). Учасниками Конгресу визначено загальний підхід, згідно з яким до цього фонду мають включатися документи, створені в Україні, в інших державах про неї, а також документи, створені українцями, які зробили значний внесок до світової культури. Пізніше цей підхід було розвинено Інститутом української археографії та джерелознавства ім. М. Грушевського НАН України при напрацюванні концепції архівної та рукописної Україніки [19]. Наступний внесок до визначення "Україніки" було зроблено В. Ю. Омельчуком при розробці концепції національної бібліографії України, що розглядається ним "як форма відображення багатовікової пам'яті народу, засіб обміну і збагачення досягнень його культури, інформаційного забезпечення розв'язання економічних і політичних проблем як на рівні держави, так і на рівні взаємодії з міжнародним співтовариством" [19]. В. Ю. Омельчук запропонував такі чотири ознаки, що мають бути враховані при створенні поточної та ретроспективної національної бібліографії України і, відповідно, при віднесенні документів до фонду "Україніки":
Вбачається доцільним урахувати вищезгадані напрацювання і при архівуванні науково-інформаційних ресурсів глобальних комп'ютерних мереж. Насамперед, складовою архіву мають стати колекції наукових та суспільно значущих документів національної складової інтернету, тобто слід забезпечити повноту відображення в архіві публікацій, створених на території держави. Фактично так бібліотека виконуватиме меморіальну функцію щодо вітчизняних мережевих публікацій. Нормативною базою для виконання меморіальної функції щодо друкованих та інших видань є законодавчі акти щодо обов'язкового примірника документів [9]. Сьогодні мережеві публікації не підпадають під сферу дії цих нормативних актів. Очевидно, що в перспективі відповідні нормативні акти будуть підготовлені та набудуть чинності. Першим з них є "Державна програма розвитку діяльності Національної бібліотеки україни імені В. І. Вернадського на 2005-2010 рр.", затверджений Постановою Кабінету Міністрів України від 25 серпня 2004 р. № 1085 [7], що зобов'язує бібліотеку архівувати науково-інформаційні ресурси, насамперед, національної складової глобальної інформаційної мережі інтернет. При цьому принципово важливо розглядати ці ресурси як складову єдиного електронного документного простору держави і відбивати їх у національній бібліографії України. Архів має включати також колекції зарубіжних мережевих науково-інформаційних ресурсів. Однак, при цьому слід ураховувати неможливість кумуляції однією бібліотекою усіх світових інформаційних ресурсів. При визначенні тематичного складу зарубіжних мережених ресурсів, що мають архівуватися, слід виходити з стратегічних та середньострокових пріоритетних напрямів інноваційної діяльності в Україні, що затверджені на законодавчому рівні [18], якими передбачається концентрація ресурсів держави на науково-технологічному оновленні виробництва та сфери послуг у країні, забезпеченні внутрішнього ринку конкурентною наукоємною продукцією та виходу з нею на світовий ринок. Мають підлягати архівуванню також колекції інтернет-публікацій про Україну, а ще зібрання мережевих документів українською мовою та публікації українців і українських інституцій у інших державах [9]. Нам убачається доцільним увести для сукупності цих інформаційних ресурсів термін "мережева україніка". Технологія архівування "мережевої україніки" глобальних комп'ютерних мереж повинна бути спрямована на досягнення максимальної ресурсоощадності й дозволяти уникнути дублювання під час обробки документів. Для досягнення цієї мети за умов обмежених матеріально-технічних і кадрових ресурсів та наявності розвинених телекомунікаційних мереж до архівування доцільно залучити всі зацікавлені інституції — суб'єкти вітчизняної системи документальних наукових комунікацій (провідні галузеві та регіональні бібліотеки, інформаційні центри, наукові установи та вищі навчальні заклади тощо). З висловленого випливає, що основною концептуальною засадою побудови цілісної системи архівування "мережевої україніки" в Україні слід обрати поєднання принципів децентралізованого збору та первинної обробки газузевих і регіональних фрагментів інформаційних мереж з централізованим формуванням зведеного довідкого-пошукового апарату для підтримки багатоаспектного використання інформаційних ресурсів розподіленого архіву [9, 12]. В Україні склалася виважена структура бібліотечної системи, в якій поєднується відомча централізація та регіональна кооперація. В межах цієї системи вбачається доцільним організувати формування відповідних галузевих архівів глобальних комп'ютерних мереж у медичній, науково-технічній, сільськогосподарській, архітектурно-будівельній, історичній і науково-педагогічній бібліотеках. Багатогалузеві бібліотеки провідних вищих навчальних закладів можуть зосередитися на архівуванні колекцій профільних мережевих інформаційних ресурсів, а обласні універсальні наукові бібліотеки — на зборі зібрань регіональної інформації. Національні бібліотеки мають акцентувати увагу на архівування "мережевої україніки" з природничих, технічних і гуманітарних наук, а також на інформації про Україну та публікаціях українською мовою за межами держави. Вони мають взяти на себе координуючі функції і завдання створення зведеного довідково-пошукового апарату національного архіву "мережевої україніки". Цей апарат доцільно реалізувати за схемою, що передбачає поєднання метаданих про колекції електронних публікацій з повнотекстовим індексуванням наявних масивів інформації у галузевих та регіональних бібліотеках. Отже, в основі організації робіт з формування національного архіву "мережевої україніки" — кооперативна підготовка його складових спільними зусиллями провідних інформаційних інституцій держави і централізоване формування інтегрованого довідкого-пошукового апарату.
Програма веб-обзервер НБУВ – архівування тематичне за участю бібліотечних працівників
Крім цього у НБУВ триває робота з формування Інтранет-середовища, що містить колекції наукових і суспільно значущих документів, які є часткою українського сегменту Інтернет.
Проект "Інтранет/екстранет-ресурси" започатковано 2005 року. Він спрямований на поширення меморіальної та комунікативної функцій бібліотек на мережеві джерела інформації. Інтранет/екстранет-ресурси формуються в процесі моніторингу й архівування наукової та суспільно значущої інформації українського сегмента інтернет, вибіркового архівування зарубіжних загальнодоступних джерел інформації, а також шляхом опрацювання інформаційних ресурсів на компакт-дисках. Станом на 2008 р. інформаційне ядро інтранет/екстранет-середовища Національної бібліотеки України імені В. І. Вернадського включало: 50 універсальних, галузевих і тематичних енциклопедій та довідників; 30 зібрань наукової та науково-популярної літератури; 350 найменувань наукових журналів з загальною кількістю річних комплектів понад 1,5 тис.; 20 мультимедійних серіалів (документальні та науково-популярні фільми, аудіовізуальні матеріали); 20 музейних колекцій; зібрання художньої літератури (українська та російська класика); добірка навчальної літератури (кілька тисяч підручників і посібників); значне зібрання матеріалів з бібліотечної справи та науково-інформаційної діяльності. Доступ до інтранет/екстранет-ресурсів надається лише безпосередньо в Бібліотеці та в установах, що підключені до УАРНЕТ (Українська академічна і дослідницька мережа). Передбачається інтеграція в створюване інформаційно-телекомунікаційне середовище всіх зацікавлених інституцій, які візьмуть на себе зобов'язання надавати доступ до цих ресурсів виключно в своїх читальних залах і за відсутності довільного копіювання електронних публікацій. З урахуванням вищевикладеного можна зробити такі висновки щодо основних концептуальних положень формування архіву "мережевої україніки": 1. Складовими національного архіву мережевих інформаційних ресурсів мають стати: o наукові та суспільно значущі документи українського сегменту глобальних інформаційних мереж; o зарубіжні наукові ресурси з пріоритетних напрямів інноваційної діяльності в Україні та суспільно значущі іноземні публікації щодо України; o публікації українською мовою та українців і українських інституцій у світових інформаційних мережах. 2. В основу технології формування "мережевої україніки" доцільно покласти поєднання принципів корпоративної підготовки його тематичних складових спільними зусиллями провідних інформаційних інституцій держави з централізованим формуванням інтегрованого довідково-пошукового апарату, який слід реалізувати за схемою, що передбачає поєднання деталізованих метаданих про зібрання електронних публікацій з повнотекстовим індексуванням наявних масивів інформації. 3. Значна увага приділяється опису й каталогізації інтернет-ресурсів на основі Дублінського ядра метаданих. Ця система метаданих є простою й водночас універсальною моделлю опису інформаційних ресурсів, що трактується досить широко. Фактично, за допомогою Дублінського ядра метаданих можна описати будь-який документ або масив документів, а також будь-який файл, у тому числі й розповсюджуваний через інтернет. 4. Правовим підгрунтям для архівування "мережевої україніки" глобальних комп'ютерних мереж можна вважати постанову Кабінету Міністрів України щодо розвитку діяльності Національної бібліотеки України імені В. І. Вернадського. При архівуванні зарубіжних ресурсів сьогодні слід орієнтуватися на ліцензії Creative Commons і суспільні ліцензій GNU (General Public License). 5. Обсяги мережевих інформаційних ресурсів, що мають архівуватися, на кілька порядків перевищують традиційний документальний потік бібліотеки. Це унеможливлює їхне опрацювання методами, що використовуються для друкованих матеріалів. Бібліотека має освоїти інтегрований технологічний цикл, що включає послідовність наукоємних процесів комп'ютерної обробки документальних масивів: бібліографування, реферування, підготовки аналітичних матеріалів, проведення статистичних досліджень (бібліо-, інформо-, наукометричних) як передумову для виділення зі сховищ даних нових знань. Це — визначальна ідеологема технологічного розвитку бібліотеки на довготермінову перспективу. утім, не маючи таких потужних можливостей і державної та громадської фінансової підтримки, вони шукають і інші шляхи вирішення питання комплектування інформацією інтернет-середовища, налагоджуючи співпрацю з різноманітними громадськими об’єднаннями, установами та організаціями, готовими надати зібрані і систематизовані ними власні цифрові й електронні колекції. Зокрема Національна історична бібліотека України є партнером видавництва «Варто», яке спеціалізується на випуску книг та мультимедійної продукції про Київ і Україну і на разі виступає організатором відкритого інтернет-проекту «Київ. Фотолітопис» (photohistory.kiev.ua), запрошуючи до співробітництва усіх небайдужих киян, києвознавців, працівників музейних установ та власників домашніх архівів [3]. Зібрана колекція включає скани кількох тисяч книг, журналів і газет київської тематики, що видавались з середини ХІХ ст. до нашого часу, більше вісімдесяти карт Києва, серед яких є унікальні, які ніколи раніше в Україні не публікувалися, фотобанк з 15 000 фотографій, 4000 листівок, 1500 малюнків, а також кілька десятків годин відео та кінохроніки. Організатори проекту наголошують на готовності надати матеріали зібраних колекцій для спільних або сторонніх проектів. Додаткові можливості для поповнення фондів бібліотек інформацією, що становитиме частку «національної пам’яті», відкриває використання вікі-технологій (веб-2). Впровадження бібліотеками мультимедійних сервісів, таких як фото (Flickr.сom, foto.Mail.ru), відео (YouTube.com) та аудіо (i-Tunes), що дає змогу користувачам максимально легко завантажити фото-, відео- та аудіоінформацію (з мобільного телефону або іншого джерела) на сайт бібліотеки, створює умови для залучення користувачів до співтворення бібліотечних ресурсів та сприяє збагаченню бібліотечних фондів, про що свідчить приклад реалізації Бібліотекою Конгрессу США спільно з хостером фотографій Flickr.com проекту зі створення віртуальної фотоколекції 30-40-х років минулого століття (понад 3 тис. фотографій), в процесі якої користувачами робились мітки (теги), коментарі й нотатки на викладених на сайті фотографіях, що містили невідомі об’єкти, задля створення їх повного бібліографічного опису. Проект наочно продемонстрував можливості використання сучасних технологій у процесі оптимізації керування знаннями в бібліотечній сфері, оскільки створив умови для трансформації «прихованих» знань у наявні з їх подальшим оформленням у даному випадку у вигляді уточнених бібліографічних описів [2, с. 212–213]. При цьому ефективним для бібліотек у процесі формування фондів та їх комплектування новими документами може стати співробітництво в рамках соціальних медіа. Зокрема, це стосується тематичних колекцій. Так, на сайті НБУВ представлена тематична колекція «Історичний Київ», яка містить карти, альбоми, адресні книги, монографії стосовно Києва та киян. Для поповнення колекції новими матеріалами корисним може стати налагодження взаємодії з такими представленими в мережі Facebook спільнотами, як «Всесвітній клуб киян» [5] або «Це Київ, ляльо, незвичний Київ» [16], на сторінках яких розміщують фото, малюнки, поштові листівки, цікаві факти та оповіді з історії Києва. Часто, хоча і не завжди, у постах міститься посилання на джерело. Комплексного характеру інформації, що розміщується в постах, надають коментарі відвідувачів, які мають змогу поділитись власними відомостями щодо зображених об’єктів, додати фото і відео по темі посту. Наприклад, під фото «Гавань, 1959 рік. Трамвай маршруту № 27, кінцева станція "ГЕС-2"» на сторінці «Це Київ, ляльо, незвичний Київ» відвідувачем було розміщено коментар з посиланням на ресурс «Памяти киевских трамваев:: Фотогалереи:: Времена» (http://www.mashke.org/kievtram/pictures/gallery1.php?g=historic/), на якому представлено історію київських трамваїв ХХ ст. у кольорових фото.
Крім цього архівування певної частки інформації інтернет та соціальних медіа можливе шляхом підготовки бібліотечних інформаційно-аналітичних продуктів, підготовлених на базі такої інформації. Про це – в наступній лекції. [i] От английского harvest – собирать урожай [ii] От английского to crawl - ползти [iii] Дж. Анжелаки. «Обязательное хранение цифровых материалов в государствах-членах Европейского Союза: обзор законодательства и правоприменительной практики» // Библиотеки в правовом пространстве. Современные проблемы. Сборник статей. - СПб, 2008. – С. 124 - 168 [iv] http://www.langzeitarchivierung.de/eng/index.htm (на англ. и нем. яз.) [v] http://kopal.langzeitarchivierung.de/ (на англ. и нем. яз.) [vi] http://netarchive.dk/index-en.php (на английском и датском яз.) [vii] http://www.nlc.gov.cn/en/indexen.htm (на английском и китайском яз.) [viii]http://www.inforum.cz/archiv/inforum2003/prispevky/Jodelis_Remigijus.pdf (на английском яз.) [ix] http://www.kb.nl/hrd/dd/index-en.html (на английском яз.) [x] www.natlib.govt.nz/ndha (на англ. яз.) [xi] http://www.ifla.org/files/hq/papers/ifla75/146-carnaby-en.pdf [xii] Джон Г. Мохи «Национальный архив цифрового наследия» // Языковое и культурное разнообразие в киберпространстве. Сборник материалов Международной конференции (Якутск, 2 – 4 июля 2008 г.) / Сост. Кузьмин Е.И., Плыс Е.В. - МЦБС, 2010. с. 398 - 404 [xiii] Джон Г. Мохи «Национальный архив цифрового наследия» // Языковое и культурное разнообразие в киберпространстве. Сборник материалов Международной конференции (Якутск, 2 – 4 июля 2008 г.) / Сост. Кузьмин Е.И., Плыс Е.В. - МЦБС, 2010. с. 398 - 404 [xiv] http://archive.ifla.org/IV/ifla71/papers/151r_trans-Rustad.pdf (на русском яз.) [xv] http://www.fccn.pt/ (на португальском и английском яз.) [xvi] http://www.arquivo.pt/?query=&dateStart=&dateEnd=&l=en (на португальском и английском яз.) [xvii] http://www.bl.uk/aboutus/stratpolprog/coldevpol/index.html (на англ. яз.) [xviii] http://www.webarchive.org.uk/ukwa/ (на английском яз.) [xix] Аналог закона «Об обязательном экземпляре документов» [xx] http://web.archive.org/web/20041010005510/www.lib.helsinki.fi/eva/english.html (на английском и финском яз.) [xxi] http://www.iwaw.net/ на английском яз. [xxii] http://en.webarchiv.cz/ на английском яз. [xxiii] http://www.nkp.cz/_en/index.php3 на английском яз. [xxiv] http://www.leninka.ru/index.php?f=190 [xxv] См. документацию и библиографию по протоколу Z39.50 на http://z3950.ruslan.ru/ [xxvi] Metadata Harvesting protocol of the Open Archives Initiative (OAI-PMH) – сетевой протокол, который посредством обращений к серверам собирает метаданные о каждом хранящемся на них документе. Подробнее см. Филозова И. А. Открытые архивы научной информации // Электронный журнал «Системный анализ в науке и образовании» – 2010. – №1, http://www.sanse.ru/archive/15
|