Якою не бути бібліотеці майбутнього

Попри те, що архіви ростуть як гриби, оцифровування і зберігання контенту в найкращому випадку відбувається з прогалинами.

Вільгельм Завойовник у 1086 року провів загальний поземельний опис Англії та Уельсу. «Книга Судного дня», як стали називати це зібрання відомостей, містила детальну інформацію про 13 418 дрібних населених пунктів і 112 міст, і її все ще можна побачити в Національному архіві в Лондоні. Цього не скажеш про оригінальну версію нового реєстру, замовлену до 900-ї річниці «Книги Судного дня». Записували її на спеціальних 12-дюймових лазерних дисках. Нині цей формат уже застарів.

Цифрова ера принесла із собою обіцянку безмежної пам’яті. Збільшення потужності комп’ютерів та місткості дисків, з одного боку, і зменшення вартості, із другого, мали б забезпечити вічне зберігання будь-яких даних у цифровому форматі. Але вони інколи мають навдивовижу короткий вік. «Якщо ми не перейматимемося цим, то, можливо, більше знатимемо про початок ХХ століття, ніж про початок ХХІ-го», – каже Адам Фарквер, відповідальний за оцифровування і зберігання інформації в Британській бібліотеці.

Британська бібліотека. Фото: nbuv.gov.ua

Найочевидніші проблеми для цифрових архіваріусів пов’язані з технічним оснащенням, але водночас вони й найлегші для вирішення. Багато архівів кожні три-п’ять років оновлюють свої системи зберігання даних, щоб убезпечити їх від застаріння та виходу з ладу. Це не настільки дорого, як здається: накопичувачі дешеві й надійні. Загрозу відмови техніки теж подолано: копії зберігаються в різних місцях. Британська бібліотека має сховища в Лондоні, Йоркширі, Уельсі й Шотландії.

Важче добувати цифровий матеріал, особливо онлайн. Архіваріуси можуть збирати інформацію в тих сегментах «павутиння», де є вільний доступ. Щойно користувач натрапляє на вимогу ввести пароль, задати пошук або заповнити форму, як інформація стає недосяжною. Більше проблем із фіксацією потокових медіа, як-от онлайн-відео.

Вінт Серф – батько інтернету. Фото: kommersant.ru

Ще більше перепон створюють зміни в програмному забезпеченні й форматах файлів. «Багато створених нами цифрових об’єктів можна передавати лише за допомогою того софту, яким його було зроблено», – каже Вінт Серф, першопроходець інтернету, який нині працює в корпорації Google. Якщо вже немає оригінальної програми, цілий архів файлів у ідеальному стані буде непридатний. Коли програмному забезпеченню вже понад 10 років, для його використання потрібна емуляція старіших версій апаратного забезпечення.

Хоча зазвичай технічні проблеми надаються до вирішення, регуляторні перепони долати важче. Закони змушують книгосховища, які шанують авторські права (як-от Бібліотека Конгресу США), просити дозволу для того, щоб заархівувати будь-який веб-сайт. Умови можуть бути ще суворіші, коли йдеться про зберігання комп’ютерних програм, ігор, музики та книжок. Їх часто випускають із технічними засобами захисту авторських прав (англ. DRM, Digital Rights Management), щоб убезпечити від піратства. Архіваріуси, які хочуть обійти ці програми, можуть таким чином порушити закон.

Із розвитком інформаційних систем захист авторських прав і технічні засоби для цього набуватимуть іще більшої ваги. Спочатку наперед було зрозуміло: інтернет – це відкрите середовище, що полегшує копіювання. Мобільний світ з усіма його популярними прикладними програмами для смартфонів набагато закритіший. Компанії чимдалі завзятіше оберігають свою програмну продукцію, внаслідок чого підвищується ризик, що деякі цифрові артефакти ніколи не будуть заархівовані. Бібліотеки не мають дозволу збирати прикладні програми на зразок Angry Birds або Instagram, які становлять частину популярної культури.

Попри всі ці труднощі, книгосховища цілого світу понад десятиліття намагаються зберегти деякі аспекти свого національного цифрового надбання. Бібліотека Конгресу США започаткувала програму збереження оцифрованого контенту в 2000 році, отримавши від держави $100 млн. Нині в її веб-архіві зберігається близько 10 тис. сайтів, багато з яких належать американському урядові, а тому не підпадають під дію закону про охорону авторських прав. Приватні сайти включати до своїх фондів важче. У деяких архівних проектах на електронне повідомлення із запитом про дозвіл копіювати відповідає лише п’ята частина веб-майстрів.

ЦИФРОВІ ПЛЮШКІНИ

Інтернет-архів. Фото: gizmodo.com

Услід за Бібліотекою Конгресу більшість національних книгосховищ у багатих країнах започаткували свої цифрові фонди в тому чи тому вигляді. Наприклад, у Сполученому Королівстві Національний архів зберігає копії всіх урядових веб-сайтів. Британська бібліотека архівує всі онлайн-матеріали країни.

Проте найвідомішою програмою з оцифровування і збереження контенту можна назвати Internet Archive – приватну неприбуткову цифрову бібліотеку. На її серверах установлено своєрідну «машину часу» Wayback Machine – популярний веб-сервіс, який дає змогу побачити, як змінювався з часом певний веб-сайт. Заснований Брюстером Кале 1996 року, Internet Archive збирає і зберігає мільярди веб-сторінок та інших цифрових медіа (як-от книжки, відео й софт) і надає до них доступ. Фонди налічують приблизно 160 млрд веб-сторінок. Архів працює за принципом: краще просити вибачення, ніж дозволу.

Зовсім недавно комп’ютерні ботани кинулися туди, куди бояться заходити офіційні агенції. Вони завжди підбирали все, що треба й не треба. Нині вони зосереджуються на веб-сайтах на зразок TOSEC (англ. The Old School Emulation Centre), де збирають старий софт. Але ці колекції мають свої власні обмеження. Вони переважно зациклюються на іграх та операційних системах; зазвичай люди не відчувають такої ностальгії за програмами електронних таблиць, як за грою «Супер-Маріо». Тим більше, цей матеріал ретельно охороняє закон про авторські права.

Попри те, що архіви ростуть як гриби, оцифровування і зберігання контенту в найкращому випадку відбувається з прогалинами. Доки законодавство не наздожене технології, цифрову історію доведеться складати докупи по шматочку – замість величезних масивів інформації, які обіцяла цифрова епоха.

Тиждень