четверг, 22 июля 2010 г.

Сканирование книг это не просто создание цифровой библиотеки.

Библиотека Американского Университета Иллинойса - один из крупнейших партнеров в различных проектах по оцифровке книг.

Уже более 23000 книг переведены в электронный вид в сотрудничестве с Internet Archive, некоммерческой цифровой библиотекой.

Библиотека оцифровывает книги главным образом по следующей причине. "Мы хотим, чтобы исходный материал - старые книги, был более доступен для ученых, а текстовая информация - содержимое этих книг, был удобен для поиска и восприятия", - утверждает Beth Sandore, ответственный за информационные технологии в библиотеке Университета. Таким образом, сканирование книг не просто увеличивает количество цифровой информации, а имеет историческое общечеловеческое значение и служит делу сохранения и приумножения культурного наследия.

"Возможность поиска по тексту книги является большим преимуществом оцифрованного текста", - считает Бетси Крюгер (Betsy Kruger), глава отделения цифрового контента. "Вы сами решаете, хотите ли вы открывать книгу, прежде чем идти в библиотеку".

В дополнение к работе университета с Internet Archive, библиотека университета также является частью организации Committee on Institutional Cooperation (CIC), которая сотрудничает с Google в рамках усилий по оцифровке огромного количества книг, которые будут доступны в Google Books.

В соответствии с пресс-релизом Google в июне 2007 года, компания планирует перевести в электронный вид около 10 миллионов книг.

Крюгер говорит, что первым делом сканируются самые ценные книги библиотеки, среди которых много экземпляров, изданных в 17 и 18 веке. Эти книги очень проблематично массово изучать, несмотря на то что в них содержится много важной информации. Потоковое сканирование книг дает доступ к этим материалам всем ученым мира.

CIC оцифровывает книги, переходя от одного университета к другому со специальным оборудованием для сканирования книг. Сейчас организация работает в Университете Иллинойса, где для оцифровки было подготовлено множество томов. CIC планирует через пять или шесть месяцев перейти в другой университет.

CIC также занимается сканированием правительственных документов - например такие, как слушания конгресса и доклады. Кроме того, массово сканируются местные газеты, например в Иллинойсе, были оцифрованы номера начала 20 века The Daily Illini и Urbana Daily Courier. Это позволяет хранить местную историю в надежном виде и легко осуществлять поиск в публикациях.

Только в сотрудничестве с Internet Archive Университет Иллинойса планирует сканировать 5000 книг в год, несмотря на то что это дорогостоящий процесс. В цену оцифровки входит еще и обработка файлов, форматирование и системы хранения данных. Это очень актуально для такого графического материала как карты. Одна широкоформатная карта после сканирования может занять до двух терабайт данных.

В среднем, у Библиотеке Иллинойса сканируется около 500 страниц в час с помощью специализированных книжных сканеров. Эти устройства очень бережно оцифровывают материал, однако есть такие ветхие документы, которые опасно доверять даже такому сканирующему оборудованию.

"Мы строим библиотеку будущего, сохраняя материал для ученых на несколько столетий вперед", - уверенно говорит Крюгер.

Источник: dailyillini.com

Комментариев нет:

Отправить комментарий