литература | сокращения |
В.А.ГЛУХОВ, О.Л.ЛАВРИК
РАСПРЕДЕЛЕННЫЕ ЭЛЕКТРОННЫЕ БИБЛИОТЕКИ
Библиотеки были изобретены человечеством, чтобы хранить документальные источники и предоставлять их в общественное пользование. Библиотеки и занимались комплектованием документов в формах, присущих каждой конкретной эпохе – глиняных табличках, папирусных свитках, рукописях, печатных изданиях и, наконец, изданиях на электронных носителях.
Библиотечные Интернет -технологии
Развитие сети Интернет поставило перед каждой библиотекой задачи, которые условно можно разделить на две группы : 1) организация удаленного доступа к письменным источникам, хранящимся в библиотечных фондах ; 2) обеспечение доступа для своих читателей к “чужим ” информационным ресурсам, доступным через Интернет.
Если проанализировать развивающиеся сейчас направления библиотечных работ, связанных с Интернетом то можно заметить, что первая группа задач решается главным образом за счет :
– обеспечения доступа к собственным электронным каталогам, проблемно-ориентированным библиографическим базам данных, сводным каталогам библиотек, а также организации доступа к каталогам различных библиотек по сетевым поисковым протоколам типа Z39. 50;
– публикации в Интернете электронных версий специализированных библиотечных изданий (журналов, библиографических списков, указателей литературы, каталогов выставок и т.д.);
– создания полнотекстовых баз данных (включающих как издания самих библиотек, так и электронные версии книг и журналов из их библиотечных фондов ) и обеспечения поиска в этих массивах через Интернет ;
– предоставления услуг по электронной доставке документов и электронному межбиблиотечному абонементу.
Российские библиотеки и информационные центры получили возможность работы с Интернетом не так давно, примерно в 1996-1997 гг. Таким образом, теоретические и практические разработки в этой области, по сути, только начинаются. Прежде всего, они сосредоточены на обеспечении доступа к электронным каталогам и базам данных для удаленных пользователей библиотек. Это каталоги таких организаций, как БЕН (http://ben.irex.ru), ГПНТБ СО РАН (http://info.spsl.nsc.ru), ГПИБ (http://www.shpl.ru/), ГПНТБ России (http://www.gpntb.ru/), ИНИОН РАН (http://www.inion.ru/), ЦНСХБ (http://www.cnsxb.ru/), НБ МГУ (http://www.msu.su/), ряда региональных и вузовских библиотек. Поиск можно провести и в электронном каталоге РГБ (http://www.rsl.ru/), но лишь по поступлениям последних лет.
Многие библиотеки публикуют на своих wеb-страницах текстовые файлы со списками библиографических указателей различных типов, дают перечни предоставляемых продуктов и услуг, рекламируя собственные информационные ресурсы, издания, которые они могут поставлять в традиционных режимах, открывают так называемые “электронные магазины ”.
Полнотекстовых баз данных электронных журналов, представляющих интерес не только для библиотекарей, на web-страницах библиотек практически нет. Чаще всего это труды сотрудников данной библиотеки и периодические издания по библиотечной тематике. Лишь ВИНИТИ, ИНИОН и ВНТИЦ публикуют полные версии некоторых из издаваемых ими научных журналов, но эти организации и не являются чисто библиотечными учреждениями.
С другой стороны, работы по оцифровке фонда источников начинаются сейчас во многих библиотеках. Создается хранилище электронных текстов источников в ИНИОН. В ГПНТБ СО РАН создана полнотекстовая БД прижизненных изданий А.С.Пушкина, завершается работа над электронной коллекцией аналитических обзоров по экологии. Не слишком большие достижения библиотек в этой области объясняются не только отсутствием у них достаточной материально -технической базы, но прежде всего проблемой соблюдения авторских прав. В обычной практике библиотеки редко принимают во внимание эту проблему, например, ксерокопируя источники по заказам своих читателей. То же копирование, только в электронном виде, не говоря уже о создании хранилищ
электронных копий книг и журналов из библиотечных фондов и предоставление доступа к ним через Интернет, является нарушением существующих законодательных актов в области авторского права, весьма, надо сказать, несогласованных. Именно поэтому библиотеки сейчас выставляют в Интернете главным образом собственную продукцию, а она, за исключением библиографических указателей и списков литературы, ориентирована только на библиотекарей.
Технологию электронной доставки документов (ЭДД ) освоили в экспериментальном режиме все крупнейшие библиотеки страны. ЭДД обеспечивает удаленный доступ к источникам, хранящимся в традиционном виде. В упрощенном виде здесь действует следующая схема : читатель обращается в свою библиотеку с просьбой заказать копию статьи из журнала, который она не выписывает. Заказ по электронной почте или через Интернет направляется в ту библиотеку, которая может его выполнить.
Источник сканируется, и электронная копия пересылается библиотеке -посреднику. Читателю выдается либо распечатка, либо файл на дискете. Некоторые библиотеки (ИНИОН, РГБ, ГПИБ ) имеют интерфейс, позволяющий удаленному пользователю напрямую оформить заказ у исполнителя, минуя посредника – местную библиотеку.
Несмотря на весьма простую и не очень затратную технологию, не так много библиотек перешли на промышленный режим ЭДД. К ним можно отнести (помимо уже упоминавшихся ИНИОН, РГБ и ГПИБ ) ВИНИТИ, ГПНТБ СО РАН, ЦНСХБ (1). Эти библиотеки, а также БАН, БЕН, ВПТБ, ВНТИЦ и некоторые другие сейчас объединяются в Ассоциацию российских служб ЭДД, целью которой является взаимодействие в обеспечении своих читателей и удаленных пользователей электронными копиями первоисточников из библиотечных фондов. На первом этапе Ассоциация будет работать по следующей схеме. Любой читатель может обратиться за электронной копией в любую библиотеку, входящую в Ассоциацию. Заказ по электронной почте методом общей рассылки будет направлен сразу всем библиотекам – членам Ассоциации. Библиотеки определяют, кто из них может выполнить заказ, и сообщают отправителю. Затем изготавливается копия и передается библиотеке - заказчику, которая в свою очередь передает ее читателю. Таким образом, читатели смогут через интерфейс ЭДД на сервере РГБ или ИНИОН заказать копию статьи, которая будет сделана, например, в ГПНТБ СО РАН в Новосибирске или в БАН в Санкт -Петербурге.
Несмотря на появление электронной доставки документов, библиотеки продолжают совершенствовать межбиблиотечный абонемент. Развивается так называемый электронный МБА. Так, на протяжении двух лет стабильно работает встроенный в электронные каталоги БЕН, ГПНТБ СО РАН и др. модуль заказа по МБА через Интернет (2, 3).
Однако если мы внимательно посмотрим на описанные выше направления деятельности библиотек в Интернете, то можем заметить, что это всего лишь новые технологические решения традиционные библиотечных процессов. И предоставление удаленного доступа к собственным электронным каталогам, библиографическим, фактографическим и даже полнотекстовым базам данных, и заказ, и выполнение услуг по каналам связи, и МБА – в принципе все это имело место и до появления Интернета. С развитием техники и телекоммуникаций эти направления традиционной библиотечной деятельности лишь поменяли форму своей реализации.
Работа библиотек с ресурсами Интернета
Решение второй группы задач – предмет активных дискуссий библиотекарей - практиков и библиотекарей -теоретиков. С ней связано также появление термина “Internet-librarian”. Помимо очевидного направления работы – поиска информации (библиографической, фактографической, полнотекстовой ) в Интернете, выполнения справок по заказу удаленных пользователей и своих читателей, – библиотеки начали каталогизацию ресурсов Интернета. Эта работа первоначально развивалась (и продолжается до сих пор ) как публикация на web-страницах аннотированных или неаннотированных списков ссылок на различные информационные ресурсы. Не имея возможности приобрести и сохранить саму информацию, библиотеки таким образом пытаются хотя бы обеспечить своим пользователям удобную навигацию в сети Интернет.
Однако накопление библиотеками таких ссылок и особенно поддержание их в актуальном состоянии весьма неэффективно. По опыту работы ряда библиотек средний срок нахождения информации по конкретному адресу – полгода (4). Правда, сейчас появились программы -роботы, позволяющие отслеживать ссылки, удерживать их в актуальном состоянии (см., например, (5)). Кроме того, как правило, ссылки создаются на весь информационный ресурс или его крупные части, а этого явно недостаточно. Если мы делаем ссылку, скажем, на электронное хранилище полных текстов журналов или книг, то что мы сообщаем пользователю ? Информацию о том, что существует такой ресурс, не более. Это все равно, что сказать : “Ступайте в ближайшую библиотеку, там есть литература по интересующей вас теме ”. Допустим, мы не просто сообщаем пользователю о существовании таких электронных коллекций, но и публикуем у себя перечень журналов и книг, которые они содержат. Это уже лучше, но все же мы опять отсылаем пользователя к этой электронной коллекции, предоставляя ему возможность самому отыскать конкретные публикации.78 Ниже мы еще вернемся к этому вопросу.
Что же принципиально нового может появиться и появляется в работе библиотек с использованием и развитием сети Интернет ? Возможно, в скором времени станет практикой архивирование самих информационных ресурсов Интернета. Прежде всего – это работа по описанию, учету, а возможно, и сохранению резервных копий этого нового вида информационных ресурсов – так, как это делается с обычными печатными изданиями в библиотеках и архивных хранилищах. Как мы уже говорили, это социальная задача библиотек, и сейчас она просто должна распространиться на новый вид ресурсов.
Создатели этих ресурсов, так же как и издатели традиционных книг и журналов, в меньшей, чем библиотеки, степени ориентированы на сохранение электронных ресурсов для потомков. Пока, однако, этот вопрос даже не ставится, а его решение имеет массу сложностей – научных, организационных, правовых и технических.
Распределенные электронные библиотеки
Еще одно направление работы – создание электронных библиотек – пошло по пути оцифровывания печатных источников и приобретения прав на электронные источники у издателей. При этом электронные фонды таких библиотек, как правило, автономны, замкнуты и расширяются лишь за счет тех же списков ссылок на другие ресурсы. Такие библиотеки состоят из разнородных информационных массивов – электронных каталогов, библиографических, фактографических, полнотекстовых баз данных, справочно-нормативных массивов и т.д. Пользователь, попадая в такую виртуальную автономную библиотеку, ограничен ее рамками и вынужден искать недостающую информацию (например, библиографические данные или полные тексты документов ) за пределами такой коллекции, используя ссылки на некий совокупный ресурс.
Конечно, создание подобного рода электронных библиотек является необходимым шагом, однако разработка таких локальных информационных продуктов, как нам кажется, – тупиковый путь развития. Поэтому необходимо создание библиотек, обеспечивающих пользователей связями между элементами как своих, так и совокупных ресурсов, находящихся за их пределами.
В этой связи предлагаем рассмотреть следующую модель электронной библиотеки. В отличие от традиционных библиотечных хранилищ, где фонд источников отделен от справочно-поискового аппарата в виде карточных каталогов, электронные библиотеки составляют единое целое, части которого связаны друг с другом, например, ссылками -библиографические описания с полными текстами. Помимо этих внутренних ссылок между частями отдельной электронной библиотеки создаются ссылки на внешние относительно данной коллекции ресурсы, причем не на отдельный информационный ресурс Интернета в целом, а на составляющие его единицы, например, конкретную статью из электронного журнала или другую публикацию, хранящуюся в полнотекстовой базе данных. Например, журнальные статьи из полнотекстовых баз данных с пристатейными списками литературы должны иметь ссылки, связывающие данную статью с полными текстами источников, которые в ней упоминаются. Эти ссылки или связи могут быть установлены между источниками, хранящимися как внутри одного электронного фонда, так и в разных коллекциях (рис. 1).
Подобный продукт может создаваться следующим образом. Любая научная публикация содержит некоторое число ссылок на использованную литературу. Вполне реален вариант, когда при подготовке научной работы автор заказывает и получает электронные копии, причем изготовитель этих копий обеспечивает их хранение ; либо при подготовке рукописи используются статьи из электронных версий журналов и т.д. Такая публикация, представленная в Интернете (например, статьей в электронной версии журнала ) и снабженная списком литературы, может быть связана через гипертекстовые ссылки с электронными копиями цитируемых публикаций, которые находятся в доступных через Интернет хранилищах, так же как и со статьями из электронных журналов.
Технологической основой к созданию такого информационного продукта может служить, в частности, технология электронной доставки документов. Главное то, что эта технология позволяет объединить разобщенные информационные ресурсы и преодолеть пространственные барьеры между ними.
Рис. 1. Связи между элементами распределенной электронной библиотеки
Такую библиотеку можно назвать распределенной электронной библиотекой.
Распределенная электронная библиотека – это совокупность логически и технологически связанных между собой документов из различных электронных коллекций и отдельных информационных ресурсов , доступных через Интернет.
Что следует включать в состав фонда такой библиотеки , какие связи с другими ресурсами она должна обеспечивать?
Нам представляется, что распределенная электронная библиотека может характеризоваться :
– принципами отбора документов (комплектования );
– способами создания связей между элементами ;
– методами формирования электронного фонда.
Что касается принципов отбора документов , то из опыта работы с информационными ресурсами Интернета следует , что части фонда распределенной электронной библиотеки должны быть элементами профессионально создаваемых и постоянно поддерживаемых информационных ресурсов. Точно так же , как традиционные библиотеки не включают в свои фонды некоторые виды печатной продукции (что определяется , конечно , статусом библиотеки ), – так и распределенные электронные библиотеки должны охватывать не все информационные ресурсы , а лишь те из них , которые входят в область интересов их пользователей.
Основной проблемой при создании подобной библиотеки является генерация гипертекстовых ссылок на внешние ресурсы и их фрагменты – связей между распределенными в пространстве элементами электронных библиотек. Сложность заключается в том , что пока не существует уникального идентификационного номера электронной публикации в Интернете наподобие ISSN или ISBN, хотя разработки в этой области ведутся как издателями , так и библиотечным сообществом.
Определенные надежды здесь возлагаются на описания типа Dublin Core (6), хотя , как нам кажется , это совершенно необоснованно , и вот почему. Во -первых , пока эти описания не распространяются на динамически формируемые документы из баз данных и , во -вторых , сама процедура описания отдается на откуп создателям Интернет -ресурсов. Вспомним , чем закончились попытки обязать авторов и издателей книг делать библиографические описания на свои произведения. Как правило , эти описания непригодны для использования в библиотеках , потому что создаются непрофессионалами в этой области. С Dublin Core дело обстоит еще сложнее , поскольку предполагается , что авторы будут сами индексировать свои электронные издания. С результатами подобного “самоиндексирования ” может ознакомиться каждый , кто хоть раз пытался найти ссылки в поисковых системах типа Yahoo или Rambler. Поэтому , как нам кажется , до тех пор пока не разработаны надежные средства описания информационных ресурсов Интернета , следует сосредоточить усилия на разработке систем автоматического обнаружения и описания этих ресурсов , средств эвристического поиска.
Очевидно , что сопряжение элементов распределенных электронных библиотек (процедура установления ссылок между их частями ) должно осуществляться автоматически , поскольку , во -первых , только так могут быть учтены все связи , и , во-вторых , это должно позволить поддерживать их в актуальном состоянии -так как элементы электронной библиотеки меняют свое местоположение , добавляются новые документы и т.д. То же относится и к связям , которые устанавливаются между документами локального электронного фонда. Такие разработки сейчас ведутся рядом российских библиотек.
Методы формирования распределенных электронных библиотек могут быть различными. Условно их можно назвать прямым и косвенным. Прямой метод заключается в том , что части таких библиотек формируются как результат совместной деятельности , т.е. целенаправленно создается распределенный электронный фонд. Так , при подготовке некоторых изданий , составляющих основу специализированной электронной библиотеки, могут быть оцифрованы источники , необходимые для их написания. Эти источники входят затем в состав электронного фонда копий публикаций другой электронной библиотеки и могут быть связаны ссылками с текстами первой коллекции. Такой метод формирования распределенного фонда наиболее продуктивен, поскольку повышается качество отбора документов в фонд библиотеки.
Косвенный метод заключается в том, что автоматически устанавливаются отсылки от документов фонда одной электронной библиотеки и их структурированных частей к документам других электронных библиотек. Для этого должны быть разработаны системы справочников, описывающих структуры этих библиотек и эвристические программы обнаружения электронных информационных ресурсов.
Отметим, что в подобных библиотеках может существовать два вида ссылок – внутренние, связывающие части одной коллекции между собой, и внешние, которые устанавливаются между элементами различных коллекций.
Рассмотрим теперь конкретный пример создания подобной библиотеки, базирующейся на использовании указанных методов. В качестве исходных электронных библиотек взяты :
– Электронная библиотека ИНИОН (http://www.inion.ru). Она состоит из библиографических баз данных, содержащих описания книг и статей из журналов, поступивших в библиотеку ИНИОН, а также хранилища электронных копий источников, отсканированных по заказам пользователей или в рамках специальных проектов;
– Научная электронная библиотека (http://library.intra.ru), созданная по инициативе Российского фонда фундаментальных исследований. Она содержит полные тексты статей свыше 350 зарубежных и отечественных электронных журналов ;
– Электронная коллекция ГПНТБ СО РАН по экологии http://info.spsl.nsc.ru/win/ecol/index.html, имеющая полные тексты аналитических обзоров, представленные в Интернете.
При подготовке обзоров ГПНТБ СО РАН по экологии проводились поиски информации по различным библиографическим базам данных, в том числе базам ИНИОН, а затем заказывались копии в службе электронной доставки документов этой организации.
В некоторых случаях в электронном хранилище ИНИОН оказывались полные тексты статей, которые заведомо процитированы в обзорах или указаны в списке литературы.
Таким образом, гипертекстовая ссылка от библиографического описания источника в списке использованной литературы к документу из электронного полнотекстового хранилища ИНИОН позволяет увязать документы из разных частей распределенной библиотеки.
Электронные тексты первоисточников, хранящиеся в ИНИОН, равно как и другие элементы двух электронных библиотек, в свою очередь имеют гипертекстовые отсылки, например, к другим работам автора обзора в этом же хранилище электронных копий, или – опять через список литературы – к другим хранилищам и базам данных.
Для подготовки обзоров также используются статьи из коллекции электронных журналов Научной электронной библиотеки. Через разрабатываемую сейчас систему справочников эти элементы распределенной электронной библиотеки также должны быть связаны друг с другом. Таким образом, формируются единые тематические или проблемно ориентированные информационные поля в рамках распределенной библиотеки. В нашем случае – по различным аспектам экологии и охраны окружающей среды. Сейчас ведутся работы по реализации этой технологии на примере создания информационных полей в области экономических и правовых аспектов охраны окружающей среды.
Полагаем, что сказанное выше открывает путь к созданию новых электронных библиотек на базе формально распределенных в пространстве информационных ресурсов – библиотек, создание которых принципиально невозможно в традиционной информационной среде.
Список литературы
1. Глухов В.А., Лаврик О.Л. Электронная доставка документов. – М.: ИНИОН РАН, 1999. – 132 с.
2. Каленов Н.Е, Власова С.А. Каталог книг и продолжающихся изданий ЦБС БЕН РАН в Интернете //Современные технологии в информационно -библиотечном обеспечении научных исследований : материалы 8-го научно -практического семинара (Таруса, 13-18 сентября 1999 г.). – М., 1999. – С. 100-102.; Соловьева С.А. Система баз данных на основе электронного журнального каталога БЕН РАН, доступная через Интернет // Там же. – С. 97-99.
3. Баженов С.Р., Баженов И.С., Мазов Н.А., Малицкий Н.А. Система обеспечения контроля и учета доступа изИнтернета к распределенным библиографическим базам данных // Библиотеки и ассоциации в меняющемся мире : новые технологии и новые формы сотрудничества. Материалы конф. Судак. Респ. Крым, Украина, 5-13 июня 1999 г. – М., 1999. – С. 226-228; Баженов С.Р., Новоженин А.Ф. Разработка системы решения информационно -библиотечных задач в ГПНТБ СО РАН с использованием Интернета // Библиотеки и ассоциации в меняющемся мире : новые технологии и новые формы сотрудничества. Материалы конф.Судак. Респ. Крым, Украина, 6-14 июня 1998 г. – М., 1998. – С. 265-267.
4. Кон Л.Ф., Дашенко В.В. Интернет в Новосибирской государственной областной библиотеке //Тезисы докладов Междунар. конф. “Интернет, общество, личность ”, Санкт -Петербург, 1-5 февраля 1999 г. – СПб, 1998. – С. 104-106.
5. Паринов С. Активный информационный робот как сетевой агент исследователя на примере онлайновых ресурсов по экономике RePEc/Ru/RuPEc // Электронные библиотеки : перспективные методы и технологии, электронные коллекции : Тр. первой Всероссийской научной конференции, С.-Петербург, 19-22 октября 1999 г. – СПб, 1999. – С. 104-111.
6. Шварцман М.Е. К вопросу каталогизации ресурсов Интернета // Мир библиографии. – 1998. – N5; Шварцман М.Е. Использование метаданных для каталогизации российских ресурсов Интернета //Электронные библиотеки. – 1998. – T. l, Вып. 2.
78 Форма представления информации на web-страницах библиотек носит несистемный характер с точки зрения распределения задач, аналогичного тому, которое сложилось в традиционной библиотечной среде и по линии Минкультуры, и РАН, не говоря уж о ГСНТИ. С одной стороны – имеет место массовое дублирование, начиная от web-адресов библиотек, причем не всегда полных и часто неточных, с другой – полное отсутствие систематизированных Интернет -ресурсов по тематике и проблемам, за информационную поддержку которых отвечает данная библиотека в традиционной системе. По нашей предварительной оценке, то, что библиотеки рекламируют и собирают на своих web-страницах – в 80% случаев имеет отношение к деятельности самих библиотек (данные о библиотеке, информация о конференциях, труды сотрудников, учеба, повышение квалификации и т.д.). Другими словами, web-страницы ориентированы в основном на библиотечное сообщество, а не на читателя, тем более – удаленного.