Интеллектуальная поисковая система «Единый электронный каталог» Государственной публичной исторической библиотеки России
В настоящее время интеллектуальная поисковая система является для библиотек все более востребованным решением, которое позволяет их читателям работать с электронными информационными ресурсами учреждения, осуществлять быстрый многоуровневый поиск. Интеллектуальная система поиска в библиотеке — это индивидуальная работа с каждым читателем, который в зависимости от своих задач и уровня подготовки может использовать этот инструмент в полной мере и наиболее эффективно для себя.
Интеллектуальная поисковая система становится своего рода показателем технологической зрелости библиотеки, а ее создание требует прохождения всех классических этапов автоматизации деятельности. Опыт успешного внедрения и использования интеллектуально-поисковой системы в Государственной публичной исторической библиотеке России (ГПИБ России) — пример такой технологической «истории успеха».
«...информационные технологии стали незаменимой составляющей библиотечного обслуживания. Удобным инструментом для нас и наших читателей является электронный систематический каталог библиографических записей. Мы получили возможность организовать удаленный доступ к информационным ресурсам библиотеки, упростить работу с ними».
Оксана Динеева, заместитель директора по обслуживанию читателей ГПИБ России в интервью журналу «Э.Док»
В 2002 году в ГПИБ России отсканированы карточки Генерального предметного каталога и создана имиджинг-система, наполненная более 900 тыс. графических образов. Система облегчила сотрудникам учреждения поиск и ускорила выдачу изданий пользователям библиотеки.
Затем сформирован и наполнен электронный систематический каталог библиографических записей. Работы по созданию электронного каталога ГПИБ России проведены поэтапно в соответствии с зарекомендовавшей себя на многих проектах технологической цепочкой, в которую входят экспертиза массива, сканирование каталожных карточек, их ретроконверсия и формирование базы данных, загружаемая в библиотечную учетную систему.
«Электронный каталог изданий, поступивших с 1996 г.»; «Электронный каталог изданий, поступивших в ГПИБ до 2000 г.» стали основой Единого электронного каталога библиотеки. Для реализации возможности быстрого и эффективного поиска информации по каталогам как традиционным способом (по классификаторам, рубрикаторам и атрибутам), так и с использованием аналитических инструментов корпорацией ЭЛАР внедрена интеллектуальная система на основе собственного программного обеспечения (ПО) «Индекс».
«При использовании электронного каталога читатель получает куда более широкие возможности поиска литературы. Я помню, как в середине 90-х годов коллеги из национальной библиотеки Германии говорили мне, что, как только они открыли электронный каталог, запросы на книги выросли чуть ли не в пять раз. Потому что читатель именно во столько раз больше начал видеть книг и стал этим пользоваться».
Михаил Афанасьев, директор ГПИБ России в интервью журналу «Э.Док»
ПО «Индекс» «собирает» информацию из нескольких источников благодаря интеграции с системами Absotheque UNICODE и Liber Media, эксплуатируемыми в ГПИБ России, и официальным порталом библиотеки. Данные в программе конвертируются в единый формат; извлекаются тексты и метаданные, определяются язык и кодировка и т.д. Анализ текста предусматривает определение словоформ, частей речи и взаимосвязей слов в предложении, выявление различных сущностей в тексте (имен, географических названий, названий организаций), и даже анализ эмоциональной окраски текста. Результаты этой обработки помещаются в поисковый индекс, ядром которого является инвертированный список — отсортированный перечень всех слов, встречающихся в документах, где для каждого слова указаны документы, в которых слово встречается. Благодаря этому списку и осуществляется оперативный поиск.
Поиск в Едином электронном каталоге ведется на 40 языках, включая русский. Искать можно классическим способом — по рубрикатору или атрибутам библиографического описания с использованием перекрестной фильтрации; либо сужать поиск по области знаний, жанрам, или иной тематической направленности. Система также предлагает «контекстный поиск», то есть поиск из единой строки по набору ключевых слов с учетом морфологических форм. Такой метод позволяет быстро найти информацию в тех случаях, когда пользователь владеет терминологией и имеет представление о том, что ищет. Если же пользователь, напротив, затрудняется сформулировать запрос, то поиск информации осуществляется по смысловому содержанию запроса, с учетом многозначных слов, омонимов, синонимов и лингвистических связей между словами. Метод «нечеткого поиска» позволяет найти информацию по запросам, введенным с опечатками или ошибками. Или по документам и данным, содержащим ошибки.
Единый электронный каталог сегодня насчитывает более 6,7 млн записей, включая не только информацию о книгах, но и описания статей из сборников и журналов.
Интеллектуальная система поиска также обеспечивает авторизацию пользователей в читальных залах учреждения и через сеть Интернет, предоставляет им возможность вести свои подборки изданий («личные книжные полки»), автоматически сохраняет поисковые запросы. Читатели могут в системе оформить заказ на выдачу изданий.