Монография. — Новосибирск: Наука, 2010. — 220 с.
В монографии рассматриваются вопросы разработки и создания информационно-поисковых систем, способных в автоматизированном режиме извлекать данные из слабоструктурированных электронных документов с целью включения этих документов в научно-информационный процесс и получения новой информации и знаний. Приводится подробное изложение моделей, структур и алгоритмов, описывающих информационно-поисковые системы указанного типа, предназначенные для информационного обеспечения научной деятельности. Представлены результаты использования предложенных информационных моделей и структур при создании целого ряда разделов Информационно-справочной системы Сибирского отделения РАН.
Книга предназначена для специалистов в области информационных технологий, занимающихся вопросами создания информационно-поисковых систем для различных отраслей науки, а также аспирантов и студентов старших курсов.
Табл. 4, ил. 15, библиогр.: 267 назв.
ПредисловиеИнформационный поиск: история и технологические подходыПостановка проблемы
Предыстория
Современные проблемы создания и функционирования информационно-поисковых систем научной тематики
Уточнение используемой терминологии на основе семиотического подхода
Общие принципы организации информационно-поисковых систем
Составление поисковых предписаний
Оценка эффективности поиска
Поиск документов "по аналогии"
Постановка проблемы
Формализация понятий аналогии и сходства
О несимметричном сходстве
Определение меры близости между объектами
Установление аналогии и оценка эффективности поиска
Метаданные и обработка электронных ресурсов
Методология изучения интернет-сайтов
Проблемы разработки теоретических основ создания интеллектуальных систем
Анализ информационных потребностей научного сообществаОсновные характеристики информационных потребностей в сфере науки
Исследование информационных потребностей коллективных пользователей — научных учреждений СО РАН
Информационная модель описания деятельности научного сообщества
Структура основных компонентов программной системыФормулировка требований к программной системе
Модель информационной системы
Структура логических компонентов программной системы
Структуры представления научной и научно-организационной информации
Структура информационно-справочной системы по истории науки (на примере математики)
Структуры представления информации о деятельности научного сообщества (на примере СО РАН)
Структуры представления информации о научно-инновационной деятельности
Методология обработки слабоструктурированных документов Автоматизированная технология построения тезаурусов и онтологий
Автоматизация процесса извлечения метаданных из слабоструктурированных документов
Автоматизация процесса получения метаданных документа с использованием удалённых библиографических описаний
Автоматическое извлечение из текстов ключевых слов
Кластеризация текстовых документов на основании меры сходства
Библиографический список