«Искусственный интеллект» 4’2005.
Для того чтобы повысить релевантность поиска информации в Интернете, предлагается использовать знания пользователя о ПрО, которая его интересует, представленные в виде онтологии. На основе множества терминов онтологии ПрО строится тезаурус пользователя, который используется для оценки того, насколько интересен этот ИР пользователю.
Проблемы поиска информации в Интернет В настоящее время основные направления развития информационных технологий (ИТ) связаны с созданием информационных систем, основанных на знаниях соответствующих предметных областей (ПрО). Большинство людей могут считаться экспертами в определенных ПрО, отражающих, например, их
профессиональную или научную деятельность, другие интересы.
Одна из наиболее часто встречающихся задач в ИТ – поиск информации (в
Интернет, локальной сети, на отдельном компьютере), представленной в различных
формах (текст, графика, аудиоинформация, мультимедиа и т. д. ). Пользователю доступно
большое количество информации, которую он должен отфильтровывать и искать
релевантную информацию. Механизмы поиска типа Google и Yahoo пытаются
облегчать эту проблему, индексируя в значительной степени неструктуризированную и
неуправляемую информацию в Интернете.
При этом пользователь, как правило, не всегда является специалистом в
области ИТ и вследствие этого может применять только наиболее простые и
интуитивно понятные средства формирования запросов. Так, большинство
пользователей, обращающихся к информационно-поисковым системам (ИПС)
Интернета, используют только простые запросы, состоящие из 2 – 3 слов, не используют
логические операторы и прочие механизмы расширенного поиска. Вследствие этого
они получают в результате выполнения такого запроса большое количество
информационных ресурсов (ИР), релевантных запросу, но не отвечающих реальной
информационной потребности пользователя.