Статья посвящена построению отображения встроенных типов данных XML Schema в типы языка СИНТЕЗ.
В лаборатории композиционных методов проектирования информационных систем ИПИ РАН разрабатывается архитектура посредника неоднородных информационных коллекций, который позволяет работать с распределенными неоднородными коллекциями данных как с интегрированной коллекцией информации.
Посредник поддерживает процесс систематической регистрации и классификации коллекций, содержит унифицированные онтологические данные и метаинформацию для улучшения обнаружения и композиции существующих коллекций.
Регистрация коллекции - это процесс взаимодействия провайдера цифровой коллекции с предметным посредником во время операционной фазы посредника, заключающийся в контекстуализации коллекции в посреднике (согласовании ее понятийного и терминологического контекста с контекстом посредника), представления классов коллекции как материализованных взглядов над классами посредника, генерации адаптеров.
В рамках посредника определяется метаинформация предметной области, которую представляет данный посредник. В качестве канонической модели данных посредника используется язык СИНТЕЗ.
Последние несколько лет консорциум W3С развивает стандарт языка разметки XML (eXtended Markup Language) в качестве основного носителя информации в Сети. С помощью данного стандарта строятся словари (DTD или XML Schemas) для передачи более специализированной информации.
XML Schema определяет конкретный словарь XML - конкретный набор элементов разметки (тэгов) и ограничения, связанные с ними. Например, существует XML Schema для определения тэгов HTML, MathML (язык разметки математических выражений), DAML+OIL (язык описания онтологий) и других языков разметки.
В данной статье рассматривается отображение типов данных XML Schema в типы данных языка СИНТЕЗ. Данное отображение используется при регистрации коллекций для загрузки их спецификаций, представленных в XML Schema, в базу метаинформации посредника.