Многонаправленные преобразования и веб-представления разно-структурированной информации
М. Ю. Колодин Санкт-Петербургский институт информатики и автоматизации РАН
Аннотация:
В последние годы все более актуальной становится задача многократного использования одних и тех же данных, получение многочисленных различных видов выходной информации на основе одинаковых однократно вводимых наборов исходной информации, причем во всех случаях она может быть различным образом структурирована. Это применяется и в работе с локальными базами данных, и с Интернет-ресурсами, и в управляющих и информационных интранет-системах.
Цель исследования состоит в разработке способов оптимального заполнения, преобразования и, главное, передачи и выдачи различным образом структурированной информации на основе таких наборов. Наиболее важными здесь являются задачи выбора оптимального представления данных, особенно для случаев данных больших объемов, данных переменной структуры, неполных данных, и построение инструментов для их преобразования, в том числе для показа в выдаче веб-браузеров.
На типовых примерах «вуз» и «архив» рассмотрены основные требования, трудности и способы решения поставленной задачи.
Есть несколько полезных приемов, прежде всего это использование имеющейся файловой системы для организации данных, применение описателей для информационных блоков на уровне каталогов, в том числе определяющих структуру находящейся в данном блоке информации, что позволяет правильно выделить и отобразить информацию, согласовать ее с информацией из других блоков с такой же или иной структурой и содержимым. Использование ссылок файловой системы было полезно при работе с ОС семейства Linux, но не вполне успешно для ОС MS Windows.
Очень полезным оказалось выделение из архивов метаинформации, с последующим обменом между серверами только метаинформации (это сведения о наличии некоторой информации определенного типа в архиве на данном сервере, краткий или полный перечень такой информации по некоторым признакам), с полуавтоматическим обновлением такой информации.
Удачной оказалась реализация представления данных на основе смеси стилей CSS. Включение информации и метаинформации на упрощенных языках типа YAML и JSON также способствовало повышению гибкости и быстродействия системы выборки и представления информации.
В целом экономия времени разработки в типовых случаях составила примерно 25–30% традиционного; однако это справедливо только для систем «среднего» размера; для «малых» и «больших» систем нужно провести дополнительные исследования. Нужно также более строго определить способы измерения эффективности и опробовать их для «больших» систем.
Ключевые слова:
метасистемы, веб-представления, структурированная информация, преобразователи данных.
УДК:
006.72
Поступила в редакцию: 14.12.2009