Аннотация:
Работа посвящена вопросам анализа логической компоновки таблицы в задаче структурирования табличной информации, содержащейся в неструктурированных документах и изначально предназначенной для восприятия человеком, а не для машинной обработки. Предлагается система трансформации таблицы от слабоструктурированного представления к отношению реляционной модели данных. Эта система обеспечивает полуавтоматическое восстановление используемых в таблице измерений (доменов). Трансформация ориентирована на таблицы, сформированные из баз данных.
Ключевые слова:анализ и распознавание документов, извлечение информации из таблиц, анализ и обработка таблиц, преобразование таблиц.