RUS  ENG
Полная версия
ЖУРНАЛЫ // Ученые записки Ереванского государственного университета, серия Физические и Математические науки // Архив

Уч. записки ЕГУ, сер. Физика и Математика, 2024, том 58, выпуск 3, страницы 79–87 (Mi uzeru1097)

Informatics

Synthetic document generation for the task of visual document understanding

[Генерация синтетических документов для задачи визуального понимания документов]

Kh. S. Khechoyan

Yerevan State University, Faculty of Informatics and Applied Mathematics

Аннотация: Для решения задачи анализа документов методами машинного обучения необходимо большое количество размеченных данных. Такие данные не всегда доступны, а если и доступны, то охватывают только определенные типы документов.
В этой работе нами представлен метод создания синтетических данных, позволяющий создавать документы любого типа, предварительно определив компоненты документа. Изменяя расположение компонентов документов, текстовое содержание и визуальные элементы с помощью конфигураций, мы создаем разнообразные и реалистичные наборы данных, имитирующие реальные документы. Этот метод решает проблему нехватки размеченных наборов данных и предлагает гибкое решение для улучшения результатов модели машинного обучения.

Ключевые слова: machine learning, data generation, document understanding

MSC: 68T20

Поступила в редакцию: 22.05.2024
Исправленный вариант: 03.01.2025
Принята в печать: 17.01.2025

Язык публикации: английский

DOI: 10.46991/PYSUA.2024.58.3.079



© МИАН, 2025