Аннотация:
В настоящее время существует множество диффузионных и авторегрессионных моделей, которые показывают впечатляющие результаты для порождения изображений из текста и других входных областей. Однако эти методы не предназначены для синтеза изображений сверхвысокого разрешения. Векторная графика лишена этого недостатка, поэтому создание изображений в этом формате представляется весьма перспективным направлением. Вместо непосредственного создания векторных изображений можно сначала синтезировать растровое изображение, а затем применить векторизацию. Векторизация — это процесс преобразования растрового изображения в аналогичное векторное изображение с использованием примитивных форм. Помимо схожести, сгенерированное векторное изображение также должно содержать минимальное количество фигур для рендеринга. В этой работе мы фокусируемся конкретно на методах векторизации, совместимых с машинным обучением. Мы рассматриваем модели Mang2Vec, Deep Vectorization of Technical Drawings, DiffVG и LIVE. Мы также даем краткий обзор существующих решений, доступных онлайн. Мы также рассматриваем другие алгоритмические методы — модели Im2Vec и ClipGEN — но они не участвуют в сравнении, так как либо открытой реализации этих методов нет, либо их официальные реализации работают некорректно. Наши исследования показывают, что, несмотря на возможность напрямую указывать число и тип фигур, существующие методы машинного обучения работают очень долго и не воссоздают точно исходное изображение. Мы считаем, что не существует быстрого универсального автоматического подхода, и для каждого метода необходим человеческий контроль. Библ. – 38 назв.