RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2023, том 35, выпуск 6, страницы 247–264 (Mi tisp845)

Использование переноса стиля как способ улучшения обобщающей способности нейросети в задаче детекции объектов

Д. К. Карачёвab, С. Е. Штехинa, В. С. Тарасянb, И. Ю. Смолинa, М. В. Исаковa

a Филиал No11 ООО «ОЦРВ» Сириус
b Уральский государственный университет путей сообщения

Аннотация: В данной работе предлагается реализация подхода обучения нейронной сети для детекции объектов с помощью аугментации - переноса стиля. Данный метод улучшает обобщающую способность нейросети для определения местоположения объектов на изображении за счет улучшения взаимодействия с низкоуровневыми признаками, такими как текстуры, цвета и небольшие изменения форм. Экспериментально доказана эффективность метода и продемонстрированы числовые значения метрик детекции на нескольких наборах данных с различными классами. Применение аугментации предлагается с помощью ранее не использованной архитектуры нейросети, способной переносить произвольное количество стилей. Особенностью подхода также является то, что веса нейросети для стилизации замораживаются и она добавляется в граф детекционной сети, что позволяет увеличить скорость аугментации.

Ключевые слова: нейронные сети, компьютерное зрение, перенос стиля, машинное зрение, машинное обучение, детектирование объектов

DOI: 10.15514/ISPRAS-2023-35(6)-16



© МИАН, 2024