RUS  ENG
Полная версия
ЖУРНАЛЫ // Журнал Белорусского государственного университета. Математика. Информатика // Архив

Журн. Белорус. гос. ун-та. Матем. Инф., 2024, том 2, страницы 93–103 (Mi bgumi689)

Теоретические основы информатики

Использование сверточных вейвлет-блоков в задаче классификации изображений

В. А. Воробей, А. Э. Малевич

Белорусский государственный университет, пр. Независимости, 4, 220030, г. Минск, Беларусь

Аннотация: На примере задачи классификации изображений и вейвлет-семейства CDF-$9/7$ показано, как можно внедрить дискретное вейвлет-преобразование в модель компьютерного зрения, сохранив возможность ее обучения методом обратного распространения ошибки. Предложен и успешно встроен в ряд моделей нейронных сетей сверточный вейвлет-блок, который сочетает в себе обработку признаков входного сигнала на нескольких уровнях вейвлет-разложения и позволяет уменьшить исходный размер модели на $30-40 \%$, обеспечивая при этом сопоставимое качество. Продемонстрирована возможность эффективно выполнять дискретное вейвлет-преобразование на графическом процессоре при использовании лифтинг-схемы. Реализация вейвлет-преобразования построена на поэлементных операциях сложения и умножения, что позволяет при необходимости экспортировать обученную модель в требуемый формат для запуска на новых данных без дополнительных сложностей. В качестве базовых моделей использованы архитектуры $ResNetV2-50$, $MobileNetV2$ и $EfficientNetV2-B0$. Для проведения экспериментов подготовлен набор данных на основе подвыборки категорий датасета LSUN.

Ключевые слова: нейронные сети; глубокое обучение; вейвлеты; дискретное вейвлет-преобразование; классификация изображений

УДК: 004.89

Поступила в редакцию: 07.01.2024
Исправленный вариант: 16.06.2024
Принята в печать: 16.06.2024



© МИАН, 2024