М. Р. Алибеков, Н. Е. Березина, Е. П. Васильев, И. Б. Вихрев, Ю. Д. Камелина, В. Д. Кустикова, З. А. Маслова, И. С. Мухин, А. К. Сидорова, В. Н. Сучков, “Методика анализа производительности вывода глубоких нейронных сетей на примере задачи классификации изображений”, Выч. мет. программирование, 2024, том 25, выпуск 2,страницы 127

Методы и алгоритмы вычислительной математики и их приложения

Методика анализа производительности вывода глубоких нейронных сетей на примере задачи классификации изображений

М. Р. Алибеков^a, Н. Е. Березина^b, Е. П. Васильев^a, И. Б. Вихрев^b, Ю. Д. Камелина^b, В. Д. Кустикова^a, З. А. Маслова^b, И. С. Мухин^a, А. К. Сидорова^a, В. Н. Сучков^a

^a Нижегородский государственный университет имени Н. И. Лобачевского, Нижний Новгород, Российская Федерация
^b ООО “Ядро Центр Исследований и Разработки”, Нижний Новгород, Российская Федерация

Аннотация: Внедрение глубоких нейронных сетей требует анализа производительности этапа вывода на целевом аппаратном обеспечении. Результаты производительности позволяют принимать решение о возможности внедрения построенных моделей и/или необходимости их предварительной оптимизации. В работе описана методика анализа и сравнения производительности вывода на примере решения задачи классификации изображений: конвертация обученной модели под разные фреймворки, анализ качества, определение оптимальных параметров запуска вывода, оптимизация модели и повторный анализ качества, анализ и сравнение производительности. Разработана система Deep Learning Inference Benchmark для поддержки цикла анализа производительности. Методика продемонстрирована на примере открытой модели MobileNetV2.

Ключевые слова: глубокое обучение, нейронные сети, вывод, производительность, MobileNetV2, Deep Learning Inference Benchmark.

УДК: 004.032.26; 004.048; 004.021

Поступила в редакцию: 10.12.2023
Принята в печать: 05.03.2024

DOI: 10.26089/NumMet.v25r211