RUS  ENG
Полная версия
ЖУРНАЛЫ // Вычислительные методы и программирование // Архив

Выч. мет. программирование, 2024, том 25, выпуск 2, страницы 127–141 (Mi vmp1113)

Методы и алгоритмы вычислительной математики и их приложения

Методика анализа производительности вывода глубоких нейронных сетей на примере задачи классификации изображений

М. Р. Алибековa, Н. Е. Березинаb, Е. П. Васильевa, И. Б. Вихревb, Ю. Д. Камелинаb, В. Д. Кустиковаa, З. А. Масловаb, И. С. Мухинa, А. К. Сидороваa, В. Н. Сучковa

a Нижегородский государственный университет имени Н. И. Лобачевского, Нижний Новгород, Российская Федерация
b ООО “Ядро Центр Исследований и Разработки”, Нижний Новгород, Российская Федерация

Аннотация: Внедрение глубоких нейронных сетей требует анализа производительности этапа вывода на целевом аппаратном обеспечении. Результаты производительности позволяют принимать решение о возможности внедрения построенных моделей и/или необходимости их предварительной оптимизации. В работе описана методика анализа и сравнения производительности вывода на примере решения задачи классификации изображений: конвертация обученной модели под разные фреймворки, анализ качества, определение оптимальных параметров запуска вывода, оптимизация модели и повторный анализ качества, анализ и сравнение производительности. Разработана система Deep Learning Inference Benchmark для поддержки цикла анализа производительности. Методика продемонстрирована на примере открытой модели MobileNetV2.

Ключевые слова: глубокое обучение, нейронные сети, вывод, производительность, MobileNetV2, Deep Learning Inference Benchmark.

УДК: 004.032.26; 004.048; 004.021

Поступила в редакцию: 10.12.2023
Принята в печать: 05.03.2024

DOI: 10.26089/NumMet.v25r211



© МИАН, 2024