RUS  ENG
Полная версия
ЖУРНАЛЫ // Журнал вычислительной математики и математической физики // Архив

Ж. вычисл. матем. и матем. физ., 2021, том 61, номер 5, страницы 800–812 (Mi zvmmf11239)

Эта публикация цитируется в 5 статьях

Общие численные методы

Малоранговое представление нейронных сетей

Ю. В. Гусакa, Т. К. Даулбаевa, И. В. Оселедецab, Е. С. Пономаревa, А. С. Чихоцкийa

a 121205 Москва, Большой бульвар, 30, стр. 1, Сколковский институт науки и технологий, Россия
b 119333 Москва, ул. Губкина, 8, Институт вычислительной математики им. Г.И. Марчука Российской академии наук, Россия

Аннотация: Представлен новый метод ускорения глубоких нейронных сетей, который использует основные идеи сокращения размерности для решения уравнений в динамических системах. В основе предложенного метода лежит алгоритм поиска подматрицы максимального объема (MaxVol). Эффективность разработанного метода продемонстрирована на задаче ускорения предобученных нейронных сетей на задаче классификации изображений для трех разных наборов данных. Показано, что во многих практических задачах возможно эффективно заменить сверточные слои на полносвязные с малым числом параметров и меньшей вычислительной сложностью без существенной потери точности.
Библ. 39. Фиг. 3. Табл. 4.

Ключевые слова: ускорение нейронных сетей, MaxVol, машинное обучение, анализ компонент.

УДК: 519.65

Поступила в редакцию: 24.12.2020
Исправленный вариант: 24.12.2020
Принята в печать: 14.01.2021

DOI: 10.31857/S0044466921050100


 Англоязычная версия: Computational Mathematics and Mathematical Physics, 2021, 61:5, 774–785

Реферативные базы данных:


© МИАН, 2024