RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2021, том 15, выпуск 1, страницы 42–49 (Mi ia710)

Вариационная оптимизация модели глубокого обучения с контролем сложности

О. С. Гребеньковаa, О. Ю. Бахтеевab, В. В. Стрижовca

a Московский физико-технический институт
b Компания Антиплагиат
c Вычислительный центр имени А. А. Дородницына Федерального исследовательского центра «Информатика и управление» Российской академии наук

Аннотация: Исследуется задача построения модели глубокого обучения. Предлагается способ контроля ее сложности. Под сложностью модели понимается минимальная длина описания, минимальный объем информации, который требуется для передачи информации о модели и о выборке. Предлагается метод оптимизации параметров модели, основанный на представлении модели глубокого обучения в виде гиперсети с использованием байесовского подхода. Под гиперсетью понимается модель, которая порождает параметры оптимальной модели. Вводятся вероятностные предположения о распределении параметров модели глубокого обучения. Предлагается алгоритм, максимизирующий нижнюю вариационную оценку байесовской обоснованности модели. Вариационная оценка рассматривается как условная величина, зависящая от требуемой сложности модели. Для анализа качества предлагаемого алгоритма проведены эксперименты на выборке MNIST.

Ключевые слова: вариационная оптимизация модели, гиперсети, глубокое обучение, нейронные сети, байесовский вывод, заданная сложность модели.

Поступила в редакцию: 14.08.2020

DOI: 10.14357/19922264210106



© МИАН, 2024