RUS  ENG
Полная версия
ЖУРНАЛЫ // Доклады Российской академии наук. Математика, информатика, процессы управления // Архив

Докл. РАН. Матем., информ., проц. упр., 2024, том 520, номер 2, страницы 57–70 (Mi danma588)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Раскрытие Гессиана: ключ к плавной сходимости поверхности функции потерь

Н. С. Киселев, А. В. Грабовой

Московский физико-технический институт, Москва, Россия

Аннотация: Поверхность функции потерь в нейронных сетях является критическим аспектом их обучения, и понимание ее свойств важно для улучшения их эффективности. В данной работе исследуется изменение поверхности функции потерь при увеличении размера выборки. Проводится теоретический анализ сходимости поверхности функции потерь в полносвязной нейронной сети, доказывается верхняя оценка на абсолютную разность значений функции ошибки при добавлении одного объекта в выборку. Эмпирический анализ показывает справедливость полученных теоретических результатов на различных наборах данных, демонстрируя сходимость поверхности функции потерь для задачи классификации изображений. Результаты исследования открывают новые свойства локальной геометрии поверхности функции потерь в нейронных сетях и имеют применение в развитии методов определения достаточного размера выборки.

Ключевые слова: нейронные сети, поверхность функции потерь, гессиан, анализ сходимости, классификация изображений.

УДК: 621.38

Поступило: 28.09.2024
Принято к публикации: 02.10.2024

DOI: 10.31857/S2686954324700383


 Англоязычная версия: Doklady Mathematics, 2024, 110:suppl. 1, S49–S61

Реферативные базы данных:


© МИАН, 2025