Н. С. Киселев, А. В. Грабовой, “Раскрытие Гессиана: ключ к плавной сходимости поверхности функции потерь”, Докл. РАН. Матем., информ., проц. упр., 2024, том 520, номер 2,страницы 57

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Раскрытие Гессиана: ключ к плавной сходимости поверхности функции потерь

Н. С. Киселев, А. В. Грабовой

Московский физико-технический институт, Москва, Россия

Аннотация: Поверхность функции потерь в нейронных сетях является критическим аспектом их обучения, и понимание ее свойств важно для улучшения их эффективности. В данной работе исследуется изменение поверхности функции потерь при увеличении размера выборки. Проводится теоретический анализ сходимости поверхности функции потерь в полносвязной нейронной сети, доказывается верхняя оценка на абсолютную разность значений функции ошибки при добавлении одного объекта в выборку. Эмпирический анализ показывает справедливость полученных теоретических результатов на различных наборах данных, демонстрируя сходимость поверхности функции потерь для задачи классификации изображений. Результаты исследования открывают новые свойства локальной геометрии поверхности функции потерь в нейронных сетях и имеют применение в развитии методов определения достаточного размера выборки.

Ключевые слова: нейронные сети, поверхность функции потерь, гессиан, анализ сходимости, классификация изображений.

УДК: 621.38

Поступило: 28.09.2024
Принято к публикации: 02.10.2024

DOI: 10.31857/S2686954324700383