RUS  ENG
Полная версия
СЕМИНАРЫ

Семинар «Математические основы искусственного интеллекта»
19 июня 2024 г. 17:00, г. Москва, МИАН, ул. Губкина, д. 8, конференц-зал, 9 этаж + Zoom


О вопросах сходимости и генерализации нейронных сетей малой глубины

А. А. Разборовab

a University of Chicago
b Математический институт им. В.А. Стеклова Российской академии наук, г. Москва


https://youtu.be/POCS5LMbrqg

Аннотация: Объяснение причин сходимости и (в особенности) генерализации нейронных сетей при их обучении методом (возможно стохастического) градиентного спуска - одна из наиболее фундаментальных открытых проблем в области математических основ ИИ. Оба феномена вполне проявляются уже для простейшей возможной архитектуры: вполне связные ReLU схемы глубины 2, и уже для этого случая удовлетворительное объяснение в настоящий момент отсутствует. В докладе будет дан (заведомо неполный) обзор некоторых частичных результатов в этом направлении.


© МИАН, 2024