Семинары: А. А. Разборов, О вопросах сходимости и генерализации нейронных сетей малой глубины

СЕМИНАРЫ


Семинар «Математические основы искусственного интеллекта» 19 июня 2024 г. 17:00, г. Москва, МИАН, конференц-зал, 9 этаж + Zoom

О вопросах сходимости и генерализации нейронных сетей малой глубины А. А. Разборов^ab ^a University of Chicago ^b Математический институт им. В.А. Стеклова Российской академии наук, г. Москва
https://youtu.be/POCS5LMbrqg Аннотация: Объяснение причин сходимости и (в особенности) генерализации нейронных сетей при их обучении методом (возможно стохастического) градиентного спуска - одна из наиболее фундаментальных открытых проблем в области математических основ ИИ. Оба феномена вполне проявляются уже для простейшей возможной архитектуры: вполне связные ReLU схемы глубины 2, и уже для этого случая удовлетворительное объяснение в настоящий момент отсутствует. В докладе будет дан (заведомо неполный) обзор некоторых частичных результатов в этом направлении.