RUS  ENG
Full version
SEMINARS

Colloquium of the Faculty of Computer Science
February 11, 2025 16:20, Moscow


Обучение с подкреплением как универсальный инструмент тонкой настройки: от RLHF до DeepSeek

Александр Панов


https://www.youtube.com/watch?v=H85bwyHYJv0


Website: https://vk.com/cshse?z=video-69306530_456239995


© Steklov Math. Inst. of RAS, 2025