RUS
ENG
Full version
SEMINARS
Colloquium of the Faculty of Computer Science
February 11, 2025
16:20
, Moscow
Обучение с подкреплением как универсальный инструмент тонкой настройки: от RLHF до DeepSeek
Александр Панов
https://www.youtube.com/watch?v=H85bwyHYJv0
Website:
https://vk.com/cshse?z=video-69306530_456239995
©
Steklov Math. Inst. of RAS
, 2025