RUS
ENG
Full version
SEMINARS
Colloquium of the Faculty of Computer Science
February 11, 2025
16:20
, Moscow
Обучение с подкреплением как универсальный инструмент тонкой настройки: от RLHF до DeepSeek
Александр Панов
Website:
https://us06web.zoom.us/meeting/register/J_aY42j1SKyRWwBMjWI_qg#/registration
©
Steklov Math. Inst. of RAS
, 2025