RUS  ENG
Full version
SEMINARS

Colloquium of the Faculty of Computer Science
February 11, 2025 16:20, Moscow


Обучение с подкреплением как универсальный инструмент тонкой настройки: от RLHF до DeepSeek

Александр Панов


Website: https://us06web.zoom.us/meeting/register/J_aY42j1SKyRWwBMjWI_qg#/registration


© Steklov Math. Inst. of RAS, 2025