RUS
ENG
Полная версия
ПЕРСОНАЛИИ
Панов Александр Игоревич
Доклады и лекции в базе данных Math-Net.Ru
Обучение с подкреплением как универсальный инструмент тонкой настройки: от RLHF до DeepSeek
Александр Панов
Коллоквиум Факультета компьютерных наук НИУ ВШЭ
11 февраля 2025 г.
16:20
©
МИАН
, 2025