RUS  ENG
Полная версия
ПЕРСОНАЛИИ

Панов Александр Игоревич

Доклады и лекции в базе данных Math-Net.Ru

  1. Обучение с подкреплением как универсальный инструмент тонкой настройки: от RLHF до DeepSeek
    Александр Панов
    Коллоквиум Факультета компьютерных наук НИУ ВШЭ
    11 февраля 2025 г. 16:20


© МИАН, 2025