RUS  ENG
Полная версия
ЖУРНАЛЫ // Доклады Российской академии наук. Математика, информатика, процессы управления // Архив

Докл. РАН. Матем., информ., проц. упр., 2024, том 520, номер 2, страницы 251–259 (Mi danma604)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Среды для тестирования методов автоматической генерации расписания обучения: краткий обзор

М. И. Нестероваabc, А. А. Скрынникac, А. И. Пановabc

a Федеральный исследовательский центр «Информатика и управление» Российской академии наук, Москва, Россия
b Московский физико-технический институт (национальный исследовательский университет), Московская облаcть, г. Долгопрудный
c AIRI, Москва, Россия

Аннотация: В рамках обучения с подкреплением существует множество методов, в которых агент учится выполнять различные задания. Например, такой подход может быть востребован в обучении универсального агента, способного решать широкий спектр задач, или специализированного агента, который обучается конкретному навыку. Применение расписания обучения для определения порядка изучения заданий помогает повысить производительность и эффективность процесса обучения агента. При изучении таких методов важным для обучения и тестирования является правильный выбор сред. В нашей статье представлен обзор сред, подходящих для оценки различных методов, и выделены их ключевые различия. Подробно описаны компоненты заданий и классификация существующих методов на основе расписания обучения. Мы предоставляем исследователям необходимую информацию о выборе и использовании сред для анализа и создания методов на основе расписания обучения.

Ключевые слова: обучение с подкреплением, расписание обучения, многозадачное обучение, глубокое обучение.

УДК: 517.977

Поступило: 20.09.2024
Принято к публикации: 02.10.2024

DOI: 10.31857/S2686954324700619


 Англоязычная версия: Doklady Mathematics, 2024, 110:suppl. 2, S223–S229

Реферативные базы данных:


© МИАН, 2025