Аннотация:
В рамках обучения с подкреплением существует множество методов, в которых агент учится выполнять различные задания. Например, такой подход может быть востребован в обучении универсального агента, способного решать широкий спектр задач, или специализированного агента, который обучается конкретному навыку. Применение расписания обучения для определения порядка изучения заданий помогает повысить производительность и эффективность процесса обучения агента. При изучении таких методов важным для обучения и тестирования является правильный выбор сред. В нашей статье представлен обзор сред, подходящих для оценки различных методов, и выделены их ключевые различия. Подробно описаны компоненты заданий и классификация существующих методов на основе расписания обучения. Мы предоставляем исследователям необходимую информацию о выборе и использовании сред для анализа и создания методов на основе расписания обучения.
Ключевые слова:
обучение с подкреплением, расписание обучения, многозадачное обучение, глубокое обучение.
УДК:517.977
Поступило: 20.09.2024 Принято к публикации: 02.10.2024