RUS  ENG
Полная версия
ЖУРНАЛЫ // Доклады Российской академии наук. Математика, информатика, процессы управления // Архив

Докл. РАН. Матем., информ., проц. упр., 2024, том 520, номер 2, страницы 124–130 (Mi danma594)

СПЕЦИАЛЬНЫЙ ВЫПУСК: ТЕХНОЛОГИИ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА И МАШИННОГО ОБУЧЕНИЯ

Обзор мультимодальных сред для обучения с подкреплением

З. А. Воловиковаab, М. А. Кузнецоваa, А. А. Скрынникbc, А. И. Пановabc

a Московский физико-технический институт (национальный исследовательский университет), Московская облаcть, г. Долгопрудный
b AIRI - научно-исследовательский институт искусственного интеллекта, Москва, Россия
c Федеральный исследовательский центр «Информатика и управление» Российской академии наук, Москва, Россия

Аннотация: В данной статье представлен обзор и сравнительный анализ мультимодальных виртуальных сред для обучения с подкреплением. Рассмотрены семь различных сред, включая HomeGrid, BabyAI, RTFM, Messenger, Touchdown, Alfred и IGLU, с акцентом на их особенности и требования к агентам. Основное внимание уделено таким параметрам, как сложность текстовых инструкций, динамичность среды. Проведенный анализ выявляет сильные и слабые стороны каждой среды, позволяя определить оптимальные условия для эффективного обучения агентов, а также подчеркивает необходимость создания более сбалансированных сред, сочетающих высокие требования как к пониманию языка, так и к взаимодействию с окружением.

Ключевые слова: мультимодальное обучение, граундинг языка, обучение с подкреплением.

УДК: 004.5

Поступило: 01.10.2024
Принято к публикации: 07.10.2024

DOI: 10.31857/S2686954324700449


 Англоязычная версия: Doklady Mathematics, 2024, 110:suppl. 1, S110–S116

Реферативные базы данных:


© МИАН, 2025