Известия Кабардино-Балкарского научного центра РАН,
2024, том 26, выпуск 6,страницы 208–218(Mi izkab924)
Системный анализ, управление и обработка информации
Модификация алгоритма глубокого обучения для распределения
функций и задач между робототехническим комплексом и человеком
в условиях неопределенности и переменности окружающей среды
Аннотация:
В реальном мире условия редко бывают стабильными, что требует от
робототехнических комплексов (РТК) способности к адаптации в условиях неопределенности.
Синергия человека и робота повышает производительность, однако для этого необходимы
эффективные методы распределения задач, учитывающие особенности обеих сторон. Целью
работы является определение оптимальных стратегий распределения задач между людьми и
РТК и адаптивное управление РТК в условиях неопределенности и изменяющейся среды.
Методы исследования. В работе предложен графовый подход к распределению задач,
основанный на возможностях человека и робота. В алгоритм обучения с подкреплением
встроен механизм памяти LSTM (Long short-term memory) для решения проблемы частичной
наблюдаемости, вызванной неточностью измерений сенсоров и шумом окружающей среды.
Метод HER (Hindsight Experience Replay) применен для преодоления проблемы скудных
вознаграждений. Результаты. Обученная модель продемонстрировала стабильную сходимость,
достигая высокого уровня успешности манипуляции объектами. Интеграция методов LSTM
и HER в обучение с подкреплением позволяет успешно решать вопросы распределения
задач между человеком и роботом в условиях неопределенности и изменяющейся среды.
Предложенный метод можно применять в различных сценариях для РТК в сложных и
изменяющихся условиях.
Ключевые слова:
взаимодействие человека и робота, адаптивный алгоритм управления,
распределение задач, обучение с подкреплением