RUS  ENG
Полная версия
ЖУРНАЛЫ // Известия Кабардино-Балкарского научного центра РАН // Архив

Известия Кабардино-Балкарского научного центра РАН, 2024, том 26, выпуск 6, страницы 208–218 (Mi izkab924)

Системный анализ, управление и обработка информации

Модификация алгоритма глубокого обучения для распределения функций и задач между робототехническим комплексом и человеком в условиях неопределенности и переменности окружающей среды

М. А. Шереужевab, Г. Уb, В. В. Серебренныйb

a Московский государственный технологический университет «СТАНКИН», 127055, Россия, Москва, Вадковский пер., 1
b Московский государственный технический университет имени Н. Э. Баумана, 105005, Россия, Москва, ул. 2-я Бауманская, 5, корп. 1

Аннотация: В реальном мире условия редко бывают стабильными, что требует от робототехнических комплексов (РТК) способности к адаптации в условиях неопределенности. Синергия человека и робота повышает производительность, однако для этого необходимы эффективные методы распределения задач, учитывающие особенности обеих сторон. Целью работы является определение оптимальных стратегий распределения задач между людьми и РТК и адаптивное управление РТК в условиях неопределенности и изменяющейся среды. Методы исследования. В работе предложен графовый подход к распределению задач, основанный на возможностях человека и робота. В алгоритм обучения с подкреплением встроен механизм памяти LSTM (Long short-term memory) для решения проблемы частичной наблюдаемости, вызванной неточностью измерений сенсоров и шумом окружающей среды. Метод HER (Hindsight Experience Replay) применен для преодоления проблемы скудных вознаграждений. Результаты. Обученная модель продемонстрировала стабильную сходимость, достигая высокого уровня успешности манипуляции объектами. Интеграция методов LSTM и HER в обучение с подкреплением позволяет успешно решать вопросы распределения задач между человеком и роботом в условиях неопределенности и изменяющейся среды. Предложенный метод можно применять в различных сценариях для РТК в сложных и изменяющихся условиях.

Ключевые слова: взаимодействие человека и робота, адаптивный алгоритм управления, распределение задач, обучение с подкреплением

УДК: 004.896

MSC: 68T40

Поступила в редакцию: 13.11.2024
Исправленный вариант: 06.12.2024
Принята в печать: 11.12.2024

DOI: 10.35330/1991-6639-2024-26-6-208-218



© МИАН, 2025