RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика» // Архив

Вестн. ЮУрГУ. Сер. Выч. матем. информ., 2025, том 14, выпуск 2, страницы 42–66 (Mi vyurv334)

Выполнение распределенных вычислительных экспериментов на MLOps платформе НИУ ВШЭ

А. С. Хританков, В. А. Полежаев, Г. А. Жуликов, М. С. Галынчик, Н. А. Климин, К. Е. Сахаров, В. О. Минченков, И. В. Спирин, И. И. Крупнов, С. Ф. Якушева, А. С. Маратканова, В. И. Козырев, П. С. Костенецкий, Х. М. Салех

Национальный исследовательский университет Высшая школа экономики (109028 Москва, Покровский бул., д. 11)

Аннотация: Несмотря на распространение и успешные применения средств интеллектуального анализа и обработки данных для решения отдельных прикладных задач, все еще не решена проблема разработки технологии создания таких программных средств. В работе в контексте единого процесса MLOps создания технологий машинного обучения рассматриваются возникающие задачи автоматизации и выполнения распределенных вычислительных экспериментов на базе единой вычислительной платформы. Разрабатываемая в НИУ ВШЭ платформа MLOps предназначена для развертывания интеллектуальных веб-сервисов и программных средств анализа данных. Платформа должна управлять доступными локально и в облачной среде разнородными ресурсами и объединять их с ресурсами вычислительного кластера cHARISMa НИУ ВШЭ под управлением Slurm. Таким образом актуальна задача интеграции указанных ресурсов для проведения вычислительных экспериментов, реализации конвейеров настройки моделей машинного обучения, решения задач обработки и анализа данных. Особенностями решаемой задачи являются рассмотрение процесса вычислений, как составной части технологии создания интеллектуальных веб-сервисов, обусловленная этой технологией необходимость использования разнородных ресурсов и использование единой гибридной платформы для выполнения вычислений. В работе предложено решение указанной задачи интеграции вычислений и приведены результаты апробации решения для интеллектуальных веб-сервисов. Показана принципиальная возможность такой интеграции разнородных ресурсов в одном вычислительном эксперименте на базе расширяемой пользователем объектной модели эксперимента и предметно-ориентированного языка его спецификации, решены вопросы динамического управления развертыванием интеллектуальных приложений, интеграции конвейеров обработки данных, веб-сервисов и наборов данных для выполнения распределенных вычислительных экспериментов.

Ключевые слова: распределенные вычислительные эксперименты, машинное обучение, облачные технологии, MLOps.

УДК: 004.4'22, 004.75, 004.85

Поступила в редакцию: 19.05.2025



© МИАН, 2025