RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2022, том 34, выпуск 2, страницы 159–178 (Mi tisp685)

Реализация функций управления задачами и ресурсами высокопроизводительной вычислительной системы в "СПО Супер-ЭВМ"

А. О. Игнатьев, А. А. Калинин, С. Ю. Мокшин

Всероссийский НИИ технической физики им. академика Е. И. Забабахина

Аннотация: В данной работе приводится общее описание программного обеспечения Slurm-ВНИИТФ, разработки ФГУП РФЯЦ-ВНИИТФ им. академ. Е.И. Забабахина, включая его архитектуру и возможности по управлению ресурсами и планированию прохождения задач на высокопроизводительных вычислительных системах, предназначенных для решения задач численного моделирования (ВВС). Проведенные в ходе многолетних работ, связанных с эксплуатацией ВВС, исследования, показывают, что базовых возможностей программного обеспечения Slurm (Simple linux utility for resource management) явно недостаточно для эффективного использования вычислительных ресурсов в крупных вычислительных центрах, поэтому авторами данной публикации предлагается усовершенствованная политика управления задачами и ресурсами, описываются модули расширения (плагины) к Slurm, разработанные в ФГУП РФЯЦ-ВНИИТФ им. академ. Е.И. Забабахина и реализующие эту политику.

Ключевые слова: высокопроизводительная вычислительная система, кластер, подсистема управления задачами и ресурсами, Slurm, Slurm-ВНИИТФ, высокопроизводительные вычисления, моделирование

DOI: 10.15514/ISPRAS-2022-34(2)-13



© МИАН, 2024