RUS  ENG
Полная версия
ЖУРНАЛЫ // Вычислительные методы и программирование // Архив

Выч. мет. программирование, 2021, том 22, выпуск 1, страницы 14–28 (Mi vmp1024)

Параллельные программные средства и технологии

Разработка модели для целостного анализа рабочей нагрузки больших суперкомпьютерных систем

П. А. Швец, Вад. В. Воеводин, С. А. Жуматий

Научно-исследовательский вычислительный центр Московского государственного университета имени М. В. Ломоносова

Аннотация: Любой современный суперкомпьютер имеет крайне сложную архитектуру, и эффективное использование его ресурсов зачастую является очень сложной задачей даже для опытных пользователей. В то же время высокопроизводительные вычисления становятся все более востребованными и вопрос эффективного использования суперкомпьютеров очень актуален. Поэтому пользователи должны знать все самое важное о производительности их работы, выполняемой на суперкомпьютере, чтобы иметь возможность ее оптимизировать, а администраторы должны уметь отслеживать и анализировать все нюансы эффективного функционирования таких систем. Однако в настоящее время нет полного понимания того, какие данные лучше всего для этого изучать (и как их следует анализировать), чтобы иметь полную картину состояния суперкомпьютера и происходящих на нем процессов. В этой статье мы делаем нашу первую попытку ответить на этот вопрос. Для этого мы разрабатываем модель, которая описывает все потенциальные факторы, которые могут быть важными при анализе производительности суперкомпьютерных приложений и системы HPC в целом. В документе представлено как подробное описание этой модели для пользователей и администраторов, так и несколько интересных реальных примеров, обнаруженных на суперкомпьютере Ломоносов-2 с помощью программного обеспечения, реализованного на основе предложенной модели.

Ключевые слова: высокопроизводительные вычисления; суперкомпьютер; анализ рабочей нагрузки; производительность приложения; разработка модели.

Поступила в редакцию: 22.12.2020

DOI: 10.26089/NumMet.v22r102



© МИАН, 2024