Аннотация:
Для обеспечения высокой эффективности работы современных суперкомпьютеров необходимо постоянно анализировать и контролировать различные аспекты их функционирования, уделяя особое внимание изучению потока суперкомпьютерных приложений, выполняющихся на таких системах. Для решения этой задачи ранее был разработан программный комплекс TASC (Tuning Applications for SuperComputers). Он автоматически обнаруживает проблемы с производительностью в суперкомпьютерных приложениях и оценивает эффективность использования ресурсов суперкомпьютера, предоставляет администраторам гибкий инструмент создания отчетов для анализа различных аспектов работы суперкомпьютера с требуемым уровнем детализации, а также оценивает уровень шума на вычислительных узлах. В данной работе приведено детальное описание текущей структуры и возможностей TASC, включая этапы обработки и хранения данных, а также выполнения различных видов анализа. Также описаны новые полученные результаты и разработанные методы в рамках одного из основных компонентов TASC — системы оценок для быстрого и точного определения эффективности использования суперкомпьютерных ресурсов.
Ключевые слова:высокопроизводительные вычисления, суперкомпьютер, анализ производительности, анализ качества работы, анализ операционных данных, мониторинг.