Аннотация:
Дан сравнительный анализ производительности серверных ARM\=/процессоров, используемых на суперЭВМ или ориентированных в частности на высокопроизводительные вычисления (HPC).
В стартовый анализ производительности были отобраны Fujitsu A64FX, Marvell ThunderX2 и Huawei Kunpeng 920. Обзор производительности для HPC сосредоточен в первую очередь на тестах и приложениях для A64FX, поддерживающего более длинные, чем у других ARM\=/процессоров, вектора и имеющего большую пиковую производительность.
Производительность A64FX сопоставлена с соответствующими данными для Intel Xeon Skylake и Cascade Lake, и AMD EPYC с Zen 2 и 3 (Roma и Milan), а также с GPU Nvidia V100 и A100.
Сформулирован краткий набор потенциальных плюсов и минусов микроархитектуры A64FX.
Сопоставлены данные о производительности, получаемой с применением различных компиляторов для A64FX. Сформированы признаки, когда A64FX дает обычно преимущества в производительности относительно x86-64, а когда – проигрывает x86-64.
Подтверждается, что применение A64FX в суперЭВМ может расти далее.
Возможно, гегемония x86-64 в HPC будет уменьшаться, в том числе за счет расширения применения серверных ARM\=/процессоров.
Однако проведенный анализ A64FX и ожидаемых в ближайшее время новых процессоров архитектуры AArch64 показал, что ведущим в этом процессе не обязательно окажется A64FX.
Ключевые слова и фразы:ARM, AArch64, A64FX, x86-64, высокопроизводительные вычисления, суперЭВМ, тесты производительности.