RUS  ENG
Полная версия
ЖУРНАЛЫ // Вычислительные методы и программирование // Архив

Выч. мет. программирование, 2025, том 26, выпуск 2, страницы 140–149 (Mi vmp1155)

Асинхронная реализация метода Холецкого для разреженных матриц на компьютерах с NUMA-архитектурой

А. С. Маслов, М. М. Макаров, Н. Н. Потравкин, С. О. Проскурня

ООО “ТС Интеграция”

Аннотация: Реализован параллельный алгоритм разложения Холецкого для разреженных матриц, основанный на парадигме асинхронного выполнения и учитывающий особенности NUMA-архитектуры. Выполнение стадий численного разложения и прямой/обратной подстановки представляется в виде ориентированного ациклического графа, что позволяет обходиться без барьеров синхронизации, а также увеличить локальность доступа к данным с целью более эффективного использования иерархии подсистемы памяти вычислительного устройства. Оценка производительности показывает хорошую масштабируемость в сравнении с высоко оптимизированным коммерческим пакетом Intel MKL PARDISO, подтверждая эффективность предлагаемого подхода.

Ключевые слова: разложение Холецкого, NUMA-архитектура, парадигма асинхронного выполнения, ориентированный ациклический граф, библиотека hwloc.

УДК: 519.612.2

Поступила в редакцию: 13.02.2025
Принята в печать: 17.03.2025

DOI: 10.26089/NumMet.v26r210



© МИАН, 2025