RUS  ENG
Полная версия
ЖУРНАЛЫ // Вычислительные методы и программирование // Архив

Выч. мет. программирование, 2023, том 24, выпуск 4, страницы 339–351 (Mi vmp1093)

Параллельные программные средства и технологии

Алгоритмы редукции и широковещательной рассылки MPI на базе разделяемой памяти многопроцессорных узлов

А. А. Романютаa, М. Г. Курносовbc

a Сибирский государственный университет телекоммуникаций и информатики, г. Новосибирск
b Сибирская государственная академия телекоммуникаций и информатики
c Институт физики полупроводников им. А. В. Ржанова СО РАН, г. Новосибирск

Аннотация: Предложены алгоритмы реализации коллективных операций MPI_Bcast, MPI_Reduce, MPI_Allreduce с использованием разделяемой памяти многопроцессорных серверов. Алгоритмы создают сегмент разделяемой памяти и систему очередей в нем, через которые выполняется передача блоков сообщений. Программная реализация выполнена на базе библиотеки Open MPI в виде изолированного компонента coll/sharm. В отличие от существующих алгоритмов, взаимодействие с системой очередей организовано через активное ожидание, что сокращает количество барьерных синхронизаций и атомарных операций. При проведении экспериментов на сервере с архитектурой x86–64 для операции MPI_Bcast получено наибольшее сокращение времени в 6.5 раз (на 85% меньше) и MPI_Reduce в 3.3 раза (на 70% меньше) по сравнению с реализацией в компоненте coll/tuned библиотеки Open MPI. Предложены рекомендации по использованию алгоритмов для различных размеров сообщений.

Ключевые слова: Bcast; Reduce; Allreduce; коллективные операции; MPI; вычислительные системы.

УДК: 004.724.3

Поступила в редакцию: 24.07.2023

DOI: 10.26089/NumMet.v24r424



© МИАН, 2024