RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Удмуртского университета. Математика. Механика. Компьютерные науки // Архив

Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 2018, том 28, выпуск 3, страницы 419–426 (Mi vuu648)

КОМПЬЮТЕРНЫЕ НАУКИ

The peculiarities of the parallel implementation of Particle-In-Cell method

[Особенности параллельной реализации метода частиц в ячейках]

A. A. Romanenkoa, A. V. Snytnikovb

a Novosibirsk State University, ul. Pirogova, 1, Novosibirsk, 630090, Russia
b Institute of Computational Mathematics and Mathematical Geophysics, Siberian Branch of the Russian Academy of Sciences, pr. Acad. Lavrent'eva, 6, Novosibirsk, 630090, Russia

Аннотация: Метод частиц в ячейках широко используется для моделирования плазмы, в то время как графические процессоры представляются наиболее эффективным инструментом для проведения расчетов с помощью этого метода. В данной работе предлагается подход, позволяющий ускорить один из наиболее затратных по времени этапов в проведении расчетов по методу частиц в ячейках на графических ускорителях. Этот этап представляет собой переупорядочивание модельных частиц, или перераспределение их между ячейками сетки. Переупорядочивание модельных частиц позволяет обеспечить локальность данных, которая в первую очередь определяет эффективность реализации метода частиц в ячейках. В данной работе предлагается разделить переупорядочивание на два этапа. На первом этапе для каждой ячейки нужно собрать все модельные частицы, которые должны покинуть данную ячейку, в массивы, число которых равно количеству соседних ячеек (в трехмерном случае имеется 26 соседних ячеек). На втором этапе каждая из соседних ячеек копирует частицы из соответствующего массива рассматриваемой ячейки в ее собственный массив частиц. Так как второй этап может выполняться одновременно двадцатью шестью нитями без синхронизации и ожиданий, и при этом не используются критические секции, семафоры, мутексы, атомарные операции и другие подобные инструменты, то в результате время выполнения переупорядочивания сокращается более чем в 10 раз по сравнению с неоптимизированной реализацией переупорядочивания с использованием синхронизации.

Ключевые слова: оптимизация, GPU, графические процессоры, моделирование, PIC.

УДК: 519.684

MSC: 68U20, 68N99

Поступила в редакцию: 23.05.2018

Язык публикации: английский

DOI: 10.20537/vm180311



Реферативные базы данных:


© МИАН, 2024