RUS  ENG
Полная версия
ЖУРНАЛЫ // Ученые записки Казанского университета. Серия Физико-математические науки // Архив

Учен. зап. Казан. ун-та. Сер. Физ.-матем. науки, 2012, том 154, книга 3, страницы 202–215 (Mi uzku1151)

Эта публикация цитируется в 4 статьях

Параллельные алгоритмы формирования и решения системы дополнения Шура на графических ускорителях

С. П. Копысов, И. М. Кузьмин, Н. С. Недожогин, А. К. Новиков

Институт механики УрО РАН

Аннотация: В работе рассмотрен параллельный алгоритм вычисления дополнения Шура. Эффективное применение нескольких графических ускорителей для метода дополнения Шура связано с разделением матриц и определением алгоритмов, которые более эффективно выполняются на центральном процессоре (CPU) или графических ускорителях (GPU). Представлен алгоритм обращения матрицы через решение матричной системы множеством параллельных потоков. Показано, что формирование матриц дополнения Шура для нескольких подобластей эффективно выполнять на GPU, а с ростом числа подобластей — на CPU. Для решения интерфейсной системы предложен параллельный алгоритм метода сопряженных градиентов с явным предобуславливателем, позволяющий достигать существенного ускорения вычислений (в $251$ раз) на восьми GPU при разделении исходной системы уравнений на 64 подобласти.

Ключевые слова: дополнение Шура, параллельные вычисления, предобусловленный метод сопряженных градиентов, графические ускорители.

УДК: 004.272.2+519.612:519.63

Поступила в редакцию: 18.06.2012



© МИАН, 2024