К.С. Исупов, В. С. Князьков, “Матрично-векторное умножение многократной точности на графическом процессоре”, Программные системы: теория и приложения, 2020, том 11, выпуск 3,страницы 33

Эта публикация цитируется в 2 статьях

Программное и аппаратное обеспечение для суперЭВМ

Матрично-векторное умножение многократной точности на графическом процессоре

К.С. Исупов^a, В. С. Князьков^b

^a Вятский государственный университет
^b Пензенский государственный университет

Аннотация: Мы рассматриваем параллельную реализацию матрично-векторного умножения (GEMV, уровень 2 BLAS) для графических процессоров (GPU) с использованием арифметики многократной точности на основе системы остаточных классов. В нашей реализации GEMV покомпонентные операции с многоразрядными векторами и матрицами разбиваются на части, каждая из которых выполняется отдельным CUDA ядром. Это исключает ветвление логики исполнения и позволяет добиться более полного использования ресурсов GPU. Эффективная структура данных для хранения многоразрядных массивов обеспечивает объединение доступов параллельных потоков к глобальной памяти GPU в транзакции. Для предложенной реализации GEMV выполнен анализ ошибок округления и получены оценки точности. Представлены экспериментальные результаты, показывающие высокую эффективность разработанной реализации по сравнению с существующими программными пакетами многократной точности для GPU.

Ключевые слова и фразы: вычисления высокой точности, BLAS, GEMV, параллельные алгоритмы, CUDA, GPU, система остаточных классов.

УДК: 004.222+004.272.25
ББК: З973:З972.1

Поступила в редакцию: 29.04.2020
24.07.2020

DOI: 10.25209/2079-3316-2020-11-3-33-59