ИНФОРМАЦИОННЫЕ И ВЫЧИСЛИТЕЛЬНЫЕ ТЕХНОЛОГИИ
Анализ эффективности гибридного параллельного алгоритма численного решения задачи Коши для эредитарных моделей объемной активности радона в рамках программного комплекса FEVO
Д. А. Твёрдый Институт космофизических исследований и распространения радиоволн ДВО РАН
Аннотация:
В статье представлено исследование вычислительной эффективности гибридного параллельного алгоритма, реализующего нелокальную неявную конечно-разностную схему (IFDS) для численного решения задачи динамики объемной активности радона (ОАР). В частности, решается задача Коши для нелинейного уравнения с производной дробного переменного порядка типа Герасимова-Капуто (эредитарная
$\alpha$(t)-модель) для описания в накопительной камере аномальной динамики ОАР, которая может предшествовать сильным землетрясениям. Инструменты для анализа данных и моделирования динамики ОАР реализованы в программном комплексе FEVO. Также в программном комплексе FEVO с учетом известных наблюдаемых данных ОАР, методом безусловной оптимизации Левенберга-Марквардта реализовано решение обратных задач на идентификацию параметров эредитарных
$\alpha$(t)-моделей, которое требует многократного их решения в рамках прямой задачи, что в свою очередь обуславливает важность разработки параллельных алгоритмов их решения. Параллельный алгоритм был реализован на языке C из-за его быстродействия и универсальности при работе с памятью, что важно при организации вычислений на CPU (с помощью API OpenMP) совместно с GPU (с помощью API CUDA). Анализ эффективности алгоритма проводился как серия из 10 вычислительных экспериментов на персональном ЭВМ, состоящих в решении тестового примера на основе эредитарной
$\alpha$(t)-модели ОАР. Далее определяются: ускорение, эффективность и стоимость алгоритма, оценивается эффективность загрузки потоков CPU. Инструменты анализа эффективности реализованы в FEVO. Из анализа можно сделать вывод, что гибридный параллельный алгоритм IFDS показывает ускорение работы в 9–12 раз по сравнению с самой быстрой последовательной реализацией.
Ключевые слова:
параллельные вычисления, CUDA, OpenMP, C, эффект памяти, эредитарность, нелокальность по времени, дробные производные, динамические системы, нелинейность, неявные конечно-разностные схемы.
УДК:
519.687.1;
519.642.2
MSC: Primary
68W10; Secondary
65Y20;
26A33 Поступила в редакцию: 10.03.2025
Исправленный вариант: 03.04.2025
Принята в печать: 18.04.2025
DOI:
10.26117/2079-6641-2025-50-1-149-168