Аннотация:
Рассмотрена параллельная реализация циклического многосеточного метода, решающего краевую задачу для уравнения Пуассона в $R^3$ на графических процессорах с применением платформы NVIDIA CUDA. Выполнено сопоставление результатов расчета задач на графическом процессоре с аналитическим решением краевой задачи Дирихле и с численным решением на ЦПУ смешанной краевой задачи. Сопоставление скорости расчета на видеокарте NVIDIA GeForce 8800 GTX со
скалярной версией на процессоре AMD Athlon 64X2 4800+ показало ускорение
до 200 раз для дискретной области в 1 000 000 элементов, а сопоставление с рабочей станцией
на двух четырехъядерных процессорах Intel(R) Xeon(R) 2.33 ГГц показало ускорение в 40 раз.
Работа поддержана РФФИ
(коды проектов 08-07-00074а и 06-07-89047а) и программой ОНИТ РАН
(проект 1.12).