Аннотация:
Проведено тестирование многоядерных графических процессоров на самом ресурсоемком алгоритме внерешеточной молекулярной динамики — расчете межчастичных расстояний. Использовано несколько видеокарт NVIDIA GeForce с количеством ядер от 64 до 512, работающих на различной частоте, а также специализированный вычислительный процессор Tesla C 2050. Все процессоры обладают одинаковой архитектурой и исполняют код, изготовленный компилятором CUDA C. Относительная производительность алгоритма, исполняемого любым графическим процессором, существенно растет с увеличением объема расчетов, обусловленного как ростом количества частиц в системе, так и радиуса обрезания межчастичного взаимодействия. Величина относительной производительности в сравнении с исполнением того же алгоритма на одном ядре центрального процессора частотой 2.2 ГГц для самых мощных видеокарт достигает 90, хотя исполнимый код для центрального процессора был изготовлен оптимизирующим компилятором C++ в составе MS Visual Studio 2008. Приведенная к единице частоты относительная производительность в зависимости от числа ядер хорошо описывается законом Амдала.