Аннотация:
Большинство проблем структурной вычислительной биологии требуют решения задачи минимизации энергетической функции (силового поля), определенной на геометрии молекулы. Это позволяет определять свойства молекул, предсказывать правильное положение белковых цепей, находить лучшую состыковку молекул при предсказании комплексообразования (докинге), проверять гипотезы относительно белкового дизайна и решать многие другие задачи, возникающие при современной разработке лекарственных средств. В случае низкомолекулярных соединений (состоящих из менее чем 250 атомов) задача нахождения геометрии, минимизирующей энергетическую функцию, является достаточно хорошо решенной. Более сложной задачей является минимизация макромолекул (в частности, белков), в состав которых входят десятки тысяч атомов. Однако отличительной особенностью данных постановок задач является наличие начальных приближений, близких к искомому решению. Таким образом, исходная задача может быть сформулирована как задача невыпуклой оптимизации в пространстве порядка $10^4$ переменных. При этом сложность вычисления как значения функции, так и градиента, квадратична по числу переменных. В статье приводится сопоставительный анализ безградиентных методов с линейкой методов градиентного типа (градиентный спуск, быстрый градиентный спуск, метод сопряженных градиентов, квазиньютоновские методы) в GPU-реализациях (Graphical Processing Unit, графический процессор). Библ. 42. Фиг. 4. Табл. 1.
Ключевые слова:минимизация энергии, гомологичный фолдинг, быстрый градиентный спуск, метод сопряженных градиентов, Limited-memory Broyden-Fletcher–Goldfarb–Shanno (LBFGS), параллельные вычисления, Graphical Processing Unit (GPU).
УДК:519.85
Поступила в редакцию: 08.10.2018 Исправленный вариант: 15.07.2019 Принята в печать: 05.08.2019