В. А. Аулов, А. А. Климентов, Р. Ю. Машинистов, А. В. Недолужко, А. М. Новиков, А. А. Пойда, И. С. Тертычный, А. Б. Теслюк, Ф. С. Шарко, “Интеграция гетерогенных вычислительных инфраструктур для анализа данных геномного секвенирования”, Матем. биология и биоинформ., 2016, том 11, выпуск 2,страницы 205

Эта публикация цитируется в 1 статье

Информационные и вычислительные технологии в биологии и медицине

Интеграция гетерогенных вычислительных инфраструктур для анализа данных геномного секвенирования

В. А. Аулов^a, А. А. Климентов, Р. Ю. Машинистов^a, А. В. Недолужко^a, А. М. Новиков^a, А. А. Пойда^a, И. С. Тертычный^a, А. Б. Теслюк^a, Ф. С. Шарко^a

^a Национальный исследовательский центр «Курчатовский институт», Москва, Россия

Аннотация: Недавние достижения технологий в области геномного секвенирования нового поколения (NGS — Next Generation Genome Sequencing) привели к значительному увеличению объема данных, которые должны быть обработаны, проанализированы и доступны заинтересованным исследователям. Это, в свою очередь, привело к повышению требований к вычислительным платформам обработки данных: потребовалось больше оперативной памяти и более мощные процессоры. Для эффективной обработки данных необходимы принципиально новые подходы в организации вычислений. Авторами статьи было проведено исследование возможности применения методов и подходов, используемых в физике высоких энергий, для объединения гетерогенных вычислительных ресурсов в единую вычислительную платформу. Была разработана полномасштабная система управления данными и заданиями на базе вычислительных мощностей Национального исследовательского центра «Курчатовский институт». В разработанную систему был интегрирован рабочий поток для обработки данных геномного секвенирования с использованием пакета PALEOMIX. Результаты апробации разработанной системы на задаче анализа древней ДНК мамонта показали существенное уменьшение общего времени выполнения задачи.

Ключевые слова: распределенные вычисления, суперкомпьютеры, геномное секвенирование.

УДК: 004.75

Материал поступил в редакцию 15.07.2016, опубликован 21.10.2016

DOI: 10.17537/2016.11.205