Аннотация:
Описывается архитектура центра обработки данных высокопроизводительного секвенирования. Для повышения производительности подсистемы ввода-вывода предлагается использование специализированных хранилищ данных с аппаратными RAID-контроллерами, распределение нагрузки по нескольким серверам данных с помощью распределенной файловой системы Lustre, выделение специализированных томов под ресурсоемкие задачи при помощи инфраструктуры Fiber Channel и кластерной файловой системы OCFS2.
Ключевые слова:центр обработки данных, big data, геномика, оптимизация, распределенная файловая система.