RUS  ENG
Полная версия
ЖУРНАЛЫ // Математическая биология и биоинформатика // Архив

Матем. биология и биоинформ., 2025, том 20, выпуск 1, страницы 100–121 (Mi mbb588)

Биоинформатика

Facilitating rapid screening of metaviral data with the VERA pipeline

[Cкрининг метавирусных данных с использованием вычислительного конвейера VERA]

I. K. Chudinovab, A. S. Speranskayac

a Scientific Research Institute for Systems Biology and Medicine of Rospotrebnadzor, Moscow
b Moscow Institute of Physics and Technology (National Research University), Moscow, Russia
c Vavilov Institute of General Genetics Russian Academy of Science, Moscow, Russia

Аннотация: Изучение метагеномных (в частности, метавиромных) данных стало одним из лидирующих направлений в биологии в последние годы. Рост количества данных секвенирования стимулировал развитие методов анализа, направленных на изучение вирусного разнообразия, обнаруженного в природных образцах. Недавние достижения в этой области подчеркивают важность интеграции высокопроизводительных технологий секвенирования с передовыми биоинформатическими инструментами, поскольку это повышает чувствительность и точность идентификации вирусов. В данном исследовании представлена новая конвейерная система VERA, разработанная для анализа данных секвенирования метавиромов. В основе лежит принцип строгой двойной фильтрации контигов, что позволяет максимизировать обнаружение истинных вирусных последовательностей и минимизировать включение невирусных артефактов. Улучшая обнаружение вирусов через двойную таксономическую фильтрацию и используя современные системы управления рабочими процессами, созданный конвейер не только устраняет пробелы в существующих методах, но и предлагает новый подход к метавирусным исследованиям. Конвейер реализован на системе Nextflow. Валидация VERA проведена с использованием контрольных образцов. Результаты показали соответствие ручной проверки, и были сопоставимы по точности с коммерческими платформами. Конвейер VERA предлагает инновационный подход к изучению полноты и сложности вирусного разнообразия в природных образцах. В перспективе, его внедрение дает новые возможности для исследований в области вирусологии и экологии.

Ключевые слова: NGS, метавирусные исследования, NextFlow, вычислительные конвейеры, таксономическая идентификация.

Материал поступил в редакцию 10.03.2025, 23.03.2025, опубликован 14.05.2025

Язык публикации: английский

DOI: 10.17537/2025.20.100



Реферативные базы данных:


© МИАН, 2025