Аннотация:
Изучение метагеномных (в частности, метавиромных) данных стало одним из лидирующих направлений в биологии в последние годы. Рост количества данных секвенирования стимулировал развитие методов анализа, направленных на изучение вирусного разнообразия, обнаруженного в природных образцах. Недавние достижения в этой области подчеркивают важность интеграции высокопроизводительных технологий секвенирования с передовыми биоинформатическими инструментами, поскольку это повышает чувствительность и точность идентификации вирусов. В данном исследовании представлена новая конвейерная система VERA, разработанная для анализа данных секвенирования метавиромов. В основе лежит принцип строгой двойной фильтрации контигов, что позволяет максимизировать обнаружение истинных вирусных последовательностей и минимизировать включение невирусных артефактов. Улучшая обнаружение вирусов через двойную таксономическую фильтрацию и используя современные системы управления рабочими процессами, созданный конвейер не только устраняет пробелы в существующих методах, но и предлагает новый подход к метавирусным исследованиям. Конвейер реализован на системе Nextflow. Валидация VERA проведена с использованием контрольных образцов. Результаты показали соответствие ручной проверки, и были сопоставимы по точности с коммерческими платформами. Конвейер VERA предлагает инновационный подход к изучению полноты и сложности вирусного разнообразия в природных образцах. В перспективе, его внедрение дает новые возможности для исследований в области вирусологии и экологии.