RUS  ENG
Полная версия
ЖУРНАЛЫ // Математическая биология и биоинформатика // Архив

Матем. биология и биоинформ., 2020, том 15, выпуск 2, страницы 441–454 (Mi mbb441)

Эта публикация цитируется в 2 статьях

Биоинформатика

Исследование структуры кодирования ORF1ab, S, M и N генов коронавирусов

М. Б. Чалейa, Ж. С. Тюлькоbc, В. А. Кутыркинd

a Институт математических проблем биологии РАН – филиал Института прикладной математики им. М.В. Келдыша РАН, Пущино, Московская область, Россия
b Омский государственный медицинский университет Минздрава России, Омск, Россия
c ФГУН «Омский НИИ природно-очаговых инфекций Роспотребнадзора», Омск, Россия
d Московский государственный технический университет имени Н. Э. Баумана, Москва, Россия

Аннотация: В работе спектрально-статистический подход применен к сравнительному анализу геномов коронавирусов четырех родов Alphacoronavirus, Betacoronavirus (включая новый SARS-CoV-2 вирус), Gammacoronavirus и Deltacoronavirus, который выполнялся с точки зрения наличия 3-регулярности и скрытой триплетной профильной периодичности в кодирующих последовательностях четырех структурных генов: ORF1ab, кодирующего транскриптазу; S-гена гликопротеина, формирующего шипы; M-гена мембранного белка; N-гена нуклеопротеина. Общее число анализируемых геномов составило 3410. Соответственно, оно определяло и численность каждой выделенной группы генов. В результате, практически во всех CDS анализируемых генов ORF1ab, S и N была выявлена скрытая профильная триплетная периодичность и высокое значение индекса 3- регулярности, как показателя качества сохранности триплетной структуры кодирования. Для M-генов, напротив, была выявлена тенденция к размытию их структуры кодирования вплоть до однородности 60 % этих генов в анализируемых геномах альфакоронавирусов и 67 % в геномах гаммакоронавирусов. Тенденция размытия такой структуры, сопровождаемая снижением среднего значения индекса 3-регулярности в сравнении с остальными генами, при сохранении триплетной профильной периодичности, была отмечена и для M-генов SARS-CoV-2 вируса. Возможно, отмеченная тенденция отражает значение изменчивости M-генов при адаптации коронавируса к новым хозяевам рода. Анализ матриц 3-профильной периодичности для четырех, анализируемых в работе генов вируса SARSCoV-2, выделенного в Европе, Азии и США, не выявил их значимого различия, что предполагает единый источник распространения этого вируса.

Ключевые слова: свойство 3-регулярности CDS, скрытая профильная триплетная периодичность, геном коронавируса, геном SARS-Cov-2 вируса, ORF1ab, S-ген, M-ген, N-ген.

Материал поступил в редакцию 21.11.2020, 14.12.2020, опубликован 25.12.2020

DOI: 10.17537/2020.15.441



© МИАН, 2024