Аннотация:
В работе предложен таргетный подход к распознаванию подрода коронавируса на основе распределения частот кодонов N-гена белка нуклеокапсида. В предложенном подходе на основе статистики вычисляется отклонение распределения частот кодонов в N-гене анализируемого генома коронавируса от такого же распределения в каждом из 67 прототипных штаммов, характеризующих 23 подрода в четырех родах коронавирусов. Наименьшее отклонение от распределения в одном из прототипных штаммов указывает на подрод, к которому принадлежит этот штамм. Такой подход оказался эффективным и обеспечивает достоверность распознавания подрода коронавируса не менее 99%. Среди всех кодонов генетического кода в соответствии с распределением их частот в N-гене коронавирусов выделены совокупности из 38 и 7 кодонов, обеспечивающих требуемую эффективность распознавания. Выделенные в этих совокупностях кодоны фиксируют таксономическую структуру подрода коронавируса.