Аннотация:
Триплетная периодичность является общеизвестным свойством кодирующих последовательностей оснований ДНК. Однако недавно проведенные исследования показали, что около 20% (122829) последовательностей генов из банка данных KEGG (версии 29) не имеют триплетной периодичности без делеций/вставок на статистически значимом уровне. В данной работе ставилась задача показать, что отсутствие триплетной периодичности в некоторых последовательностях может быть обусловлено сдвигами открытой рамки считывания. Для выявления сдвигов рамки считывания предложен новый математический метод, основанный на вычислении меры сходства между типами триплетной периодичности фрагментов последовательности до и после позиции предполагаемого сдвига рамки считывания. С помощью разработанного подхода было найдено 4724 последовательности, имеющие сдвиг рамки считывания. Мы предположили, что в этих случаях мутации типа вставок или делеций привели к образованию новой рамки считывания и нарушению триплетной периодичности последовательности. Выявленные последовательности были перекодированы в аминокислотные последовательности по существующей рамке считывания и древней рамке считывания с учетом сдвига. Оказалось, что 243 последовательности, построенные по древней рамке, имеют подобие к аминокислотным последовательностям банка данных Swiss-Prot, что подтверждает наше предположение о возможности эволюции генов посредством сдвигов рамки считывания.