RUS  ENG
Полная версия
ЖУРНАЛЫ // Математическая биология и биоинформатика // Архив

Матем. биология и биоинформ., 2012, том 7, выпуск 2, страницы 476–492 (Mi mbb117)

Эта публикация цитируется в 2 статьях

Биоинформатика

Поиск протяженных повторов в геномах на основе спектрально-аналитического метода

А. Н. Панкратовab, М. И. Пятковa, Р. К. Тетуевa, Н. Н. Назиповаa, Ф. Ф. Дедусb

a Институт математических проблем биологии РАН, 142290, Пущино, ул. Институтская, д. 4
b Факультет ВМК МГУ имени М. В. Ломоносова, 119991 ГСП-1, Москва, Ленинские горы

Аннотация: Разработан спектрально-аналитический подход к выявлению размытых протяженных повторов в геномных последовательностях. Метод основан на разномасштабном интегральном оценивании сходства нуклеотидных последовательностей в пространстве коэффициентов разложения фрагментов кривых GC- и GA-содержания по классическим ортогональным базисам. Найдены условия оптимальной аппроксимации, обеспечивающие автоматическое распознавание повторов различных видов (прямых и инвертированных, а также тандемных) на спектральной матрице сходства. Метод одинаково хорошо работает на разных масштабах данных. Он позволяет выявлять следы сегментных дупликаций и мегасателлитные участки в геноме, районы синтении при сравнении пары геномов. Его можно использовать для детального изучения фрагментов хромосом (поиска размытых участков с умеренной длиной повторяющегося паттерна).

Ключевые слова: сравнение геномов, аппроксимация, матрица сходства, распознавание образов, мегасателлиты, разнесенные повторы.

УДК: 519

Материал поступил в редакцию 15.07.2012, опубликован 08.08.2012



© МИАН, 2024