Аннотация:
Представлен анализ данных первого выпуска базы HeteroGenome, содержащей выявленные районы скрытой периодичности в геномах ряда эукариотических организмов. Тандемные повторы с различной сохранностью копий паттерна, включая сильно размытые повторы, были идентифицированы в геномах S. cerevisiae, A. thaliana, C. elegans и D. melanogaster. Данные были получены с помощью оригинального спектрально-статистического подхода к поиску достоверных районов скрытой периодичности в последовательностях ДНК. Введение двухуровневой структуры представления данных (на первом, неизбыточном, уровне районы скрытой периодичности рассматриваются в целом, на втором уровне — консервативные фрагменты их периодической структуры) позволило оценить долю покрытия ($\sim10\%$ от длины генома) анализируемых геномов районами скрытой периодичности. Оценка выведена на основе данных первого уровня. Анализ количественного и качественного состава (по уровню дивергенции) районов скрытой периодичности по всем хромосомам рассматриваемых организмов выявил характеристические типы периодичности в геноме каждого организма. Получены гистограммы плотности распределения районов скрытой периодичности для каждой хромосомы рассматриваемых геномов. Выявлен репертуар длин периодов в геномах. База данных HeteroGenome предоставляет дополнительные возможности анализа содержащихся в ней данных и доступна по адресу: http://www.jcbi.ru/lp_baze/.
Ключевые слова:скрытая периодичность, тандемные повторы, анализ генома.
УДК:
577.322
Материал поступил в редакцию 23.07.2013, опубликован 24.09.2013