Аннотация:
Разработан эффективный метод для решения задачи распознавания участков протяженных (длиной от 1000 н.п.) размытых тандемных сегментных дупликаций в геномах высших эукариот. Основу метода составляет многократное сканирование генома с использованием скользящего окна с длинами рамки, равными степеням двойки начиная с 256 н.п. Для каждого окна подсчитывается процент GC-содержания, а последовательные значения этой характеристики определяют GC-профиль. Создано программное обеспечение, которое выявляет участки устойчивых осцилляций GC-профиля и определяет характеристики обуславливающих эти осцилляции паттернов периодичности. Преимущества нового подхода, использующего комбинацию численно-аналитических методов, позволили выявить мегасателлитные участки в геноме мыши.