В. А. Кутыркин, М. Б. Чалей, “Стохастические модели кодирования и распознавание структурно-статистических характеристик кодирующих последовательностей”, Мат. моделир. и числ. методы, 2017, выпуск 15,страницы 119

Стохастические модели кодирования и распознавание структурно-статистических характеристик кодирующих последовательностей

В. А. Кутыркин^a, М. Б. Чалей^b

^a Московский государственный технический университет имени Н. Э. Баумана
^b Институт математических проблем биологии РАН, г. Пущино

Аннотация: Предложены стохастические модели, объясняющие реальные характерные закономерности кодирующих районов из геномов различных организмов. Вследствие нарастающего объема данных по секвенированным геномам возникает проблема их автоматизированного анализа. С использованием этих моделей разработаны методы распознавания структурно-статистических свойств геномных последовательностей ДНК, которые могут быть использованы для разработки алгоритмов и компьютерных программ для автоматизированной обработки большого объема данных. Свойства предложенных стохастических моделей кодирования продемонстрированы в численных экспериментах с бинарно перекодированными абзацами литературных произведений на английском и итальянском языках.

Ключевые слова: профиль случайной строки, профильная периодичность, паттерн профильной периодичности, стохастический кодон, мультиполиномиальная модель.

УДК: 519.25

DOI: 10.18698/2309-3684-2017-3-119138