Аннотация:
Предложены стохастические модели, объясняющие реальные характерные закономерности кодирующих районов из геномов различных организмов. Вследствие нарастающего объема данных по секвенированным геномам возникает проблема их автоматизированного анализа. С использованием этих моделей разработаны методы распознавания структурно-статистических свойств геномных последовательностей ДНК, которые могут быть использованы для разработки алгоритмов и компьютерных программ для автоматизированной обработки большого объема данных. Свойства предложенных стохастических моделей кодирования продемонстрированы в численных экспериментах с бинарно перекодированными абзацами литературных произведений на английском и итальянском языках.