Аннотация:
В настоящей работе для выявления скрытой периодичности в биологических последовательностях используется модель дополнительных статистических экспериментов. Эта модель, включающая понятие нечетких тандемных повторов (Fuzzy Tandem Repeats), позволила предложить оригинальные статистические методы для оценки паттерна периодичности в размытых тандемных повторах (Approximate Tandem Repeats). В ряде случаев, при существенном проценте вставок и делеций в последовательности размытого тандемного повтора, выравнивание на основе полученной оценки размера паттерна периодичности оказывается более оптимальным по сравнению с выравниванием на основе известного метода Tandem Repeats Finder (TRF). Предложенные оригинальные статистические методы обладают значительно большей мощностью по сравнению с существующими аналогами. Основное достоинство этих методов состоит в возможности их применения в практических условиях нерепрезентативных выборок.