Аннотация:
В статье рассматривается подход к анализу информации, представленной словами конечной длины над конечным алфавитом. Предложен метод построения меры символьного разнообразия слов, основанный на пиковых характеристиках функции энтропии сдвигов. Собственно функция энтропии сдвигов формализована на основе оператора сдвига один и понятия энтропии дискретных распределений. Приводятся модельный пример и результаты применения предложенной меры к кластеризации семейств растений на основе анализа геномов их представителей.
Ключевые слова:энтропия сдвигов, мера символьного разнообразия, кластеризация геномов растений.
УДК:
51-76: 57.087
Материал поступил в редакцию 05.04.2016, опубликован 25.05.2016