Аннотация:
Для решения задачи распознавания вторичной структуры белков предложен алгоритм кластеризации подпоследовательности аминокислотных остатков. Для выявления кластеров используются парные расстояния между подпоследовательностями. Отличительной особенностью алгоритма является то, что не требуется строить полную матрицу парных расстояний, что снижает сложность вычислений. При кластеризации рассматриваются только ранги расстояний между подпоследовательностями. Работа алгоритма проиллюстрирована синтетическими данными и данными из базы UniProtKB.