В. В. Стрижов, М. П. Кузнецов, К. В. Рудаков, “Метрическая кластеризация последовательностей аминокислотных остатков в ранговых шкалах”, Матем. биология и биоинформ., 2012, том 7, выпуск 1,страницы 345

Эта публикация цитируется в 1 статье

Интеллектуальный анализ данных

Метрическая кластеризация последовательностей аминокислотных остатков в ранговых шкалах

В. В. Стрижов^a, М. П. Кузнецов^b, К. В. Рудаков^a

^a Вычислительный центр им. А. А. Дородницына, Российская академия наук, Москва, 19333, Россия
^b Московский физико-технический институт (Государственный университет), Долгопрудный, Московская область, 141700, Россия

Аннотация: Для решения задачи распознавания вторичной структуры белков предложен алгоритм кластеризации подпоследовательности аминокислотных остатков. Для выявления кластеров используются парные расстояния между подпоследовательностями. Отличительной особенностью алгоритма является то, что не требуется строить полную матрицу парных расстояний, что снижает сложность вычислений. При кластеризации рассматриваются только ранги расстояний между подпоследовательностями. Работа алгоритма проиллюстрирована синтетическими данными и данными из базы UniProtKB.

Ключевые слова: кластеризация, функция расстояния, матрица парных расстояний, метрическая конфигурация, ранговые шкалы.

УДК: 519.95

Материал поступил в редакцию 25.04.2012, опубликован 25.06.2012