Аннотация:
Алгоритмы на графах часто используются для анализа и интерпретации биологических данных. Одним из широко используемых подходов является решение задачи поиска активного модуля, в которой в графе биологических взаимодействий выделяется связный подграф, лучше всего отражающий разницу между двумя рассматриваемыми биологическими состояниями. В настоящей работе этот подход расширяется на случай большего числа биологических состояний и формулируется задача совместной кластеризации в графовом и корреляционном пространстве.
Для решения этой задачи предлагается итеративный метод, принимающий на вход граф $G$ и матрицу $X$, в которой строки соответствуют вершинам графа. На выходе алгоритм выдает набор подграфов графа $G$ так, что каждый подграф является связным и строки, соответствующие его вершинам, обладают высокой попарной корреляцией. Эффективность метода подтверждается экспериментальным исследованием на смоделированных данных.