Аннотация:
Описан оригинальный алгоритм кластеризации разнотипных данных, основанный на комплексном применении набора мер расстояний и методов кластеризации и многоэтапной кластеризации. В рамках алгоритма реализовано ранжирование признаков объекта по их значимости для группировки и выбор оптимального набора признаков, ансамблевый подход для получения более устойчивого итогового кластерного решения. Алгоритм реализован в программной системе MixDC (Mixed Data Clustering). Приведены методика и результаты решения реальной задачи кластеризации медицинских данных средствами программной системы.