Аннотация:
Лейкоцитарная формула — это процентное отношение основных групп белых клеток крови (лейкоцитов). По морфологическим признакам среди лейкоцитов можно выделить три субпопуляции: лимфоциты, моноциты и гранулоциты, последние разделяют на нейтрофильные, эозинофильные и базофильные клетки. Автоматическая типологизация белых клеток крови является нерешенной задачей, поэтому при их цитометрическом исследовании подсчет количества клеток в различных субпопуляциях лейкоцитов фактически производится вручную, что, в свою очередь, обусловливает субъективность эксперимента и большие значения погрешностей при вычислениях. Для решения проблемы автоматической типологизации белых клеток крови предпринимались попытки использования методов кластерного анализа. В вычислительных экспериментах было показано, что применение стандартных алгоритмов, таких как метод К-средних, EM-алгоритм, DBSCAN и т. п., не эффективно. За последние годы опубликовано большое количество исследовательских работ, в которых описываются специализированные алгоритмы кластеризации для обнаружения и определения субпопуляций белых клеток крови, некоторые из них нашли практическое применение, но по-прежнему актуальными остаются проблемы, связанные с наличием значительного количества шумов и с различной плотностью распределения данных при кластеризации лейкоцитов методами проточной цитометрии. Рассматривается подход к построению стратегии автоматического выделения лимфоцитов, моноцитов и гранулоцитов при помощи модифицированного агломеративного центроидного метода кластеризации. Обсуждаются результаты вычислительных экспериментов.