Аннотация:
Факторизация вкладов различных переменных при анализе разнородных признаковых описаний — насущная задача интеллектуального анализа сложных данных. В работе предложено развитие решеточного формализма топологической теории анализа данных, в рамках которого получены новые способы порождения параметрических оценок и метрик на решетках, образованных над топологиями множеств объектов. Формализм был апробирован на задаче формирования множеств прецедентов для проведения хемомикробиомного анализа. Тогда как порождение множества исходных информаций на основе регрессионных коэффициентов и разности значений материала обучения соответствовало крайне низкой обобщающей способности настраиваемых алгоритмов (коэффициент корреляции на контроле — $0{,}32\pm 0{,}20$), использование предлагаемых оценок для порождения множеств прецедентов в задачах хемомикробиомики позволило существенно повысить обобщающую способность соответствующих алгоритмов (коэффициент корреляции на контроле — $0{,}79\pm 0{,}21$).
Ключевые слова:
топологический анализ данных, теория решеток, параметризация решеточных термов, микробиом человека, фармакоинформатика, алгебраический подход Ю. И. Журавлёва.