Аннотация:
Методы анализа выживаемости решают задачу описания и прогнозирования событий. Модели учитывают случаи цензурирования, в которых истинное время события неизвестно из-за выхода наблюдения из исследования. Статистические методы предполагают, что цензурирование неинформативно и связь между причиной выхода наблюдения и проведением исследования отсутствует. В работе проводится исследование влияния информативности на эффективность статистических методов. В частности, критерий log-rank используется для сравнения функций риска и имеет низкую чувствительность в случае малых выборок или мультимодального распределения времени события. Для преодоления недостатков предлагается метод вычисления регуляризованных критериев, которые используют информацию об априорном распределении событий во времени и оценивают различия между функциями риска для всех моментов времени. Метод регуляризации был интегрирован в метод построения деревьев выживания и привел к улучшению качества прогнозирования на четырех медицинских наборах данных. Кроме того, предложенный метод превзошел существующие статистические методы и реализацию дерева выживания на всех наборах данных.