Аннотация:
Рак занимает лидирующие позиции в списке причин смерти людей возрастом до 70 лет. Важным шагом для снижения смертности является выявление заболевания на ранних стадиях. Для улучшения ранней диагностики рака мы предлагаем алгоритм калибровки вероятностей бинарных классификаторов с применением нечетких множеств. Наша идея проверена на распознавании рака молочной железы у женщин и рака легкого. Первый случай осложняется небольшим набором данных, второй – сильно несбалансированными данными. В обоих случаях наш метод калибровки вероятностей, в отличие от стандартных, улучшил логарифмическую потерю (лучший результат – на 48.86%), оценку Брайера (лучший результат – на 13.24%) и площадь под кривой Precision-Recall (лучший результат – на 13.94%). Сфера применения нашего алгоритма может быть расширена на любые прогрессирующие заболевания и события без четкой границы принадлежности.