Аннотация:
В статье рассматриваются методы улучшения показателей качества моделей
машинного обучения, применяемых в финансовом секторе. В связи с тем, что наборы данных, на
которых обучаются модели, обладают несбалансированностью классов, предлагается использовать
модели, направленные на снижение дисбаланса. В исследовании были проведены эксперименты с
применением 9 методов учета несбалансированности классов к трем наборам данных по
розничному кредитованию. В качестве базовой использовалась модель градиентного бустинга
CatboostClassifier, не учитывающая дисбаланс классов. Проведенные эксперименты показали,
что применение метода RandomOverSampler дает существенный прирост показателей качества
классификации по сравнению с базовой моделью. Результаты свидетельствуют о перспективности
дальнейших исследований методов учета дисбаланса классов при изучении финансовых данных, а
также о целесообразности применения рассмотренных методов на практике.
Ключевые слова:
финансовые риски, машинное обучение, классификация, дисбаланс классов