RUS  ENG
Полная версия
ЖУРНАЛЫ // Известия Кабардино-Балкарского научного центра РАН // Архив

Известия Кабардино-Балкарского научного центра РАН, 2025, том 27, выпуск 1, страницы 143–151 (Mi izkab930)

Системный анализ, управление и обработка информации

Сравнительный анализ методов снижения дисбаланса классов при построении моделей машинного обучения в финансовом секторе

А. Ф. Константинов, Л. П. Дьяконова

Российский экономический университет им. Г. В. Плеханова, 115054, Россия, Москва, Стремянный переулок, 36

Аннотация: В статье рассматриваются методы улучшения показателей качества моделей машинного обучения, применяемых в финансовом секторе. В связи с тем, что наборы данных, на которых обучаются модели, обладают несбалансированностью классов, предлагается использовать модели, направленные на снижение дисбаланса. В исследовании были проведены эксперименты с применением 9 методов учета несбалансированности классов к трем наборам данных по розничному кредитованию. В качестве базовой использовалась модель градиентного бустинга CatboostClassifier, не учитывающая дисбаланс классов. Проведенные эксперименты показали, что применение метода RandomOverSampler дает существенный прирост показателей качества классификации по сравнению с базовой моделью. Результаты свидетельствуют о перспективности дальнейших исследований методов учета дисбаланса классов при изучении финансовых данных, а также о целесообразности применения рассмотренных методов на практике.

Ключевые слова: финансовые риски, машинное обучение, классификация, дисбаланс классов

УДК: 004.89

MSC: 90С99

Поступила в редакцию: 24.09.2024
Исправленный вариант: 25.10.2024
Принята в печать: 09.01.2025

DOI: 10.35330/1991-6639-2025-27-1-143-151



Реферативные базы данных:


© МИАН, 2025