Аннотация:
В статье представлена разработка модели машинного обучения для прогнозирования
мошеннических транзакций на примере транзакционных данных банка. Рассмотрены особенности
кодирования категориальных переменных, связанные с наличием времени в транзакционных
данных, чтобы избежать утечек информации. Проведены эксперименты по применению баггинга
(bootstrap aggregating) и созданию дополнительных переменных на основе их вклада в итоговый
прогноз с применением Shapley values. Рассмотрены показатели качества модели машинного
обучения и проведен их анализ.