Аннотация:
Рассматривается метод дивергентного решающего леса, основанный на достижении более высокой дивергенции в пространстве прогнозов по сравнению со стандартным случайным решающим лесом за счет включения на каждом шаге в ансамбль нового дерева $T_x$, которое строится исходя из условий минимизации специального функционала, являющегося разностью квадратичной ошибки $T_x$ и квадрата расхождения прогнозов $T_x$ и текущего ансамбля. Метод является развитием аналогичных ранее разработанных методов, которые предназначены для прогнозирования числовых переменных. В работе представлены результаты применения метода дивергентного решающего леса для решения задач классификации, возникающих при создании рекомендательных систем. Исследована зависимость эффективности прогноза от глубины деревьев и одного из ключевых параметров алгоритма, регулирующего вклад двух составляющих в минимизируемый функционал. Исследования показали, что точность предлагаемой технологии заметно превышает точность случайного решающего леса и близка к точности метода CatBoost.
Ключевые слова:
ансамблевый метод, машинное обучение, рекомендательные системы.
Статья представлена к публикации членом редколлегии:А. А. Галяев
Поступила в редакцию: 29.11.2024 После доработки: 09.01.2025 Принята к публикации: 14.01.2025