Аннотация:
Предлагается программная реализация параллельного алгоритма градиентного бустинга деревьев решений, предполагающего распределенное хранение данных и предназначенного, в первую очередь, для решения больших задач машинного обучения. Приводятся результаты вычислительных экспериментов, показавших преимущество в производительности и масштабируемости предлагаемой программной реализации над доступными открытыми реализациями при использовании выборок больших объемов. Приводятся результаты экспериментальной оценки качества, также показавшие конкурентоспособность предлагаемой реализации. Работа выполнена в рамках программы “Исследования и разработки по приоритетным направлениям развития научно-технологического комплекса России на 2007–2013 годы: (государственный контракт N 11.519.11.4015) и ФЦП "Научные и научно-педагогические кадры инновационной России на 2009–2013 годы” (государственный контракт № 14.B37.21.0393). Статья рекомендована к публикации Программным комитетом форума “Суперкомпьютерные технологии в образовании, науке и промышленности” (HPC-2012; http://agora.guru.ru/hpc2012).