RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Южно-Уральского государственного университета. Серия «Математическое моделирование и программирование» // Архив

Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 2016, том 9, выпуск 4, страницы 86–95 (Mi vyuru346)

Эта публикация цитируется в 1 статье

Программирование

Модификация алгоритма случайного леса для классификации нестационарных потоковых данных

А. В. Жуковa, Д. Н. Сидоровbca

a Институт математики, экономики и информатики, Иркутский национальный исследовательский технический университет (г. Иркутск, Российская Федерация)
b Институт систем энергетики им. Л. А. Мелентьева СО РАН (г. Иркутск, Российская Федерация)
c Иркутский национальный исследовательский технический университет (г. Иркутск, Российская Федерация)

Аннотация: Предложен метод классификации нестационарных потоковых данных. К таким данным относятся характеристики поведения сложных систем, процессы, обладающие высокой степенью стохастичности, такие как скорость ветра. В данной работе предложена эффективная модификация алгоритма случайного леса, позволяющая повысить точность классификации состояния путем взвешивания ответов отдельных классификаторов композиции. Опираясь на метод Accuracy Weighted Ensemble (AWE), взвешивание производится в соответствии с оценкой ошибки каждого классификатора на новых данных. Такая оценка производится с использованием метода $k$ ближайших соседей и внутренней структуры случайного леса. В качестве стратегии обновления композиции используется замена классификаторов с низкой точностью на новых данных. Приводятся результаты тестирования предложенного метода и сравнение с другими современными методами.

Ключевые слова: классификация; смещение концепта; случайный лес; решающие деревья; композиции.

УДК: 004.855.5

MSC: 68T05

Поступила в редакцию: 27.05.2016

DOI: 10.14529/mmp160408



Реферативные базы данных:


© МИАН, 2024