RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2020, том 32, выпуск 3, страницы 109–117 (Mi tisp517)

Эта публикация цитируется в 3 статьях

Machine learning-based malicious users' detection in the VKontakte social network

[Определение аккаунтов злоумышленников в социальной сети ВКонтакте при помощи методов машинного обучения]

D. I. Samokhvalov

National Research University Higher School of Economics

Аннотация: В данной работе представлен подход для обнаружения аккаунтов злоумышленников в крупнейшей российской социальной сети ВКонтакте на основе методов машинного обучения. Был проведен исследовательский анализ данных для определения аномалий и закономерностей в наборе данных, состоящем из 42394 вредоносных и 241035 подлинных учетных записей пользователей ВКонтакте. Кроме того, для получения набора данных был разработан инструмент для автоматического сбора информации о вредоносных аккаунтах в социальной сети ВКонтакте, описание архитектуры данного инструмента приведено в работе. На основе признаков, сгенерированных из пользовательских данных, была обучена модель классификации при помощи библиотеки CatBoost. Результаты показали, что эта модель может идентифицировать злоумышленников с общим качеством AUC 0.91, подтвержденной четырехкратным методом перекрестной проверки.

Ключевые слова: ВКонтакте, злоумышленники, машинное обучение, социальные сети, модели классификации, анализ данных.

Язык публикации: английский

DOI: 10.15514/ISPRAS-2020-32(3)-10



© МИАН, 2024