RUS  ENG
Полная версия
ЖУРНАЛЫ // Искусственный интеллект и принятие решений // Архив

Искусственный интеллект и принятие решений, 2021, выпуск 2, страницы 66–77 (Mi iipr102)

Эта публикация цитируется в 1 статье

Машинное обучение, нейронные сети

Применение случайного леса в выборе метода восстановления возраста пользователя социальной сети

А. А. Корепановаab, М. В. Абрамовab

a Санкт-Петербургский Федеральный исследовательский центр РАН, г. Санкт-Петербург, Россия
b Санкт-Петербургский государственный университет, г. Санкт-Петербург, Россия

Аннотация: Статья посвящена задаче восстановления значения атрибута “возраст” пользователя в социальных сетях посредством применения машинного обучения для комбинирования, предложенных в данной статье методов. Рассмотрены методы, основанные на анализе информации об образовательных учреждениях, подписках на группы и об образовании друзей, извлекаемой из профиля в социальной сети. Все эти методы по отдельности могут быть использованы в отношении выборок пользователей с ограниченным набором характеристик. Чтобы увеличить долю пользователей, у которых может быть восстановлено значение атрибута “возраст”, была построена модель классификации для выбора наилучшего метода восстановления возраста для каждого пользователя. Были протестированы еще два подхода к комбинированию методов: ранжированием и усреднением оценок. В результате первый подход оказался наилучшим на тестовой выборке. Теоретическая значимость работы состоит в предложении подхода к комбинированию методов восстановления возраста, который позволяет повысить применимость и точность идентификации возраста пользователя. Полученные результаты имеют перспективу применения во многих областях, связанных с анализом профилей пользователей, при изучении социальных сетей.

Ключевые слова: анализ социальных сетей, восстановление атрибутов, социоинженерные атаки, социокомпьютинг, машинное обучение.

DOI: 10.14357/20718594210207


 Англоязычная версия: , 2022, 49:5, 317–324

Реферативные базы данных:


© МИАН, 2024