RUS  ENG
Полная версия
ЖУРНАЛЫ // Автоматика и телемеханика // Архив

Автомат. и телемех., 2022, выпуск 12, страницы 5–17 (Mi at16094)

Эта публикация цитируется в 1 статье

Тематический выпуск

Выявление аффективных состояний на основе автоматического анализа текстов комментариев в социальных сетях

Ю. Ю. Дюличева

ФГАОУ ВО «Крымский федеральный университет им. В.И. Вернадского», Симферополь

Аннотация: В статье рассмотрена задача классификации 3553 англоязычных комментариев из социальной сети Reddit на основе различных подходов к векторизации текстов комментариев: мешок слов, TF-IDF, анализ биграмм на основе точечной взаимной информации PMI и сентимента, глубокая модель представления языка BERT. Применение гибридного подхода на основе векторизации текстов с помощью BERT и анализа биграмм позволило повысить качество классификации комментариев до 91%. На основе кластерного анализа 1857 англоязычных комментариев, содержащих описание тревожностей, с помощью BERT+k-Means были выделены кластеры. В исследовании предложен гибридный подход, основанный на применении метода тематического моделирования LDA, метода анализа тональности VADER, точечной взаимной информации, анализа частей речи и позволяющий выделять биграммы и триграммы для описания кластеров комментариев. Для визуализации извлеченных закономерностей в виде триграмм был построен граф знаний, описывающий предметную область, а сопоставление слов выделенных целевых триграмм со словами кастомного словаря, описывающего различные аффективные расстройства, позволило определить типы психосоциологических стрессоров, c которыми связаны аффективные расстройства.

Ключевые слова: биграммы, сентиментный анализ, LDA, BERT, VADER, BoW, TF-IDF, граф знаний, ментальное здоровье.

Статья представлена к публикации членом редколлегии: А. А. Лазарев

Поступила в редакцию: 31.01.2022
После доработки: 28.05.2022
Принята к публикации: 29.06.2022

DOI: 10.31857/S0005231022120029


 Англоязычная версия: Automation and Remote Control, 2022, 83:12, 1877–1885


© МИАН, 2024