RUS  ENG
Полная версия
ЖУРНАЛЫ // Моделирование и анализ информационных систем // Архив

Модел. и анализ информ. систем, 2023, том 30, номер 4, страницы 394–417 (Mi mais811)

Artificial intelligence

Алгоритм определения тональности предложений публицистического стиля на русском языке на основе семантических правил

А. Ю. Полетаев, И. В. Парамонов, Е. И. Бойчук

Ярославский государственный университет им. П.Г. Демидова, ул. Советская, д. 14, г. Ярославль, Ярославская область, 150003, Россия

Аннотация: Статья посвящена задаче определения тональности предложения на русском языке, понимаемой как отношение автора предложения к его теме, выраженное с помощью языковых средств. В настоящий момент большинство исследований по этой теме проводятся на текстах разговорного стиля речи, что ограничивает применимость их результатов для других стилей, в частности, публицистического. Для того, чтобы заполнить этот пробел, авторами был разработан алгоритм определения тональности, ориентированный на применение к предложениям публицистического стиля речи. Алгоритм рекурсивно применяет подходящие правила к составным частям предложения, представленным в виде дерева синтаксических единиц. Большинство правил было построено на основе знаний эксперта-филолога относительно средств выражения тональности, известных русской лингвистике, и выбора тех из них, которые достаточно формализованы для того, чтобы их можно было алгоритмизировать с использованием генерируемых в рамках алгоритма деревьев синтаксических единиц. Также применялись дерево решений и тональный словарь. В статье приведены результаты эксперимента по апробации предложенного алгоритма на корпусе предложений публицистического стиля OpenSentimentCorpus, F-мера составила 0.80, а также результаты анализа ошибок алгоритма.

Ключевые слова: анализ тональности, определение тональности, семантические правила, публицистический стиль, дерево синтаксических единиц.

УДК: 004.912+10.02.21

MSC: 68T50

Поступила в редакцию: 06.11.2023
Исправленный вариант: 24.11.2023
Принята в печать: 29.11.2023

DOI: 10.18255/1818-1015-2023-4-394-417



© МИАН, 2024