RUS  ENG
Полная версия
ЖУРНАЛЫ // Программные системы: теория и приложения // Архив

Программные системы: теория и приложения, 2023, том 14, выпуск 4, страницы 25–45 (Mi ps429)

Искусственный интеллект и машинное обучение

Метод классификации аспектов аргументации в русскоязычных текстах

И. Н. Фищева, Т. А. Пескишева, В. С. Головизнина, Е. В. Котельников

Вятский государственный университет, Киров, Россия

Аннотация: Автоматический анализ аргументации в текстах привлекает в последние годы внимание исследователей в связи с широким диапазоном приложений, в частности, в анализе научных и юридических текстов, новостных статей, политических дебатов, студенческих эссе и социальных медиа. Новая задача в этой области— анализ аргументации с учетом аспектов, где под аспектом понимается свойство объекта, относительно которого строится довод. Учет аспектов позволяет уточнить направленность аргументации и понимание аргументационной структуры, а также может быть использован для генерации высококачественных и специфичных для выбранных аспектов доводов.
В статье предлагается метод классификации аспектов аргументации в текстах на русском языке, построение на его основе и исследование моделей классификации аспектов аргументации с использованием машинного обучения и нейронных сетей. Впервые сформирован русскоязычный текстовый корпус, включающий 1426 предложений и размеченный по 16 аспектам аргументации, построена нейросетевая языковая модель классификации аргументов ArgBERT и обучены модели Random Forest для классификации аспектов аргументации. Качество классификации на основе Random Forest составляет в среднем F1=0,6373. Наилучшее качество разработанные модели демонстрируют для аспектов «Безопасность», «Влияние на здоровье», «Влияние на психику», «Отношение властей» и «Уровень жизни» (F1-мера выше 0,75).

Ключевые слова и фразы: анализ аргументации, текстовые корпуса, нейросетевые языковые модели, машинное обучение, Random Forest, аспекты аргументации.

УДК: 004.89: 81'322
ББК: 32.813.5: Ч865.34

MSC: Primary 68T07; Secondary 68T50

Поступила в редакцию: 01.07.2023
Подписана в печать : 20.07.2023

DOI: 10.25209/2079-3316-2023-14-4-25-45



© МИАН, 2024