Аннотация:
Автоматический анализ аргументации в текстах привлекает в последние годы внимание исследователей в связи с широким диапазоном приложений, в частности, в анализе научных и юридических текстов, новостных статей, политических дебатов, студенческих эссе и социальных медиа. Новая задача в этой области— анализ аргументации с учетом аспектов, где под аспектом понимается свойство объекта, относительно которого строится довод. Учет аспектов позволяет уточнить направленность аргументации и понимание аргументационной структуры, а также может быть использован для генерации высококачественных и специфичных для выбранных аспектов доводов.
В статье предлагается метод классификации аспектов аргументации в текстах
на русском языке, построение на его основе и исследование моделей классификации
аспектов аргументации с использованием машинного обучения и нейронных сетей.
Впервые сформирован русскоязычный текстовый корпус, включающий 1426 предложений и размеченный по 16 аспектам аргументации, построена нейросетевая языковая
модель классификации аргументов ArgBERT и обучены модели Random Forest для
классификации аспектов аргументации. Качество классификации на основе Random
Forest составляет в среднем F1=0,6373. Наилучшее качество разработанные модели
демонстрируют для аспектов «Безопасность», «Влияние на здоровье», «Влияние
на психику», «Отношение властей» и «Уровень жизни» (F1-мера выше 0,75).
Ключевые слова и фразы:анализ аргументации, текстовые корпуса, нейросетевые языковые модели, машинное обучение, Random Forest, аспекты аргументации.