RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2023, том 33, выпуск 4, страницы 115–125 (Mi ssi916)

Графовые $n$-граммы в задаче атрибуции текстов

Н. Д. Москин, А. А. Рогов, А. А. Лебедев

Петрозаводский государственный университет

Аннотация: Представлены результаты исследований в области моделирования структуры текстов с использованием обобщенной контекстно-зависимой теоретико-графовой модели. Объектом исследования стали в основном литературные и фольклорные тексты, для которых возникает задача атрибуции. Например, таких текстов много в творчестве известного русского писателя Ф. М. Достоевского. Авторы показывают, как можно построить гибридные модели, основанные на деревьях зависимостей, графовых моделях синтаксической структуры связей между простыми предложениями в составе многокомпонентного сложного предложения и графов «сильных связей» сочетаемости слов различных грамматических классов. Такие модели позволяют конструировать новые информативные признаки, потенциально применимые в атрибуции текстов. Примером служит частота встречаемости графовых $n$-грамм, которые представляют собой обобщение обычных $n$-грамм, синтаксических $n$-грамм и других подобных конструкций, применяемых в стилистических исследованиях.

Ключевые слова: искусственный интеллект, атрибуция текстов, граф, метаграф, гибридный граф, фольклорный текст, литературный текст, графовая $n$-грамма.

Поступила в редакцию: 01.07.2023

DOI: 10.14357/08696527230411



© МИАН, 2024