Аннотация:
Представлены результаты исследований в области моделирования структуры текстов с использованием обобщенной контекстно-зависимой теоретико-графовой модели. Объектом исследования стали в основном литературные и фольклорные тексты, для которых возникает задача атрибуции. Например, таких текстов много в творчестве известного русского писателя Ф. М. Достоевского. Авторы показывают, как можно построить гибридные модели, основанные на деревьях зависимостей, графовых моделях синтаксической структуры связей между простыми предложениями в составе многокомпонентного сложного предложения и графов «сильных связей» сочетаемости слов различных грамматических классов. Такие модели позволяют конструировать новые информативные признаки, потенциально применимые в атрибуции текстов. Примером служит частота встречаемости графовых $n$-грамм, которые представляют собой обобщение обычных $n$-грамм, синтаксических $n$-грамм и других подобных конструкций, применяемых в стилистических исследованиях.