Аннотация:
Работа посвящена изучению публицистического стиля Ф. М. Достоевского на материалах статей в журналах «Время» и «Эпоха» (1861–1865 гг.). Для этого были выбраны фрагменты текстов (в том числе М. М. Достоевского, Н. Н. Страхова, А. А. Головачева и др.) размером 500, 700 и 1000 слов, на которых выполнялся подсчет встречаемости би- и триграмм, представляющих собой закодированные последовательности частей речи. Далее на их основе были построены деревья решения и выполнен анализ точности распознавания текстов. Если рассмотреть классификацию на первом уровне дерева (размер фрагмента 1000), то точность в среднем была равна 87 %. Этим признаком выступает процент наличия биграммы «прилагательное — существительное». При анализе триграмм наиболее значимым признаком на первом уровне была последовательность «существительное — прилагательное — существительное». Также в статье рассмотрена задача сравнения полученных деревьев решений.
Ключевые слова:публицистический стиль, атрибуция текстов, дерево решений, $n$-грамма, Ф. М. Достоевский, сравнение деревьев, информационная система «Статистические методы для анализа литературных текстов».