Ю. А. Котов, “Детерминированная идентификация буквенных биграмм в русскоязычном тексте”, Тр. СПИИРАН, 2016, выпуск 44,страницы 181

Эта публикация цитируется в 1 статье

Теоретическая и прикладная математика

Детерминированная идентификация буквенных биграмм в русскоязычном тексте

Ю. А. Котов

Новосибирский государственный технический университет (НГТУ)

Аннотация: В статье рассмотрена задача идентификации символов текстов на естественном языке по числовым характеристикам этих текстов. На основе правил языка и частот биграмм предложено решение данной задачи для русских текстов. Решение представляет собой систему идентифицирующих функций для каждого символа алфавита и детерминированную последовательность их применения. Указаны ограничения для полученного решения, область его эффективного применения и возможности расширения.

Ключевые слова: идентификация; символ; биграмма; русский язык; простая замена.

УДК: 519.6

DOI: 10.15622/sp.44.11