RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Тр. СПИИРАН, 2016, выпуск 44, страницы 181–197 (Mi trspy861)

Эта публикация цитируется в 1 статье

Теоретическая и прикладная математика

Детерминированная идентификация буквенных биграмм в русскоязычном тексте

Ю. А. Котов

Новосибирский государственный технический университет (НГТУ)

Аннотация: В статье рассмотрена задача идентификации символов текстов на естественном языке по числовым характеристикам этих текстов. На основе правил языка и частот биграмм предложено решение данной задачи для русских текстов. Решение представляет собой систему идентифицирующих функций для каждого символа алфавита и детерминированную последовательность их применения. Указаны ограничения для полученного решения, область его эффективного применения и возможности расширения.

Ключевые слова: идентификация; символ; биграмма; русский язык; простая замена.

УДК: 519.6

DOI: 10.15622/sp.44.11



Реферативные базы данных:


© МИАН, 2024