А. Ю. Сапаров, А. П. Бельтюков, С. Г. Маслов, “Уточнение результатов распознавания математических формул с использованием расстояния Левенштейна”, Вестн. Удмуртск. ун-та. Матем. Мех. Компьют. науки, 2020, том 30, выпуск 3,страницы 513

КОМПЬЮТЕРНЫЕ НАУКИ

Уточнение результатов распознавания математических формул с использованием расстояния Левенштейна

А. Ю. Сапаров, А. П. Бельтюков, С. Г. Маслов

Удмуртский государственный университет, 426034, Россия, г. Ижевск, ул. Университетская, 1

Аннотация: Рассматривается задача распознавания сканированных математических текстов с повторяющимися формулами либо формулами с общими фрагментами. Описывается метод сравнения результатов распознавания, позволяющий выделять идентичные элементы из множества вариантов распознавания. Метод основывается на вычислении расстояний Левенштейна между отдельными фрагментами с учетом дополнительных параметров. Предложенный метод отличается от обычного метода тем, что при наличии неопределенностей в процессе сравнения участвуют все возможные варианты распознавания, представленные в виде пары символ–вес. В случае нелинейных формул в сравнении участвуют дополнительные числовые параметры, задающие расположение отдельных символов на плоскости. Такое сравнение позволит сгруппировать формулы, а полученные данные будут полезны при принятии решений как человеком, так и программой. Использование данного метода упростит процесс ручного исправления ошибок, который будет основываться на динамическом управлении промежуточными результатами в процессе тесного человеко-машинного взаимодействия.

Ключевые слова: расстояние Левенштейна, вес замены, вес перемещения, множество вариантов распознавания, формулы с общими фрагментами.

УДК: 004.93, 510.5

MSC: 68T10, 68W32

Поступила в редакцию: 12.03.2020

DOI: 10.35634/vm200311