RUS  ENG
Полная версия
ЖУРНАЛЫ // Моделирование и анализ информационных систем // Архив

Модел. и анализ информ. систем, 2024, том 31, номер 4, страницы 426–445 (Mi mais834)

Theory of computing

Disambiguation of regular expressions with backreferences via term rewriting

[Устранение неоднозначностей в расширенных регулярных выражениях с обратными ссылками посредством применения правил переписывания]

D. N. Ismagilovaa, A. N. Nepeivodab

a Bauman Moscow State Technical University, Moscow, Russia
b Program Systems Institute of RAS, Veskovo, Yaroslavl region, Russia

Аннотация: В работе рассматривается класс расширенных регулярных выражений с обратными ссылками, которые представляются как элементы полукольца, частично удовлетворяющего теоремам алгебры Клини. Используя эти теоремы в качестве правил переписывания, возможно построить алгоритм устранения неоднозначности в ячейках памяти выражений. В дальнейшем этот алгоритм может быть применён для построения обращений расширенных регулярных выражений в заданных ограничениях. Предложенные алгоритмы были апробированы на тестовой выборке регулярных выражений, построенных на базе выражений из RegexLib и StackOverflow. Результаты экспериментов показали, что в ряде случае время сопоставления с преобразованным регулярным выражением было значительно меньше, чем с исходным.

Ключевые слова: расширенные регулярные выражения, обратные ссылки, группы захвата, реверсирование, неоднозначность, алгебра Клини.

УДК: 004.415.52

MSC: 68Q45

Поступила в редакцию: 06.11.2024
Исправленный вариант: 15.11.2024
Принята в печать: 30.11.2024

Язык публикации: английский

DOI: 10.18255/1818-1015-2024-4-426-445



© МИАН, 2025