RUS  ENG
Полная версия
ЖУРНАЛЫ // Информационные технологии и вычислительные системы // Архив

ИТиВС, 2024, выпуск 3, страницы 3–15 (Mi itvs864)

ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ

Reducing errors and computational load in road scene text recognition

[Снижение ошибки и вычислительной нагрузки в распознавании текста дорожной сцены]

T. R. Maksimovaa, K. B. Bulatovab

a Smart Engines, Moscow, Russia
b Federal Research Center "Computer Science and Control", Russian Academy of Sciences, Moscow, Russia

Аннотация: Статья посвящена проблеме снижения вычислительной нагрузки для распознавания текста дорожной сцены принятием решения об остановке, прекращающем дальнейшее распознавание. Описывается построение правил остановки для систем распознавания текста в реальном времени с комбинацией результатов и экспериментальной оценкой на открытом наборе данных RoadText-1k. Обнаружено, что для быстродействующих систем метод комбинации ROVER (Recognizer Output Voting Error Reduction) и голосование являются наилучшими для метрики Левенштейна и дискретной метрики соответственно, однако с увеличением времени обработки каждого кадра ROVER становится стабильно лучше. Хотя выбор наиболее сфокусированного кадра является худшей стратегией для быстродействующих систем, ее сравнительный рейтинг повышается с увеличением времени обработки. Важно отметить, что выбор наиболее сфокусированного кадра и объединение трех наиболее сфокусированных кадров предпочтительнее для быстродействующих систем, когда требуется снизить нагрузку.

Ключевые слова: метод комбинации, уменьшение вычислительной нагрузки, распознавание в реальном времени, анализ дорожной сцены, распознавание текста, распознавание видеопотока.

Язык публикации: английский

DOI: 10.14357/20718632240301



© МИАН, 2024