Аннотация:
Статья посвящена проблеме снижения вычислительной нагрузки для распознавания текста дорожной сцены принятием решения об остановке, прекращающем дальнейшее распознавание. Описывается построение правил остановки для систем распознавания текста в реальном времени с комбинацией результатов и экспериментальной оценкой на открытом наборе данных RoadText-1k. Обнаружено, что для быстродействующих систем метод комбинации ROVER (Recognizer Output Voting Error Reduction) и голосование являются наилучшими для метрики Левенштейна и дискретной метрики соответственно, однако с увеличением времени обработки каждого кадра ROVER становится стабильно лучше. Хотя выбор наиболее сфокусированного кадра является худшей стратегией для быстродействующих систем, ее сравнительный рейтинг повышается с увеличением времени обработки. Важно отметить, что выбор наиболее сфокусированного кадра и объединение трех наиболее сфокусированных кадров предпочтительнее для быстродействующих систем, когда требуется снизить нагрузку.
Ключевые слова:метод комбинации, уменьшение вычислительной нагрузки, распознавание в реальном времени, анализ дорожной сцены, распознавание текста, распознавание видеопотока.