Д. П. Маталов, Е. Л. Плискин, “Веб-сервис на основе SDK для распознавания документов”, ИТиВС, 2019, выпуск 2,страницы 32

ОБРАБОТКА ИНФОРМАЦИИ И АНАЛИЗ ДАННЫХ

Веб-сервис на основе SDK для распознавания документов

Д. П. Маталов^ab, Е. Л. Плискин^c

^a ООО «Смарт Энджинс Сервис», Москва, Россия
^b Московский физико-технический институт (ГУ), г.Долгопрудный, Россия
^c Федеральное государственное учреждение «Федеральный исследовательский центр "Информатика и управление" Российской академии наук», г. Москва, Россия

Аннотация: Статья обобщает опыт разработки веб-службы на основе SDK для распознавания документов (OCR). Рассматриваются вопросы устойчивости и производительности веб-службы: способность не терять данные при высокой нагрузке и после перезапуска; способность своевременно обнаруживать ошибки, ограничивать их распространение и длительность; а также свойство детерминированности веб-службы в условиях параллельной обработки множества запросов. Высокая производительность подразумевает умеренные накладные расходы, связанные с приёмом запросов и отправкой ответов клиентам, помимо собственно распознавания. Описанное решение может применяться для создания веб-службы из любого SDK, который позволяет обрабатывать входные документы и получать из них выходные файлы, в том числе не обязательно в связи с технологиями оптического распознавания.

Ключевые слова: SDK, SOAP, REST, Java, Web service, оптическое распознавание, OCR, многопоточность.

DOI: 10.14357/20718632190204