Аннотация:
Статья обобщает опыт разработки веб-службы на основе SDK для распознавания документов (OCR). Рассматриваются вопросы устойчивости и производительности веб-службы: способность не терять данные при высокой нагрузке и после перезапуска; способность своевременно обнаруживать ошибки, ограничивать их распространение и длительность; а также свойство детерминированности веб-службы в условиях параллельной обработки множества запросов. Высокая производительность подразумевает умеренные накладные расходы, связанные с приёмом запросов и отправкой ответов клиентам, помимо собственно распознавания. Описанное решение может применяться для создания веб-службы из любого SDK, который позволяет обрабатывать входные документы и получать из них выходные файлы, в том числе не обязательно в связи с технологиями оптического распознавания.