Аннотация:
Работа посвящена концептуальным вопросам анализа текстового содержимого документа. Рассматриваются вопросы использования анализа текстовых документов при создании систем ввода и распознавания деловых бумажных документов. Рассматриваются две основные задачи: определение типа распознаваемого документа и его структуризации. Предложены функции, которые должны обеспечить декомпозицию и решение этих задач. Если принята предлагаемая схема использования текста, то реализация систем ввода может быть различной. То есть, в рамах предложенной концепции анализа документов могут применяться различные алгоритмы распознавания и форматы представления данных.