Аннотация:
Рассмотрена задача интеллектуального анализа документов, представленных в виде снимков, содержащих как текстовую (буквы, цифры), так и графическую части (рисунки, фотографии). Показано, что задачи выделения и кластеризации текстовой и графической информации в подобных документах могут решаться, несмотря на имеющиеся различия, с применением одних и тех же инструментальных средств, в том числе искусственных нейронных сетей (ИНС). Данный анализ рассматривается как первый шаг в решении общей задачи
кластеризации составных документов на основе ИНС. Открытым остается вопрос о технологии обработки документов, представленных в различных форматах.