RUS  ENG
Полная версия
ЖУРНАЛЫ // Искусственный интеллект и принятие решений // Архив

Искусственный интеллект и принятие решений, 2008, выпуск 3, страницы 72–84 (Mi iipr576)

Интеллектуальный анализ данных

Выделение и кластеризация текстовых и графических элементов на полутоновых снимках

А. А. Талалаевa, И. П. Тищенкоa, М. В. Хачумовb

a Институт программных систем РАН
b Российский университет дружбы народов, г. Москва

Аннотация: Рассмотрена задача интеллектуального анализа документов, представленных в виде снимков, содержащих как текстовую (буквы, цифры), так и графическую части (рисунки, фотографии). Показано, что задачи выделения и кластеризации текстовой и графической информации в подобных документах могут решаться, несмотря на имеющиеся различия, с применением одних и тех же инструментальных средств, в том числе искусственных нейронных сетей (ИНС). Данный анализ рассматривается как первый шаг в решении общей задачи кластеризации составных документов на основе ИНС. Открытым остается вопрос о технологии обработки документов, представленных в различных форматах.

Ключевые слова: полутоновый снимок, графический объект, буквы, текст, шум, эталон, фильтрация, кластеризация, искусственная нейронная сеть, комитет.



Реферативные базы данных:


© МИАН, 2024