RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2023, том 35, выпуск 2, страницы 7–18 (Mi tisp766)

Real application of CNN interpretation methods: document image classification model errors’ detection and validation

[Реальное применение методов интерпретации свёрточных нейронных сетей: обнаружение и объяснение ошибок классификатора изображений документов]

A. O. Golodkov, O. V. Belyaeva, A. I. Perminov

Ivannikov Institute for System Programming of the RAS

Аннотация: В данной статье рассматривается случай применения методов интерпретации свёрточных нейронных сетей к модели ResNet 18 с целью обнаружения и объяснения её ошибок. Сама модель используется для решения задачи определения ориентации изображений текстовых документов. Изначально с помощью методов интерпретации было выдвинуто предположение о причине низкого качества предсказаний модели на данных, отличных от примеров из обучающего набора. Предполагаемой причиной оказалось наличие артефактов на тренировочных данных, которые были сгенерированы с использованием функции поворота изображений. Далее, с помощью методов Vanilla Gradient, Guided Backpropagation, Integrated Gradients, GradCAM и предложенной метрики удалось точно обосновать выдвинутое предположение. Полученные результаты помогли значительно улучшить точность модели.

Ключевые слова: интерпретация свёрточных нейронных сетей, классификация изображений документов, определение ориентации документа

Язык публикации: английский

DOI: 10.15514/ISPRAS-2023-35(2)-1



© МИАН, 2024