Аннотация:
В работе развивается подход вероятностного информирования глубоких нейронных сетей, то есть улучшения их результатов за счет использования в архитектурных элементах различных вероятностных моделей. В качестве таковых в статье предложены факторные анализаторы с аддитивно-импульсным шумом. Доказана идентифицируемость модели и установлена взаимосвязь оценок параметров методами наименьших квадратов и максимального правдоподобия, которая фактически означает несмещенность и состоятельность оценок параметров факторного анализатора, получаемых в рамках информированного блока. Данная модель использована при создании нового архитектурного элемента (блока), реализующего объединение многомасштабных признаков изображений с целью повышения точности классификации при обучении на данных небольшого объема. Данная проблема является типичной для разнообразных прикладных задач, включая обработку спутниковых данных. Проведено тестирование ряда популярных нейросетевых классификаторов (EfficientNet, MobileNet, Xception) с добавлением дополнительного информированного блока и без. Продемонстрировано, что на открытых наборах UC Merced (данные дистанционного зондирования) и Oxford Flowers (изображения цветков) нейросети с вероятностным информированием позволяют достичь существенного для подобного класса задач прироста точности: наибольшее увеличение классификационных метрик Top-1 составило 6.67% при средней точности без улучшения в 87.3%, а Top-5 Accuracy – до 1.49% (96.27% в среднем без улучшения).