Аннотация:
В статье рассмотрена актуальная проблема триггерных атак на искусственные нейронные сети, предназначенные для распознавания образов в контексте обеспечения их надежности и безопасности. Рассмотрены различные сценарии триггерных атак, основные методы их реализации и последствия подобных атак. Подробно рассмотрены способы наложения триггеров на изображения, методы поиска триггеров, включая поиск основных характеристик, присущих изображению с триггером. Представлены результаты применения разработанного способа борьбы с триггерными атаками, позволяющего распознавать триггеры на изображении на этапе машинного обучении нейронной сети. Рассматриваются перспективы развития методов защиты от триггерных атак при использовании машинного обучения и сверточных нейронных сетей.