А. А. Зацаринный, А. А. Карандеев, Б. Н. Четверушкин, В. П. Осипов, Н. А. Яшин, “Выявление атак типа триггер на искусственные нейронные сети”, ИТиВС, 2025, выпуск 1,страницы 3

ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ

Выявление атак типа триггер на искусственные нейронные сети

А. А. Зацаринный^a, А. А. Карандеев^b, Б. Н. Четверушкин^b, В. П. Осипов^b, Н. А. Яшин^b

^a Федеральный исследовательский центр «Информатика и управление» Российской академии наук, Москва, Россия
^b Федеральный исследовательский центр "Институт прикладной математики им. М.В. Келдыша" Российской академии наук, Москва, Россия

Аннотация: В статье рассмотрена актуальная проблема триггерных атак на искусственные нейронные сети, предназначенные для распознавания образов в контексте обеспечения их надежности и безопасности. Рассмотрены различные сценарии триггерных атак, основные методы их реализации и последствия подобных атак. Подробно рассмотрены способы наложения триггеров на изображения, методы поиска триггеров, включая поиск основных характеристик, присущих изображению с триггером. Представлены результаты применения разработанного способа борьбы с триггерными атаками, позволяющего распознавать триггеры на изображении на этапе машинного обучении нейронной сети. Рассматриваются перспективы развития методов защиты от триггерных атак при использовании машинного обучения и сверточных нейронных сетей.

Ключевые слова: искусственная нейронная сеть, машинное обучение, триггерная атака, распознавание образов.

DOI: 10.14357/20718632250101