RUS  ENG
Полная версия
ЖУРНАЛЫ // Записки научных семинаров ПОМИ // Архив

Зап. научн. сем. ПОМИ, 2023, том 530, страницы 96–112 (Mi znsl7435)

Translate your gibberish: black-box adversarial attack on machine translation systems

[Переведите свою тарабарщину: состязательная атака в модели черного ящика на системы машинного перевода]

A. Chertkovab, O. Tsymboicd, M. Pautova, I. Oseledetsaeb

a Skolkovo Institute of Science and Technology, Moscow, Russia
b Institute of Numerical Mathematics, Russian Academy of Sciences
c Moscow Institute of Physics and Technology, Moscow, Russia
d Sber AI Lab, Moscow, Russia
e AIRI, Moscow, Russia

Аннотация: Нейронные сети широко применяются в задачах обработки естественного языка в промышленных масштабах и, возможно, чаще всего они используются в составе систем автоматического машинного перевода. В этой работе мы представляем простой способ обмануть современные инструменты машинного перевода при переводе с русского языка на английский и наоборот. Используя новый безградиентный тензорный оптимизатор в модели черного ящика, мы показываем, что многие инструменты онлайн-перевода, в частности Google, DeepL и Яндекс, могут как производить неправильные или оскорбительные переводы для бессмысленных состязательных входных запросов, так и отказываться переводить, казалось бы, безобидные фразы. Эта уязвимость может помешать пониманию нового языка и просто ухудшить опыт пользователя при использовании систем машинного перевода, и, следовательно, для улучшения перевода необходимы дополнительные улучшения этих инструментов. Библ. – 33 назв.

Ключевые слова: обработка естественных языков, машинный перевод, состязательные атаки, black-box оптимизация.

УДК: 81.322.4

Поступило: 06.09.2023

Язык публикации: английский



© МИАН, 2024