Аннотация:
Машинный перевод — это задача обработки текстов естественного языка, ставящая своей целью перевод входного текста с одного языка на другой язык в автоматическом режиме. Известные на данный момент модели машинного перевода показывают достаточно высокое качество перевода между крупными языками, однако для более мелких языковых направлений, представленных меньшим количеством данных, задача все еще не решена. Для борьбы с различными ошибками автоматических систем перевода применяются разные методы. В данной работе рассматриваются подходы, использующие переводные модели обратных языковых направлений и улучшающие согласованность между переводами одного текста с помощью прямых и обратных им моделей перевода. В работе представлено общее теоретическое обоснование для таких методов с точки зрения решения задачи максимизации правдоподобия, а также предложен способ стабильного обучения современных моделей с использованием циклических переводов.
Ключевые слова:машинный перевод, нейронная сеть, стохастический градиентный спуск, вероятностное моделирование, максимум правдоподобия, выбор по значимости, циклические переводы, дообучение модели.
Статья представлена к публикации членом редколлегии:А. А. Лазарев
Поступила в редакцию: 23.01.2022 После доработки: 30.05.2022 Принята к публикации: 29.06.2022