RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2019, том 29, выпуск 3, страницы 92–103 (Mi ssi657)

Эта публикация цитируется в 4 статьях

Ошибки в машинном переводе: проблемы классификации

А. А. Гончаровa, Н. В. Бунтманb, В. А. Нуриевa

a Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук
b Московский государственный университет им. М. В. Ломоносова

Аннотация: Рассматриваются проблемы классификации ошибок в машинном переводе. В первой части предлагается обзор разных подходов к оценке качества машинного перевода и классификации ошибок, наблюдаемых при работе автоматизированных систем перевода. Вторая часть посвящена описанию оригинальной классификации ошибок машинного перевода, которая была создана таргетированно — для перевода коннекторов в языковой паре русский–французский. На этой языковой паре подобных исследований еще не проводилось. В предлагаемой классификации выделяются две основные группы ошибок — грамматические/лексические ошибки во фрагменте текста с коннектором и ошибки непосредственно в переводе коннектора. В работе использовался параллельный корпус, состоящий из русскоязычных текстов и их референтных переводов (около 4 млн словоупотреблений). Из этих русскоязычных текстов отбирались фрагменты, содержащие коннекторы, которые затем переводились на французский в двух разных системах машинного перевода.

Ключевые слова: классификация, машинный перевод, качество машинного перевода, ошибки в машинном переводе.

Поступила в редакцию: 25.07.2019

DOI: 10.14357/08696527190308



© МИАН, 2024