Аннотация:
Рассматриваются проблемы классификации ошибок в машинном переводе. В первой
части предлагается обзор разных подходов к оценке качества машинного перевода
и классификации ошибок, наблюдаемых при работе автоматизированных систем перевода.
Вторая часть посвящена описанию оригинальной классификации ошибок машинного
перевода, которая была создана таргетированно — для перевода коннекторов в языковой
паре русский–французский. На этой языковой паре подобных исследований еще не
проводилось. В предлагаемой классификации выделяются две основные группы ошибок —
грамматические/лексические ошибки во фрагменте текста с коннектором
и ошибки непосредственно в переводе коннектора. В работе использовался параллельный
корпус, состоящий из русскоязычных текстов и их референтных переводов (около 4 млн
словоупотреблений). Из этих русскоязычных текстов отбирались фрагменты, содержащие
коннекторы, которые затем переводились на французский в двух разных системах
машинного перевода.
Ключевые слова:классификация, машинный перевод, качество машинного перевода, ошибки в машинном переводе.