RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2014, том 24, выпуск 2, страницы 131–142 (Mi ssi349)

Эта публикация цитируется в 1 статье

Методика извлечения пословных переводных соответствий из параллельных текстов с применением моделей дистрибутивной семантики

Ю. И. Морозова, Е. Б. Козеренко, М. М. Шарнин

Институт проблем информатики Российской академии наук

Аннотация: Данная работа посвящена актуальным проблемам исследования лингвистических единиц с использованием корпусных методов. В работе дается определение задачи извлечения переводных соответствий из параллельных текстов, рассматриваются существующие подходы к решению данной задачи и предлагается подход, основанный на применении моделей дистрибутивной семантики. Приводится описание разработанной авторами теоретической модели извлечения переводных соответствий, а также ее компьютерной реализации. Для целей исследования был создан тестовый параллельный корпус, содержащий тексты патентов на русском и французском языках. Приводятся результаты применения дистрибутивно-семантической методики, полученные в рамках эксперимента по извлечению переводных соответствий из тестового корпуса.

Ключевые слова: выравнивание параллельных текстов; параллельный корпус; дистрибутивная семантика; модель векторных пространств.

Поступила в редакцию: 27.03.2014

DOI: 10.14357/08696527140209



Реферативные базы данных:


© МИАН, 2024