RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2013, том 7, выпуск 1, страницы 82–89 (Mi ia247)

Эта публикация цитируется в 1 статье

Стратегии выравнивания параллельных текстов: семантические аспекты

Е. Б. Козеренко

Институт проблем информатики Российской академии наук

Аннотация: Данная статья посвящена проблемам проектирования и разработки лингвистически мотивированных механизмов выравнивания параллельных текстов и выявления грамматических (функционально-семантических) соответствий для формирования статистических портретов языковых употреблений, которые в дальнейшем будут встроены в гибридные модели машинного перевода. Гибридными называются такие модели, в которых для обработки естественного языка применяются как статистические механизмы, так и механизмы, основанные на правилах. Представленный в данной работе подход заключается в использовании исходной расширяемой грамматики, которая в процессе развития дополняется соответствиями, извлеченными из параллельных текстов. В качестве исходной грамматики используется когнитивная трансферная грамматика (КТГ), основанная на трансфемах (двуязычных фразовых структурах), в которой представлены когнитивные и функциональные характеристики фразовых структур.

Ключевые слова: выравнивание; параллельные тексты; синтаксис; семантика; фразовые структуры; гибридные модели; машинный перевод.



© МИАН, 2024