Аннотация:
Данная статья посвящена проблемам проектирования и разработки лингвистически мотивированных механизмов выравнивания параллельных текстов и выявления грамматических (функционально-семантических) соответствий для формирования статистических портретов языковых употреблений, которые в дальнейшем будут встроены в гибридные модели машинного перевода. Гибридными называются такие модели, в которых для обработки естественного языка применяются как статистические механизмы, так и механизмы, основанные на правилах. Представленный в данной работе подход заключается в использовании исходной расширяемой грамматики, которая в процессе развития дополняется соответствиями, извлеченными из параллельных текстов. В качестве исходной грамматики используется когнитивная трансферная грамматика (КТГ), основанная на трансфемах (двуязычных фразовых структурах), в которой представлены когнитивные и функциональные характеристики фразовых структур.