Аннотация:
Русско-французский параллельный корпус как часть Национального корпуса русского языка в настоящее время преобразовывается в поливариантный корпус с одним оригинальным и несколькими вариантами переводов этого текста. Одновременно создается база данных функционально эквивалентных лексико-грамматических глагольных форм на основе текстов поливариантного корпуса. Главная цель создания базы данных состоит в том, чтобы вычислить статистические оценки соответствий между русскими и французскими глагольными формами. В статье рассматриваются вопросы разработки информационной технологии для одновременного создания русско-французского поливариантного параллельного корпуса и этой базы данных.
Ключевые слова:параллельные поливариантные корпуса; Национальный корпус русского языка; информационные технологии; XML разметка русско-французских параллельных текстов; лексико-грамматические формы; функциональные соответствия; статистические оценки соответствий.