RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2013, том 7, выпуск 2, страницы 100–109 (Mi ia266)

Эта публикация цитируется в 16 статьях

Information technologies for creating the database of equivalent verbal forms in the Russian–French multivariant parallel corpus

[Информационные технологии создания баз данных эквивалентных глагольных форм в русско-французском поливариантном параллельном корпусе]

S. Loiseaua, D. V. Sitchinavab, A. A. Zalizniakcd, I. M. Zatsmand

a Université Paris 13, Sorbonne Paris Cité, Laboratoire LDI (Lexiques, dictionnaires, informatique), CNRS, UMR 7187
b Institute of the Russian Language of the Russian Academy of Sciences
c Institute of Linguistics of the Russian Academy of Sciences
d IPI RAN

Аннотация: Русско-французский параллельный корпус как часть Национального корпуса русского языка в настоящее время преобразовывается в поливариантный корпус с одним оригинальным и несколькими вариантами переводов этого текста. Одновременно создается база данных функционально эквивалентных лексико-грамматических глагольных форм на основе текстов поливариантного корпуса. Главная цель создания базы данных состоит в том, чтобы вычислить статистические оценки соответствий между русскими и французскими глагольными формами. В статье рассматриваются вопросы разработки информационной технологии для одновременного создания русско-французского поливариантного параллельного корпуса и этой базы данных.

Ключевые слова: параллельные поливариантные корпуса; Национальный корпус русского языка; информационные технологии; XML разметка русско-французских параллельных текстов; лексико-грамматические формы; функциональные соответствия; статистические оценки соответствий.

Язык публикации: английский



© МИАН, 2024