Аннотация:
Рассматриваются методы анализа частотности аннотаций коннекторов русского языка и моделей их перевода на французский язык, реализованные в надкорпусной базе данных (НБД), содержащей параллельные тексты. Кроме них НБД содержит двуязычные аннотации переводных соответствий, включающих одновременно как рубрики исследуемых языковых единиц, в данном случае коннекторов, так и рубрики их переводов, найденных в параллельных текстах. Рубрики, проставляемые лингвистами в НБД и принадлежащие к фасетным классификациям, многоаспектно описывают модели перевода исследуемых языковых единиц. Характерной чертой реализации в НБД методов анализа частотности коннекторов и моделей их перевода является обратимость процесса вычисления статистических данных. Другими словами, значение частотности некоторого коннектора является гиперссылкой к списку аннотаций случаев употребления этого коннектора в параллельных текстах НБД. Поддержка в НБД фасетных классификаций обеспечивает возможность проведения многоаспектного статистического анализа аннотированных коннекторов и моделей их перевода. При этом получаемые статистические данные являются верифицируемыми, так как динамически формируются ссылки от вычисленных данных к спискам соответствующих им аннотаций. Основная цель статьи заключается в описании методов анализа частотности моделей перевода коннекторов, включая те методы, которые обеспечивают обратимость процесса генерализации вычисляемых статистических данных о моделях перевода разной степени обобщения.
Ключевые слова:надкорпусная база данных; модели перевода; аннотирование моделей перевода; фасетные классификации; корпусная лингвистика; генерализация; обратимость процесса генерализации.