Аннотация:
Рассматривается задача аннотирования коннекторов русского языка и их переводов с помощью надкорпусной базы данных (НБД). Первая характерная черта НБД состоит в возможности формирования лингвистами двуязычных аннотаций, включающих одновременно как рубрики исследуемых языковых единиц (ЯЕ), в данном случае коннекторов, так и рубрики их переводов. Вторая черта заключается в том, что проставляемые лингвистами рубрики принадлежат к фасетным классификациям. Их реализация в НБД обеспечивает альтернативность генерализации аннотаций, которые являются конкретными информационными сущностями НБД. В процессе их генерализации формируются абстрактные модели перевода разной степени обобщения. Эти модели сохраняют ряд общих черт (аспектов) обобщаемых аннотаций. Поддержка в НБД фасетных классификаций обеспечивает возможность проведения многоаспектного статистического анализа сформированных аннотаций и моделей перевода коннекторов. При этом получаемые статистические данные являются верифицируемыми, так как динамически формируются ссылки от вычисленных данных к спискам соответствующих им аннотаций. Основная цель статьи заключается в описании обратимости и альтернативности процесса генерализации в НБД, что является основой многоаспектного и верифицируемого статистического анализа аннотаций и моделей перевода коннекторов в параллельных текстах.