Аннотация:
Рассматривается задача обеспечения лингвистических исследований
средствами надкорпусных баз данных (НБД), содержащих выровненные
параллельные тексты (каждый из которых включает оригинальный текст и его
перевод), а также двуязычные аннотации исследуемых языковых единиц (ЯЕ) и их
переводов, сформированные на основе параллельных текстов. Каждая
аннотация, формируемая лингвистом, фиксирует некоторую модель перевода
ЯЕ. Опыт выполнения в ФИЦ ИУ РАН ряда лингвистических
проектов показал, что далеко не все модели перевода, извлекаемые
лингвистами из параллельных текстов в процессе лингвистического
аннотирования с помощью НБД, описаны в двуязычных словарях
и справочниках. Отличительная черта НБД состоит в том, что они позволяют
получать новое знание о переводных соответствиях. Оно извлекается
лингвистами при сопоставлении и аннотировании предложений оригинального
текста и их переводов. Описание функций НБД, которые обеспечивают
получение лингвистами нового знания в процессе аннотирования, является
основной целью статьи.
Ключевые слова:надкорпусная база данных, лингвистическое аннотирование, языковая единица, корпусная лингвистика, модели перевода.