А. Ю. Егорова, И. М. Зацман, О. С. Мамонова, “Надкорпусные базы данных в лингвистических проектах”, Системы и средства информ., 2019, том 29, выпуск 3,страницы 77

Эта публикация цитируется в 10 статьях

Надкорпусные базы данных в лингвистических проектах

А. Ю. Егорова^a, И. М. Зацман^a, О. С. Мамонова^b

^a Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук
^b Факультет иностранных языков и регионоведения Московского государственного университета им. М. В. Ломоносова

Аннотация: Рассматривается задача обеспечения лингвистических исследований средствами надкорпусных баз данных (НБД), содержащих выровненные параллельные тексты (каждый из которых включает оригинальный текст и его перевод), а также двуязычные аннотации исследуемых языковых единиц (ЯЕ) и их переводов, сформированные на основе параллельных текстов. Каждая аннотация, формируемая лингвистом, фиксирует некоторую модель перевода ЯЕ. Опыт выполнения в ФИЦ ИУ РАН ряда лингвистических проектов показал, что далеко не все модели перевода, извлекаемые лингвистами из параллельных текстов в процессе лингвистического аннотирования с помощью НБД, описаны в двуязычных словарях и справочниках. Отличительная черта НБД состоит в том, что они позволяют получать новое знание о переводных соответствиях. Оно извлекается лингвистами при сопоставлении и аннотировании предложений оригинального текста и их переводов. Описание функций НБД, которые обеспечивают получение лингвистами нового знания в процессе аннотирования, является основной целью статьи.

Ключевые слова: надкорпусная база данных, лингвистическое аннотирование, языковая единица, корпусная лингвистика, модели перевода.

Поступила в редакцию: 23.07.2019

DOI: 10.14357/08696527190307