RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2019, том 29, выпуск 3, страницы 77–91 (Mi ssi656)

Эта публикация цитируется в 8 статьях

Надкорпусные базы данных в лингвистических проектах

А. Ю. Егороваa, И. М. Зацманa, О. С. Мамоноваb

a Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук
b Факультет иностранных языков и регионоведения Московского государственного университета им. М. В. Ломоносова

Аннотация: Рассматривается задача обеспечения лингвистических исследований средствами надкорпусных баз данных (НБД), содержащих выровненные параллельные тексты (каждый из которых включает оригинальный текст и его перевод), а также двуязычные аннотации исследуемых языковых единиц (ЯЕ) и их переводов, сформированные на основе параллельных текстов. Каждая аннотация, формируемая лингвистом, фиксирует некоторую модель перевода ЯЕ. Опыт выполнения в ФИЦ ИУ РАН ряда лингвистических проектов показал, что далеко не все модели перевода, извлекаемые лингвистами из параллельных текстов в процессе лингвистического аннотирования с помощью НБД, описаны в двуязычных словарях и справочниках. Отличительная черта НБД состоит в том, что они позволяют получать новое знание о переводных соответствиях. Оно извлекается лингвистами при сопоставлении и аннотировании предложений оригинального текста и их переводов. Описание функций НБД, которые обеспечивают получение лингвистами нового знания в процессе аннотирования, является основной целью статьи.

Ключевые слова: надкорпусная база данных, лингвистическое аннотирование, языковая единица, корпусная лингвистика, модели перевода.

Поступила в редакцию: 23.07.2019

DOI: 10.14357/08696527190307



© МИАН, 2024