RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2016, том 10, выпуск 1, страницы 106–118 (Mi ia408)

Эта публикация цитируется в 24 статьях

Представление кроссязыковых знаний о коннекторах в надкорпусных базах данных

И. М. Зацманa, О. Ю. Иньковаba, М. Г. Кружковa, Н. A. Попковаa

a Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук
b Женевский университет

Аннотация: Рассматриваются используемые в контрастивных лингвистических исследованиях базы данных (БД), получившие название «надкорпусных». Они формируются в результате обработки текстов, хранящихся в двуязычных параллельных подкорпусах Национального корпуса русского языка. В них каждому тексту на русском языке соответствует один или несколько его переводов на другой язык, а каждому тексту на иностранном языке — один его перевод на русский язык. Каждый текст на языке оригинала и его переводы выровнены по предложениям. Надкорпусные БД (НБД) представляют собой новый вид лингвистических ресурсов, которые предназначены для целенаправленного извлечения новых знаний о широком спектре языковых единиц (ЯЕ). Эти знания необходимы для повышения качества машинного перевода, актуализации моно- и двуязычных грамматик, а также для обновления многообразных образовательных курсов по лингвистике, теории и практике перевода. В статье дается описание концепции формирования НБД и примера реализации такой базы для представления знаний о коннекторах русского языка и об их переводах на французский язык.

Ключевые слова: кроссязыковые знания; коннекторы русского языка; представление знаний о коннекторах; надкорпусные базы данных.

Поступила в редакцию: 28.01.2016

DOI: 10.14357/19922264160110



Реферативные базы данных:


© МИАН, 2024