RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2018, том 28, выпуск 4, страницы 156–167 (Mi ssi615)

Эта публикация цитируется в 12 статьях

Надкорпусная база данных коннекторов: развитие системы терминов проектирования

И. М. Зацман, М. Г. Кружков

Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук

Аннотация: Рассматривается задача развития системы терминов, ориентированного на проектирование надкорпусной базы данных (НБД) коннекторов, которая представляет собой новую категорию информационных лингвистических ресурсов. Надкорпусная база данных содержит параллельные выровненные тексты, в которых одному или нескольким предложениям оригинальных текстов поставлены в соответствие одно или несколько предложений их переводов. Надкорпусные базы данных предназначены для аннотирования широкого спектра языковых единиц (ЯЕ), но в данной статье рассматривается задача аннотирования коннекторов. Характерная черта НБД состоит в том, что их ориентация на решение задач аннотирования привела к появлению новых сущностей и понятий в компьютерной лингвистике. Для их описания в начале 2017 г. была предложена система терминов. С одной стороны, эти термины используются лингвистами для представления новых фундаментальных знаний, полученных ими в процессе аннотирования и контрастивного исследования языковых единиц. С другой стороны, они применяются при разработке архитектурных решений НБД, их информационного, лингвистического и программного обеспечения. За время, прошедшее с момента первого описания системы терминов, существенно расширился спектр задач, решаемых с помощью НБД. Этим обусловлена необходимость развития этой системы терминов, ориентированного на проектирование НБД, чему и посвящена данная статья.

Ключевые слова: надкорпусная база данных, система терминов, аннотирование языковых единиц, параллельные тексты, корпусная лингвистика, коннекторы.

Поступила в редакцию: 07.09.2018

DOI: 10.14357/08696527180415



Реферативные базы данных:


© МИАН, 2024