Аннотация:
Рассматривается задача развития системы терминов, ориентированного на проектирование надкорпусной базы данных (НБД) коннекторов, которая представляет собой новую категорию информационных лингвистических ресурсов. Надкорпусная база данных содержит параллельные выровненные тексты, в которых одному или нескольким предложениям оригинальных текстов поставлены в соответствие одно или несколько предложений их переводов. Надкорпусные базы данных предназначены для аннотирования широкого спектра языковых единиц (ЯЕ), но в данной статье рассматривается задача аннотирования коннекторов. Характерная черта НБД состоит в том, что их ориентация на решение задач аннотирования привела к появлению новых сущностей и понятий в компьютерной лингвистике. Для их описания в начале 2017 г. была предложена система терминов. С одной стороны, эти термины используются лингвистами для представления новых фундаментальных знаний, полученных ими в процессе аннотирования и контрастивного исследования языковых единиц. С другой стороны, они применяются при разработке архитектурных решений НБД, их информационного, лингвистического и программного обеспечения. За время, прошедшее с момента первого описания системы терминов, существенно расширился спектр задач, решаемых с помощью НБД. Этим обусловлена необходимость развития этой системы терминов, ориентированного на проектирование НБД, чему и посвящена данная статья.
Ключевые слова:надкорпусная база данных, система терминов, аннотирование языковых единиц, параллельные тексты, корпусная лингвистика, коннекторы.