RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2017, том 11, выпуск 1, страницы 100–108 (Mi ia463)

Эта публикация цитируется в 22 статьях

Надкорпусная база данных коннекторов: построение системы терминов

Анна А. Зализнякab, И. М. Зацманb, О. Ю. Иньковаc

a Институт языкознания Российской академии наук
b Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук
c Женевский университет

Аннотация: Рассматривается задача контрастивного исследования коннекторов русского языка с помощью надкорпусной базы данных (НБД), которая представляет собой новую категорию информационных лингвистических ресурсов. Надкорпусная база данных содержит параллельные выровненные тексты, в которых одному или нескольким предложениям поставлены в соответствие одно или несколько предложений их перевода. Первая характерная черта НБД заключается в возможности аннотирования исследуемых языковых единиц (ЯЕ), в данном случае коннекторов. Вторая состоит в том, что решение задачи аннотирования привело к появлению широкого спектра новых сущностей и понятий как в информатике, так и в лингвистике. Для их описания предлагается система терминов, носящая междисциплинарный характер. С одной стороны, эти термины используются лингвистами для представления новых фундаментальных знаний, полученных ими в процессе контрастивного исследования коннекторов русского языка. С другой стороны, они применяются при разработке архитектуры и функциональных подсистем НБД, а также для разработки информационного, лингвистического и программного видов обеспечения. Кроме того, эта система терминов необходима для сопоставления полученных результатов с имеющимися отечественными и зарубежными аналогами.

Ключевые слова: надкорпусная база данных; система терминов; аннотирование коннекторов; параллельные тексты; корпусная лингвистика; хронотипическая фасетная классификация.

Поступила в редакцию: 17.01.2017

DOI: 10.14357/19922264170109



Реферативные базы данных:


© МИАН, 2024