Аннотация:
Представлен обзор концепции, основных структурных составляющих и функций надкорпусных баз данных (НБД). Надкорпусные базы данных представляют собой новый вид структурированных информационных ресурсов. Они существенно расширяют возможности лингвистических текстовых корпусов, в особенности параллельных. Цель статьи — познакомить читателей с основными возможностями параллельных корпусов, а также продемонстрировать, каким образом концепция НБД позволяет расширять эти возможности и преодолевать некоторые их ограничения. В рамках НБД лингвисты могут устанавливать, фиксировать и аннотировать переводные соответствия (ПС) между языковыми единицами (ЯЕ) в языках оригинала и перевода, при этом для их аннотации используются рубрики фасетных классификаций, которые исследователи формируют в соответствии со своими потребностями. Также описана общая архитектура НБД, разработанных в ФИЦ ИУ РАН, которая подразделяется на корпусную и надкорпусную составляющие, взаимодействующие друг с другом в рамках единой базы данных.
Ключевые слова:корпусная лингвистика, надкорпусная база данных, параллельный корпус, лингвистическое аннотирование, информационные технологии, фасетная классификация.