RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2021, том 31, выпуск 3, страницы 101–112 (Mi ssi785)

Эта публикация цитируется в 6 статьях

Концепция построения надкорпусных баз данных

М. Г. Кружков

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Аннотация: Представлен обзор концепции, основных структурных составляющих и функций надкорпусных баз данных (НБД). Надкорпусные базы данных представляют собой новый вид структурированных информационных ресурсов. Они существенно расширяют возможности лингвистических текстовых корпусов, в особенности параллельных. Цель статьи — познакомить читателей с основными возможностями параллельных корпусов, а также продемонстрировать, каким образом концепция НБД позволяет расширять эти возможности и преодолевать некоторые их ограничения. В рамках НБД лингвисты могут устанавливать, фиксировать и аннотировать переводные соответствия (ПС) между языковыми единицами (ЯЕ) в языках оригинала и перевода, при этом для их аннотации используются рубрики фасетных классификаций, которые исследователи формируют в соответствии со своими потребностями. Также описана общая архитектура НБД, разработанных в ФИЦ ИУ РАН, которая подразделяется на корпусную и надкорпусную составляющие, взаимодействующие друг с другом в рамках единой базы данных.

Ключевые слова: корпусная лингвистика, надкорпусная база данных, параллельный корпус, лингвистическое аннотирование, информационные технологии, фасетная классификация.

Поступила в редакцию: 14.08.2021

DOI: 10.14357/08696527210309



© МИАН, 2024