RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2019, том 29, выпуск 2, страницы 148–160 (Mi ssi647)

Эта публикация цитируется в 8 статьях

Методология аннотирования в надкорпусных базах данных

А. А. Гончаров, О. Ю. Инькова, М. Г. Кружков

Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук

Аннотация: Рассматриваются методологические принципы аннотирования языковых единиц (ЯЕ) в рамках кросслингвистических надкорпусных баз данных (НБД). Надкорпусные базы данных представляют собой новый вид лингвистических информационных ресурсов, позволяющий сохранять результаты лингвистического анализа корпусных данных в виде аннотаций, структурированных в соответствии с задачами исследования. Выделяются 4 основных этапа аннотирования: поиск объектов исследования, выбор ЯЕ (в оригинале и в переводе) и формирование контекста, выбор дополнительных признаков ЯЕ (в оригинале и в переводе) и, наконец, формирование переводного соответствия (ПС) и выбор его признаков. Рассматривается также функциональный потенциал НБД и обобщаются описанные ранее частные методики аннотирования, на основе чего делается вывод о возможности применения разработанной методологии к другим объектам исследования.

Ключевые слова: надкорпусные базы данных, фасетные классификации, лингвистическое аннотирование, методология аннотирования, контрастивная лингвистика.

Поступила в редакцию: 15.03.2019

DOI: 10.14357/08696527190213



© МИАН, 2024