RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2023, том 33, выпуск 1, страницы 24–34 (Mi ssi867)

Интеграционные возможности надкорпусных баз данных

А. А. Дурновоa, О. Ю. Иньковаab, В. А. Нуриевa

a Федеральный исследовательский центр «Информатика и управление» Российской академии наук
b Женевский университет

Аннотация: Описываются интеграционные возможности надкорпусных баз данных, разработанных в ФИЦ ИУ РАН. Продемонстрировано, как три базы данных — Надкорпусная база данных иерархии логико-семантических отношений (НБДИ ЛСО), База данных параллельных текстов (БДТ) и Надкорпусная база данных коннекторов (НБДК) — интегрированы между собой. Информационная система иерархии логико-семантических отношений (ИСИЛСО) использует специально спроектированную базу данных (НБДИ ЛСО), в которой аннотации логико-семантических отношений представлены в виде деревьев, т. е. ориентированных связных ациклических графов, где узлы содержат данные, а ребра отображают отношение подчиненности между узлами. Наряду с НБДИ ЛСО ИСИЛСО использует данные из БДТ и НБДК. Такая интеграция позволяет комбинировать методологические наработки информатики, контрастивной и корпусной лингвистики, теории и практики перевода, не упуская из виду факторы, которые могут отрицательно сказаться на валидности и надежности конечных данных.

Ключевые слова: надкорпусная база данных, интеграция баз данных, многоязычный корпус, параллельный корпус, корпусные информационные ресурсы, переводоведение, контрастивная лингвистика, машинный перевод.

Поступила в редакцию: 11.10.2022

DOI: 10.14357/08696527230103



© МИАН, 2024