Аннотация:
Описываются интеграционные возможности надкорпусных баз данных, разработанных в ФИЦ ИУ РАН. Продемонстрировано, как три базы данных — Надкорпусная база данных иерархии логико-семантических отношений (НБДИ ЛСО), База данных параллельных текстов (БДТ) и Надкорпусная база данных коннекторов (НБДК) — интегрированы между собой. Информационная система иерархии логико-семантических отношений (ИСИЛСО) использует специально спроектированную базу данных (НБДИ ЛСО), в которой аннотации логико-семантических отношений представлены в виде деревьев, т. е. ориентированных связных ациклических графов, где узлы содержат данные, а ребра отображают отношение подчиненности между узлами. Наряду с НБДИ ЛСО ИСИЛСО использует данные из БДТ и НБДК. Такая интеграция позволяет комбинировать методологические наработки информатики, контрастивной и корпусной лингвистики, теории и практики перевода, не упуская из виду факторы, которые могут отрицательно сказаться на валидности и надежности конечных данных.
Ключевые слова:надкорпусная база данных, интеграция баз данных, многоязычный корпус, параллельный корпус, корпусные информационные ресурсы, переводоведение, контрастивная лингвистика, машинный перевод.