Аннотация:
Рассматривается проблема интеграции электронного словаря с текстами параллельного корпуса в рамках лексикографической информационной системы (ЛГИС), включающей три компонента: (1) электронный многоязычный словарь; (2) корпус как хранилище параллельных текстов; (3) базу данных (БД) аннотированных переводных соответствий (АПС) и две базы знаний. Предлагаемый подход к интеграции обсуждается на примере немецко-русского словаря и представляет собой синтез ряда концептуальных положений, таких как применение принципа многоуровневой структуризации текстов словарных статей, формирование АПС для многозначных слов и устойчивых словосочетаний и их переводов, установление связей между электронным словарем и хранилищем параллельных текстов по значениям многозначных слов и устойчивых словосочетаний. До настоящего времени подобные ЛГИС создавались только для одноязычных словарей с формированием связей только по леммам. Цель статьи — описать предлагаемый подход к интеграции многоязычного электронного словаря с текстами параллельного корпуса как теоретическую основу создания ЛГИС.
Ключевые слова:
лексикографическая информационная система, параллельные тексты, электронный многоязычный словарь, корпус, база данных аннотированных переводных соответствий.
Поступила в редакцию: 14.10.2024 Принята в печать: 15.02.2025