RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2025, том 35, выпуск 1, страницы 111–124 (Mi ssi967)

Интеграция электронного словаря с текстами параллельного корпуса: новый теоретический подход

Д. О. Добровольскийabc, И. М. Зацманc

a Институт русского языка Российской академии наук
b Институт языкознания Российской академии наук
c Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Аннотация: Рассматривается проблема интеграции электронного словаря с текстами параллельного корпуса в рамках лексикографической информационной системы (ЛГИС), включающей три компонента: (1) электронный многоязычный словарь; (2) корпус как хранилище параллельных текстов; (3) базу данных (БД) аннотированных переводных соответствий (АПС) и две базы знаний. Предлагаемый подход к интеграции обсуждается на примере немецко-русского словаря и представляет собой синтез ряда концептуальных положений, таких как применение принципа многоуровневой структуризации текстов словарных статей, формирование АПС для многозначных слов и устойчивых словосочетаний и их переводов, установление связей между электронным словарем и хранилищем параллельных текстов по значениям многозначных слов и устойчивых словосочетаний. До настоящего времени подобные ЛГИС создавались только для одноязычных словарей с формированием связей только по леммам. Цель статьи — описать предлагаемый подход к интеграции многоязычного электронного словаря с текстами параллельного корпуса как теоретическую основу создания ЛГИС.

Ключевые слова: лексикографическая информационная система, параллельные тексты, электронный многоязычный словарь, корпус, база данных аннотированных переводных соответствий.

Поступила в редакцию: 14.10.2024
Принята в печать: 15.02.2025

DOI: 10.14357/08696527250106



© МИАН, 2025