RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2022, том 32, выпуск 4, страницы 32–44 (Mi ssi854)

Эта публикация цитируется в 1 статье

Методы поиска имплицитных логико-семантических отношений в параллельных текстах

А. А. Гончаров

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Аннотация: Анализируется проблема целенаправленного поиска фрагментов с имплицитными логико-семантическими отношениями (ЛСО) в параллельных текстах. Чтобы выяснить, возможен ли подобный поиск, рассмотрен потенциал параллельных текстов как источника лингвистического знания и проведен обзор исследований имплицитных ЛСО на материале таких текстов. Цель обзора — выявление методов, которые применяются для создания массивов фрагментов с имплицитными ЛСО. Показано, что параллельные тексты открывают широкие возможности поиска этих фрагментов, обусловленные тем, что в одном языке ЛСО может быть эксплицитным, а в другом — имплицитным (явление, известное как bilingual explicit / implicit mismatch). Для обнаружения подобных несоответствий используются методы: (1) дискурсивного парсинга; (2) обратного машинного перевода (МП); (3) двуязычного поиска с исключением. Таким образом, параллельные тексты, в отличие от моноязычных, позволяют решить задачу целенаправленного поиска фрагментов с имплицитными ЛСО и их последующего извлечения.

Ключевые слова: имплицитность, имплицитные логико-семантические отношения, целенаправленный поиск, обработка естественного языка, извлечение знания из текстов, параллельные тексты.

Поступила в редакцию: 15.09.2022

DOI: 10.14357/08696527220404



© МИАН, 2024