RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2025, том 35, выпуск 2, страницы 103–115 (Mi ssi977)

Метод автоматизированного выявления асимметрии пунктуации в параллельных текстах

С. Д. Игнатоваa, А. А. Гончаровa, Н. В. Бунтманb

a Федеральный исследовательский центр «Информатика и управление» Российской академии наук
b Московский государственный университет имени М. В. Ломоносова

Аннотация: Статья посвящена методу автоматизированного выявления межъязыковой асимметрии пунктуации в параллельных текстах. Анализ функционирования знаков препинания требует больших объемов эмпирических данных, что обусловливает использование корпусов параллельных текстов. В статье показано, каким образом можно использовать поиск с исключением в базе данных (БД) параллельных текстов для автоматизированного выявления асимметрии в употреблении пунктуационных знаков двух языков. Поиск с исключением представляет собой поиск пар текстовых фрагментов, которые содержат некоторые языковые единицы на одном языке, но не содержат ни одной единицы из заданного множества на другом языке. Проверка реализуемости автоматизированного выявления межъязыковой асимметрии пунктуации была проведена на примере восклицательного знака в языковой паре русский–французский. В ходе исследования были зафиксированы семь типов языковых замен, а также был проведен их количественный анализ.

Ключевые слова: пунктуация, межъязыковая асимметрия, параллельные тексты, поиск с исключением, база данных.

Поступила в редакцию: 12.03.2025
Принята в печать: 15.04.2025

DOI: 10.14357/08696527250207



© МИАН, 2025