RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2024, том 18, выпуск 3, страницы 106–114 (Mi ia916)

Принципы аннотирования имплицитных логико-семантических отношений в параллельных текстах

А. А. Гончаров, П. В. Ярошенко

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Аннотация: Рассматривается проблема аннотирования имплицитных логико-семантических отношений (ЛСО). Проанализирован мировой опыт аннотирования имплицитных ЛСО. Представлены подходы, ориентированные на (1) анализ глобальной структуры текста; (2) анализ локальной структуры текста; (3) унификацию данных, размеченных в рамках различных теорий, и разработку единого стандарта аннотирования. Предложены принципы аннотирования имплицитных ЛСО в параллельных текстах, т. е. в качестве объекта аннотирования выступает переводное соответствие (пара фрагментов текста оригинала и перевода). Рассматривались такие переводные соответствия, где в русскоязычном тексте показатели ЛСО отсутствуют, а в тексте на другом языке, напротив, имеются. С учетом специфики имплицитных ЛСО сформулированы следующие принципы их аннотирования: (1) необходимо выделять границы аргументов ЛСО (обеспечивается наглядность и удобство анализа); (2) признаки блоков текста должны образовывать иерархическую структуру (обеспечивается удобство работы с большим числом признаков); (3) если признак блока текста имеет лексический показатель, то этот показатель должен быть выделен (обеспечивается более высокая обоснованность решений разметчика).

Ключевые слова: лингвистическое аннотирование, дискурсивные отношения, логико-семантические отношения, имплицитность, параллельные тексты.

Поступила в редакцию: 12.07.2024

DOI: 10.14357/19922264240313



© МИАН, 2024