RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2017, том 27, выпуск 4, страницы 164–176 (Mi ssi552)

Эта публикация цитируется в 12 статьях

Методы анализа частотности моделей перевода коннекторов и обратимость генерализации статистических данных

И. М. Зацман, М. Г. Кружков, Е. Ю. Лощилова

Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук

Аннотация: Рассматриваются методы анализа частотности аннотаций коннекторов русского языка и моделей их перевода на французский язык, реализованные в надкорпусной базе данных (НБД), содержащей параллельные тексты. Кроме них НБД содержит двуязычные аннотации переводных соответствий, включающих одновременно как рубрики исследуемых языковых единиц, в данном случае коннекторов, так и рубрики их переводов, найденных в параллельных текстах. Рубрики, проставляемые лингвистами в НБД и принадлежащие к фасетным классификациям, многоаспектно описывают модели перевода исследуемых языковых единиц. Характерной чертой реализации в НБД методов анализа частотности коннекторов и моделей их перевода является обратимость процесса вычисления статистических данных. Другими словами, значение частотности некоторого коннектора является гиперссылкой к списку аннотаций случаев употребления этого коннектора в параллельных текстах НБД. Поддержка в НБД фасетных классификаций обеспечивает возможность проведения многоаспектного статистического анализа аннотированных коннекторов и моделей их перевода. При этом получаемые статистические данные являются верифицируемыми, так как динамически формируются ссылки от вычисленных данных к спискам соответствующих им аннотаций. Основная цель статьи заключается в описании методов анализа частотности моделей перевода коннекторов, включая те методы, которые обеспечивают обратимость процесса генерализации вычисляемых статистических данных о моделях перевода разной степени обобщения.

Ключевые слова: надкорпусная база данных; модели перевода; аннотирование моделей перевода; фасетные классификации; корпусная лингвистика; генерализация; обратимость процесса генерализации.

Поступила в редакцию: 15.09.2017

DOI: 10.14357/08696527170413



Реферативные базы данных:


© МИАН, 2024