RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2018, том 12, выпуск 3, страницы 83–90 (Mi ia551)

Эта публикация цитируется в 1 статье

Statistical analysis of language specificity of connectives based on parallel texts

[Статистический анализ лингвоспецифичности коннекторов (на материале параллельных корпусов)]

O. Yu. Inkova, M. G. Kruzhkov

Institute of Informatics Problems, Federal Research Center “Computer Science and Control” of the Russian Academy of Sciences, 44-2 Vavilov Str., Moscow 119333, Russian Federation

Аннотация: В последние десятилетия проблемы лингвоспецифичности в русском языке привлекают пристальное внимание исследователей, хотя до последнего времени они рассматривались без привлечения корпусных методов. В этой работе описываются новые методы исследования лингвоспецифичности русских коннекторов с привлечением статистического анализа аннотированных параллельных корпусов. Русско-французские и франко-русские параллельные тексты обрабатываются с помощью Надкорпусной базы данных коннекторов, разработанной специально для аннотирования переводных соответствий, выявляемых в параллельных корпусах. Каждое переводное соответствие включает в себя аннотацию русского коннектора и его переводного эквивалента, что позволяет генерировать статистические данные по различным типам моделей перевода — на основе предлагаемых для коннекторов параметров лингвоспецифичности. В качестве примера в данной работе рассматриваются два русских коннектора: или и а то. На основе предлагаемых статистических параметров будет показано, что или имеет очень низкий уровень лингвоспецифичности в сопоставлении с французским языком, в то время как коннектор а то обладает высокой лингвоспецифичностью. Результаты данного исследования могут быть востребованы в информатике (машинный перевод, статистический анализ текстовых данных), а также в различных областях, связанных с контрастивными лингвистическими исследованиями, таких как лексическая типология, лексикография и переводоведение.

Ключевые слова: надкорпусные базы данных; статистический анализ; контрастивный корпусный анализ; лингвоспецифичность; параллельные корпуса; лингвистические информационные ресурсы; коннекторы; дискурсивные отношения; семантика.

Поступила в редакцию: 06.07.2018

Язык публикации: английский

DOI: 10.14357/19922264180312



Реферативные базы данных:


© МИАН, 2024