RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2014, том 8, выпуск 2, страницы 98–110 (Mi ia315)

Эта публикация цитируется в 9 статьях

Информационные технологии корпусных исследований: принципы построения кросслингвистических баз данных

Н. В. Бунтманa, Анна А. Зализнякbc, И. М. Зацманb, М. Г. Кружковb, Е. Ю. Лощиловаb, Д. В. Сичинаваd

a Московский государственный университет им. М. В. Ломоносова, факультет иностранных языков и регионоведения
b Институт проблем информатики Российской академии наук
c Институт языкознания Российской академии наук
d Институт русского языка Российской академии наук

Аннотация: Рассматривается информационная технология создания кросслингвистических баз данных текстов на русском языке и их переводов на французский язык, называемых параллельными текстами. Разработанные принципы построения этой базы данных обеспечивают реализацию уникального сочетания трех видов двуязычного поиска: лексического, грамматического и лексико-грамматического. Отличительной чертой рассматриваемой технологии является одновременное формирование русско-французского параллельного подкорпуса Национального корпуса русского языка (НКРЯ) и кросслингвистической базы данных глагольных лексико-грамматических форм русского языка и их функциональных эквивалентов во французских переводах. Подкорпус и база данных обладают разной глубиной выравнивания: в первом случае оно выполняется на уровне предложений, а во втором — на уровне конструкций. Теоретическое значение создания этой базы данных заключается в обеспечении исследований как в области двуязычной контрастивной грамматики, так и в направлении создания грамматики русского языка, опирающейся на современную эмпирическую базу и информационные технологии корпусной лингвистики. Ее основное прикладное назначение заключается в повышении качества машинного перевода.

Ключевые слова: параллельный корпус; информационная технология; кросслингвистические базы данных; двуязычный лексико-грамматический поиск; корпусная лингвистика; контрастивная грамматика.

Поступила в редакцию: 29.03.2014

DOI: 10.14357/19922264140210



Реферативные базы данных:


© МИАН, 2024