RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2007, том 1, выпуск 1, страницы 54–65 (Mi ia120)

Эта публикация цитируется в 3 статьях

Лингвистическое моделирование для систем машинного перевода и обработки знаний

Е. Б. Козеренко

Институт проблем информатики РАН

Аннотация: Данная работа посвящена актуальным проблемам создания семантико-синтаксических представлений для систем машинного перевода и извлечения знаний из естественно-языковых текстов. Целью наших исследований является построение целостной лингвистической модели на основе синергетического подхода, использующего лингвистические знания, статистические методы и механизмы машинного обучения для извлечения новых грамматических правил из текстовых корпусов и разрешения неоднозначности. Для формализации лингвистических знаний используется когнитивная трансферная грамматика (КТГ), являющаяся семантически мотивированным вариантом унификационно-порождающей грамматики. Для подготовки обучающих компонентов систем и получения статистических данных о языковых структурах создается многоязычный лингвистический ресурс, представляющий собой банк синтаксических деревьев (Treebank) и корпус семантически выровненных параллельных текстов на русском, английском и ряде других европейских языков.

Ключевые слова: машинный перевод; формальные грамматики; лингвистическая модель; выравнивание параллельных текстов; семантика; синтаксис; языковые структуры.



© МИАН, 2024