RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2014, том 8, выпуск 1, страницы 89–98 (Mi ia301)

Эта публикация цитируется в 1 статье

Интегральное моделирование языковых структур в лингвистических процессорах систем обработки знаний и машинного перевода

Е. Б. Козеренко

Институт проблем информатики Российской академии наук

Аннотация: Данная статья посвящена проблемам исследования и интегрального моделирования когнитивно-лингвистических представлений языковых структур и механизмов разрешения синтаксической неоднозначности в процессе создания лингвистических процессоров интеллектуальных систем обработки знаний и машинного перевода. Методика представления языковых структур и разрешения их неоднозначности построена на основе логико-лингвистических правил и векторных пространств. Проведено сравнительное исследование методов классификации применительно к лингвистическим задачам; выработан эффективный метод отображения вектора естественно-языковых структур в расширенное пространство признаков для классификации новых языковых объектов и структур; сформирована фокусная выборка параллельных текстов деловых и научных документов на русском, английском и французском языках по различным отраслям науки и техники; сформирована расширенная система новых категорий, повышающая изобразительные возможности исходного варианта унификационно-порождающей грамматики; выработаны пути развития базовых представлений на основе аппарата расширенных семантических сетей и метод применения векторных пространств, обеспечивающих разрешение неоднозначности ключевых языковых структур в процессе синтаксического анализа текста для извлечения знаний и машинного перевода. Разработан грамматический формализм и алгоритмические представления парсера, в котором учитываются реальные трудности перевода, такие как языковые трансформации.

Ключевые слова: параллельные тексты; векторные пространства; синтаксис; семантика; фразовые структуры; гибридные модели; машинный перевод.

Поступила в редакцию: 26.12.2013

DOI: 10.14375/19922264140109



Реферативные базы данных:


© МИАН, 2024