Аннотация:
Данная статья посвящена проблемам исследования и интегрального моделирования когнитивно-лингвистических представлений языковых структур и механизмов разрешения синтаксической неоднозначности в процессе создания лингвистических процессоров интеллектуальных систем обработки знаний и машинного перевода. Методика представления языковых структур и разрешения их неоднозначности построена на основе логико-лингвистических правил и векторных пространств. Проведено сравнительное исследование методов классификации применительно к лингвистическим задачам; выработан эффективный метод отображения вектора естественно-языковых структур в расширенное пространство признаков для классификации новых языковых объектов и структур; сформирована фокусная выборка параллельных текстов деловых и научных документов на русском, английском и французском языках по различным отраслям науки и техники; сформирована расширенная система новых категорий, повышающая изобразительные возможности исходного варианта унификационно-порождающей грамматики; выработаны пути развития базовых представлений на основе аппарата расширенных семантических сетей и метод применения векторных пространств, обеспечивающих разрешение неоднозначности ключевых языковых структур в процессе синтаксического анализа текста для извлечения знаний и машинного перевода. Разработан грамматический формализм и алгоритмические представления парсера, в котором учитываются реальные трудности перевода, такие как языковые трансформации.