Аннотация:
В статье описана работа частичного синтаксического анализатора с использованием эвристик, которые позволяют сократить количество ложно выявленных при первоначальном анализе синтаксических конструкций (чанков). В предыдущих работах авторов было выявлено, что в русском языке на обнаружение чанков очень большое воздействие оказывают явления омонимии и полисемии. Под ложно выявленными чанками понимаются такие, которые были обнаружены частичным синтаксическим анализатором, но не являются на самом деле верными. Метод поиска чанков с применением этих эвристик получил название “Right-Chunk 4”. Приведена формальная постановка задачи. Выполнена компьютерная реализация метода поиска чанков, результатом которой является программный комплекс “Chunk-Creator 4”. Проведена оценка эффективности предложенного метода поиска чанков.