RUS  ENG
Полная версия
ЖУРНАЛЫ // Ученые записки Казанского университета. Серия Физико-математические науки // Архив

Учён. зап. Казан. гос. ун-та. Сер. Физ.-матем. науки, 2009, том 151, книга 3, страницы 214–228 (Mi uzku800)

Эта публикация цитируется в 1 статье

Эвристики для улучшения работы частичного синтаксического анализатора

В. А. Буштедтa, В. Н. Поляковabc

a Московский институт стали и сплавов
b Институт языкознания РАН
c Московский государственный лингвистический университет

Аннотация: В статье описана работа частичного синтаксического анализатора с использованием эвристик, которые позволяют сократить количество ложно выявленных при первоначальном анализе синтаксических конструкций (чанков). В предыдущих работах авторов было выявлено, что в русском языке на обнаружение чанков очень большое воздействие оказывают явления омонимии и полисемии. Под ложно выявленными чанками понимаются такие, которые были обнаружены частичным синтаксическим анализатором, но не являются на самом деле верными. Метод поиска чанков с применением этих эвристик получил название “Right-Chunk 4”. Приведена формальная постановка задачи. Выполнена компьютерная реализация метода поиска чанков, результатом которой является программный комплекс “Chunk-Creator 4”. Проведена оценка эффективности предложенного метода поиска чанков.

Ключевые слова: искусственный интеллект, компьютерная лингвистика, парсинг, синтаксический анализ, чанкинг.

УДК: 004.81

Поступила в редакцию: 26.02.2009



© МИАН, 2024