Аннотация:
В настоящей работе ставится задача автоматического выявления границ именных групп, заполняющих валентность предиката в предложении. Рассматриваются именные группы любых видов, за исключением сочиненных. Используется предварительная автоматическая сегментация предложений на фрагменты, заведомо содержащие искомые именные группы. Для проведения границ именных групп внутри найденных фрагментов применяется метод машинного обучения. В системе признаков используется информация об извлеченных на предварительном этапе анализа именованных сущностях разных типов, а также данные из базы знаний. Приводятся результаты эксперимента по выявлению границ именных групп.
Ключевые слова и фразы:частичный синтаксический анализ, автоматическое извлечение информации, именованные сущности, машинное обучение.
УДК:
004.89:004.912
Поступила в редакцию: 05.10.2017 Подписана в печать : 01.11.2017