Аннотация:
В рамках проблемы автоматического выявления ситуаций в публицистических текстах на русском языке рассматривается задача поиска сложных временных выражений. Выделение именных групп, содержащих временные выражения, понимается как подзадача частичного синтаксического анализа (shallow parsing). Предлагается алгоритм, состоящий из предварительной сегментации и последующего поиска границ именных групп в выделенном сегменте с помощью машинного обучения (CRF-модели). Приводятся результаты экспериментов.
Ключевые слова и фразы:автоматическое извлечение информации, выделение именованных сущностей, извлечение ситуаций, выделение именных групп, временные выражения, синтаксический анализ, CRF.
УДК:
004.89:004.912
Поступила в редакцию: 06.11.2016 Подписана в печать : 26.12.2016