Аннотация:
Цель настоящей работы – совершенствование и автоматизация языковых моделей извлечения из текстовых документов утверждений, связанных с событиями и факторами, с использованием разработанной системы лингвистических маркеров. В статье приведены результаты апробации текст-майнинговых моделей извлечения событий и факторов на примере аналитического исследования в сфере человеческого потенциала, социальных и гуманитарных наук. Тестирования и оценка качества моделей реализованы на основе сопоставления результатов, получаемых в автоматическом режиме, в ручном режиме (при экспертно-аналитической валидации) и полуавтоматическом режиме (с использованием системы лингвистических маркеров). В результате внедренных подходов повысилось качество извлечения утверждений, содержащих события и факторы.