Аннотация:
В статье описывается эксперимент по извлечению двухсловных
терминологических словосочетаний на основе комбинирования
различных признаков этих словосочетаний. Признаки
вычисляются на основе трех источников: статистики употребления слов в
текстовой коллекции
предметной области, выдачи глобальных поисковых машин и
тезауруса предметной области. Для оценки качества извлечения терминов
используется терминологические словосочетания из онтологии по естественным
наукам и
технологиям ОЕНТ. Показано, что использование совокупности признаков
словосочетаний значительно улучшает извлечение терминов.