RUS  ENG
Полная версия
ЖУРНАЛЫ // Вычислительные методы и программирование // Архив

Выч. мет. программирование, 2010, том 11, выпуск 4, страницы 108–116 (Mi vmp345)

Эта публикация цитируется в 2 статьях

Программирование

Комбинирование признаков для автоматического извлечения терминов

Н. В. Лукашевич, Ю. М. Логачев

Научно-исследовательский вычислительный центр, Московский государственный университет им. М. В. Ломоносова

Аннотация: В статье описывается эксперимент по извлечению двухсловных терминологических словосочетаний на основе комбинирования различных признаков этих словосочетаний. Признаки вычисляются на основе трех источников: статистики употребления слов в текстовой коллекции предметной области, выдачи глобальных поисковых машин и тезауруса предметной области. Для оценки качества извлечения терминов используется терминологические словосочетания из онтологии по естественным наукам и технологиям ОЕНТ. Показано, что использование совокупности признаков словосочетаний значительно улучшает извлечение терминов.

Ключевые слова: извлечение знаний из текстов; извлечение терминов; тезаурус; машинное обучение; поисковая система; Интернет.

УДК: 004.853



© МИАН, 2024