RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2016, том 10, выпуск 1, страницы 119–128 (Mi ia409)

Применение контекстно-свободных грамматик для извлечения онтологии из текстов коротких описаний статей биологической тематики

Д. А. Алексеевский

НИУ Высшая школа экономики

Аннотация: Обработка текстов биологической и медицинской тематики представляет интерес как с точки зрения биологии, для которой она предоставляет ценные результаты, так и в качестве источника более сложных задач для обработки текстов. Одной из важных задач автоматической обработки текстов является построение онтологий. Предложен метод построения онтологий промежуточного уровня по корпусу текстов на ограниченном подмножестве английского языка. Онтологии промежуточного уровня служат одним из инструментов решения задачи установления соответствия между фактами в априорных онтологиях и фрагментами текста. Предложен новый подход, основанный на расширенном определении контекстно-свободных (КС) грамматик, позволяющий порождать онтологии, обладающие указанным свойством. Показаны преимущества использования корпусов на ограниченном подмножестве естественного языка для построения таких онтологий.

Ключевые слова: КС-грамматики; построение онтологий; биомедицинские тексты.

Поступила в редакцию: 23.09.2015

DOI: 10.14357/19922264160111



Реферативные базы данных:


© МИАН, 2024