RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2016, том 28, выпуск 6, страницы 197–206 (Mi tisp94)

Joining dictionaries and word embeddings for ontology induction

[Применение словарей и векторов слов для автоматического построения лексической онтологии]

D. A. Ustalov

Krasovskii Institute of Mathematics and Mechanics

Аннотация: В статье представлен подход к автоматическому построению лексической онтологии путём извлечения и связывания структурированных данных, направленный на повторное использование материалов существующих лексических ресурсов неизвестного качества. Подход состоит из двух этапов. На первом этапе производится построение и кластеризация графа синонимов с целью вывода отдельных значений слов и их объединения в синонимические ряды, именуемые синсетами или понятиями. На втором этапе производится формирование родо-видовых отношений между понятиями путём сопоставления родо-видовых пар слов. С целью расширения множества доступных родо-видовых пар слов выполняется преобразование векторных представлений гипонимов в векторные представления гиперонимов при помощи проекционной матрицы. Проведены предварительные эксперименты с использованием тезауруса русского языка в качестве золотого стандарта. Проанализированы преимущества и недостатки предложенного подхода.

Ключевые слова: автоматическое построение онтологии, лексический ресурс, синоним, векторное представление слова в пространстве низкой размерности, кластеризация графа, подбор проекционной матрицы.

Язык публикации: английский

DOI: 10.15514/ISPRAS-2016-28(6)-14



Реферативные базы данных:


© МИАН, 2024