RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Южно-Уральского государственного университета. Серия «Вычислительная математика и информатика» // Архив

Вестн. ЮУрГУ. Сер. Выч. матем. информ., 2017, том 6, выпуск 2, страницы 69–83 (Mi vyurv166)

Информатика, вычислительная техника и управление

Комплекс программ автоматического построения семантической сети слов

Д. А. Усталовab, А. В. Созыкинab

a Институт математики и механики им. Н.Н. Красовского Уральского отделения Российской академии наук (620990 Екатеринбург, ул. Софьи Ковалевской, д. 16)
b Уральский федеральный университет имени первого Президента России Б.Н. Ельцина (620002 Екатеринбург, ул. Мира, д. 19)

Аннотация: Семантическая сеть слов – это ориентированный граф, вершины которого – лексические значения слов, а ребра – отношения между ними. В статье представлен комплекс программ SWN, предназначенный для построения семантической сети слов в автоматическом режиме путем структурирования неразмеченных словарей синонимов и словарей родо-видовых отношений с использованием векторных представлений слов, полученных на основе обработки корпуса неструктурированных текстов на естественном языке. Комплекс программ включает в себя реализацию методов обнаружения групп синонимов и построения отношений между отдельными значениями слов, основанных на обучении без учителя, а также модуля расширения отношений, основанного на обучении с учителем. Приведена модель предметной области с использованием формализма VOWL. Архитектура комплекса программ представлена в формализме UML и включает модуль обнаружения понятий, модуль построения семантических отношений между значениями слов,модуль расширения семантических отношений, модуль преобразования результатов работы в форматы Семантической паутины, и модуль построения оценочного набора данных при помощи краудсорсинга. Представленный комплекс программ является программным обеспечением с открытым исходным кодом и доступен для интеграции в различные системы интеллектуального анализа данных.

Ключевые слова: семантическая сеть, лексическая семантика, программная инженерия, свободное программное обеспечение, Семантическая паутина, VOWL, UML.

УДК: 004.853

Поступила в редакцию: 01.05.2017

DOI: 10.14529/cmse170205



Реферативные базы данных:


© МИАН, 2024