В. И. Городецкий, О. Н. Тушканова, “Семантические технологии для семантических приложений. Часть 2. Модели сравнительной семантики текстов”, Искусственный интеллект и принятие решений, 2019, выпуск 1,страницы 49

Обработка естественного языка

Семантические технологии для семантических приложений. Часть 2. Модели сравнительной семантики текстов

В. И. Городецкий^a, О. Н. Тушканова^b

^a TRA Robotics Ltd., г. Санкт-Петербург, Россия
^b Санкт-Петербургский институт информатики и автоматизации РАН, г. Санкт-Петербург, Россия

Аннотация: В статье обсуждаются базовые аспекты современного понимания семантических вычислений, семантических технологий и приложений в области обработки больших данных, представленных текстами на естественном языке, выполняемой в интересах извлечения знаний для принятия решений. Рассмотрены базовые компоненты семантических технологий, к которым относятся онтологии и модели их использования, семантические ресурсы, которые содержат знания о семантике слов естественного языка и средства ее уточнения, а также семантическая компонента технологии, которая используется для формального описания смысла сущностей естественного языка и численной оценки их попарной семантической близости. Основное внимание уделяется моделям последней компоненты технологии, которые важны для решения задач семантической кластеризации и классификации текстов и различных их приложений. Обсуждаются и сравниваются различные типы мер семантической близости сущностей естественного языка в контексте задач семантических вычислений и анализируются проблемы, которые сдерживают практическое использование семантических технологий.

Ключевые слова: семантические технологии, семантические вычисления, семантический ресурс, семантическая связанность, семантическая близость.

DOI: 10.14357/20718594190105