Аннотация:
В статье обсуждаются базовые аспекты современного понимания семантических вычислений, семантических технологий и приложений в области обработки больших данных, представленных текстами на естественном языке, выполняемой в интересах извлечения знаний для принятия решений. Рассмотрены базовые компоненты семантических технологий, к которым относятся онтологии и модели их использования, семантические ресурсы, которые содержат знания о семантике слов естественного языка и средства ее уточнения, а также семантическая компонента технологии, которая используется для формального описания смысла сущностей естественного языка и численной оценки их попарной семантической близости. Основное внимание уделяется моделям последней компоненты технологии, которые важны для решения задач семантической кластеризации и классификации текстов и различных их приложений. Обсуждаются и сравниваются различные типы мер семантической близости сущностей естественного языка в контексте задач семантических вычислений и анализируются проблемы, которые сдерживают практическое использование семантических технологий.