RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2013, том 7, выпуск 2, страницы 92–99 (Mi ia265)

Эта публикация цитируется в 3 статьях

Статистические механизмы формирования ассоциативных портретов предметных областей на основе естественно-языковых текстов больших объемов для систем извлечения знаний

М. М. Шарнин, Н. В. Сомин, И. П. Кузнецов, Ю. И. Морозова, И. В. Галина, Е. Б. Козеренко

Институт проблем информатики Российской академии наук

Аннотация: Ассоциативные связи между терминами, понятиями и другими элементами естественного языка (ЕЯ) играют важную роль в решении широкого класса прикладных задач, среди которых интеллектуальная обработка текстов, извлечение знаний, их обработка с формированием баз знаний и организация различных видов поиска, в том числе семантических. Предложены методы автоматизированного выявления ассоциативных связей в текстах из Интернета и построения ассоциативных портретов различных предметных областей, ориентированных на решение перечисленных задач. Ассоциативный портрет предметной области (АППО) представляет собой словарь значимых терминов и словосочетаний, элементы которого связаны ассоциативными связями. Ассоциативный портрет предметной области создается автоматически на базе статистического анализа больших объемов текстов. Теоретическая значимость предлагаемого подхода заключается в использовании методов статистики, корпусной лингвистики и дистрибутивной семантики для обработки больших текстовых массивов на ЕЯ (постоянно пополняемых и обновляемых в Интернете) с целью построения модели предметной области в виде АППО.

Ключевые слова: автоматическая обработка корпусов текстов; статистические методы; интеллектуальные интернет-технологии; лексико-семантический анализ; извлечение знаний из текстов; семантический поиск; семантические векторы; семантическое контекстное пространство.



© МИАН, 2024