Статистические механизмы формирования ассоциативных портретов предметных областей на основе естественно-языковых текстов больших объемов для систем извлечения знаний
Аннотация:
Ассоциативные связи между терминами, понятиями и другими элементами естественного языка (ЕЯ) играют важную роль в решении широкого класса прикладных задач, среди которых интеллектуальная обработка текстов, извлечение знаний, их обработка с формированием баз знаний и организация различных видов поиска, в том числе семантических. Предложены методы автоматизированного выявления ассоциативных связей в текстах из Интернета и построения ассоциативных портретов различных предметных областей, ориентированных на решение перечисленных задач. Ассоциативный портрет предметной области (АППО) представляет собой словарь значимых терминов и словосочетаний, элементы которого связаны ассоциативными связями. Ассоциативный портрет предметной области создается автоматически на базе статистического анализа больших объемов текстов. Теоретическая значимость предлагаемого подхода заключается в использовании методов статистики, корпусной лингвистики и дистрибутивной семантики для обработки больших текстовых массивов на ЕЯ (постоянно пополняемых и обновляемых в Интернете) с целью построения модели предметной области в виде АППО.