RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2015, том 9, выпуск 2, страницы 92–110 (Mi ia373)

Эта публикация цитируется в 4 статьях

Ассоциативные портреты предметной области — инструмент автоматизированного построения систем big data для извлечения знаний: теория, методика, визуализация, возможное применение

И. В. Галина, Е. Б. Козеренко, Ю. И. Морозова, Н. В. Сомин, М. М. Шарнин

Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук

Аннотация: Представлена методика создания систем извлечения знаний, основанная на подходе, главным инструментом которого является автоматизированное формирование ассоциативного портрета предметной области (АППО) и построение семантического контекстного пространства (СКП). Идеология АППО базируется на дистрибутивной гипотезе, утверждающей, что семантически близкие (или связанные) лексемы имеют похожий контекст и, наоборот, при похожем контексте лексемы семантически близки. В применяемой модели используется расширенная гипотеза, включающая исследование сходства и различия в контекстах не только отдельных лексем, но и произвольных многолексемных фрагментов — значимых словосочетаний (ЗС). Приведены примеры реализованных проектов для различных предметных областей (ПО).

Ключевые слова: семантическое моделирование; ассоциативные связи; математическая статистика; дистрибутивная семантика; big data; автоматизированные системы извлечения знаний; электронные корпуса ЕЯ-текстов; семантический поиск; интеллектуальные интернет-технологии.

Поступила в редакцию: 21.04.2015

DOI: 10.14357/19922264150211



Реферативные базы данных:


© МИАН, 2024