RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и автоматизация // Архив

Тр. СПИИРАН, 2016, выпуск 44, страницы 5–19 (Mi trspy851)

Эта публикация цитируется в 2 статьях

Алгоритмы и программные средства

Автоматическая рубрикация документов с помощью латентно-семантического анализа и алгоритма нечёткого вывода Мамдани

А. Д. Хомоненкоa, С. В. Логашевb, С. А. Красновb

a ФГБОУ ВПО Петербургский государственный университет путей сообщения Императора Александра I
b Военно-космическая академия имени А.Ф. Можайского

Аннотация: Предлагается подход к автоматической рубрикации текстовых документов на основе совместного применения метода латентно-семантического анализа (ЛСА) и алгоритма нечёткого вывода Мамдани. Метод ЛСА используется для смыслового анализа информации в системах электронного документооборота путем выявления семантических зависимостей между термами документов и получения коэффициента соответствия сравниваемых векторов.
Предлагается база правил для алгоритма нечёткого вывода Мамдани, реализующего автоматическую рубрикацию документов по множеству заданных тематик с возможностью автоматизированного контроля за распределением документов не соответствующим заданным тематикам или имеющим сходство сразу по нескольким тематическим категориям на основе результатов латентно-семантического анализа.

Ключевые слова: рубрикация документов; нечеткий вывод; латентно-семантический анализ; база правил; алгоритм нечёткого вывода Мамдани.

УДК: 004.912

DOI: 10.15622/sp.44.1



Реферативные базы данных:


© МИАН, 2024