RUS  ENG
Полная версия
ЖУРНАЛЫ // Журнал Сибирского федерального университета. Серия «Математика и физика» // Архив

Журн. СФУ. Сер. Матем. и физ., 2016, том 9, выпуск 2, страницы 235–245 (Mi jsfu481)

Эта публикация цитируется в 2 статьях

Topic categorization based on collectives of term weighting methods for natural language call routing

[Определение темы для маршрутизации вызовов на естественном языке на основе коллективов методов взвешивания термов]

Roman B. Sergienkoa, Muhammad Shana, Wolfgang Minkera, Eugene S. Semenkinb

a Institute of Telecommunication Engineering, Ulm University, Albert-Einstein-Allee, 43, Ulm, 89081, Germany
b Informatics and Telecommunications Institute, Siberian State Aerospace University, Krasnoyarskiy Rabochiy, 31, Krasnoyarsk, 660037, Russia

Аннотация: Маршрутизация вызовов на естественном языке — актуальная задача анализа данных, которая может найти применение в различных областях, включая аэрокосмическую индустрию. В статье представлено исследование коллективов методов взвешивания термов для машрутизации вызовов на естественном языке на основе классификации текста. Основная идея предлагаемого подхода заключается в том, что коллективы методов взвешивания термов могу обеспечить повышение эффективности классификации при использовании одного и того же алгоритма классификации. Семь различных методов взвешивания термов были протестированы и сравнены между собой с использованием метода ближайших соседей в качестве алгоритма классификации. После этого были сформированы различные комбинации методов взвешивания термов для дальнейшего использования в коллективных решающих правилах. Рассмотрено два подхода для формирования коллективных решающих правил: мета-классификатор на основе индукции правил и голосование простым большинством. Численные исследования показали, что наилучший результат достигается при включении всех семи рассматриваемых методов взвешивания термов в коллективное решающее правило на основе голосования простым большинством. Такая комбинация обеспечивает статистически значимое улучшение эффективности классификации в сравнении с лучшим по эффективности отедльным методом взвешивания термов.

Ключевые слова: маршрутизация вызовов на естественном языке, классификация текста, взвешивание термов.

УДК: 004.93

Получена: 26.12.2015
Исправленный вариант: 11.01.2016
Принята: 20.02.2016

Язык публикации: английский

DOI: 10.17516/1997-1397-2016-9-2-235-245



Реферативные базы данных:


© МИАН, 2024