RUS  ENG
Полная версия
СЕМИНАРЫ

Семинар отдела математического программирования
20 мая 2016 г. 11:00, г. Екатеринбург, Институт математики и механики им. Н. Н. Красовского УрО РАН, ул. Софьи Ковалевской 16, актовый зал


Алгоритмы интеллектуального анализа данных на основе категориальных векторов

Дмитрий Бондарчук

Уральский государственный университет путей сообщения, г. Екатеринбург

Аннотация: В последнее время интеллектуальный анализ текстовых данных получил широкое распространение в связи потребностью многих отраслей экономики и науки в получении и автоматической категоризации больших объемов таких данных. Одним из самых перспективных подходов к решению задач такого типа являются подходы, основанные на машинном обучении. В большинстве случаев методы и алгоритмы интеллектуального анализа данных работают с простым набором слов, которые никак не связаны друг с другом, чаще всего учитывается только их взаимосвязь с документами, характеризующуюся частотой их встречаемости в коллекции или корпусе. В докладе предлагается алгоритм интеллектуального анализа данных, который на любой запрос пользователя, независимо от размера и равномерности обучающей выборки дает пользователю непустой ответ, отсортированный по степени релевантности запросу пользователя. Кроме того, предлагается способ решения проблемы лексической неоднозначности с помощью "перевзвешивания" термов с помощью мер семантической близости.


© МИАН, 2024