RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник НГУ. Серия: Информационные технологии // Архив

Вестник НГУ. Серия: Информационные технологии, 2017, том 15, выпуск 1, страницы 79–88 (Mi jit24)

Эта публикация цитируется в 1 статье

О подходе к тематической классификации документов

А. М. Федотовa, О. В. Прозоровb, О. А. Федотоваc, А. А. Бапановd

a Институт вычислительных технологий СО РАН, пр. Академика Лаврентьева, 6, Новосибирск, 630090, Россия
b Новосибирский государственный университет, ул. Пирогова, 2, Новосибирск, 630090, Россия
c Государственная научно-техническая библиотека СО РАН, ул. Восход, 15, Новосибирск, 630090, Россия
d Евразийский национальный университет им. Л. Н. Гумилева, ул. Сатпаева 2, Астана, 010000, Республика Казахстан

Аннотация: Работа посвящена анализу подходов и алгоритмов классификации текстовых документов. Рассматривается подход к тематической классификации документов. Для этого используется специально построенная мера близости документов, учитывающая специфику предметной области. Значения весовых коэффициентов в формуле для вычисления меры близости определяются предполагаемой априорной достоверностью данных соответствующей шкалы.

Ключевые слова: документ, координатное индексирование, мера близости, номинальная шкала.

УДК: 004.91



Реферативные базы данных:


© МИАН, 2024