RUS  ENG
Полная версия
ЖУРНАЛЫ // Информационные технологии и вычислительные системы // Архив

ИТиВС, 2018, выпуск 2, страницы 60–69 (Mi itvs303)

РАСПОЗНАВАНИЕ ОБРАЗОВ

Об энтропийных критериях отбора признаков в задачах анализа данных

Ю. А. Дубнов

Федеральное государственное учреждение "Федеральный исследовательский центр "Информатика и управление" Российской академии наук", г. Москва, Россия

Аннотация: В работе рассматривается задача понижения размерности пространства признаков для описания объектов в задачах анализа данных на примере бинарной классификации. В статье приводится обзор существующих подходов к решению данной задачи и предлагается несколько модификаций, в которых понижение размерности рассматривается как задача извлечения наиболее релевантной информации из признакового описания объектов и решается в терминах Шеноновской энтропии. Для выявления наиболее значимых признаков используются такие информационные критерии, как условная энтропия (conditional entropy), взаимная информация (mutual information) и расстояние Кульбака-Ляйблера (Kullback-Leibler divergence).

Ключевые слова: понижение размерности, отбор признаков, классификация, энтропия.

DOI: 10.14357/20718632180205



Реферативные базы данных:


© МИАН, 2024