RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2016, том 10, выпуск 3, страницы 32–40 (Mi ia429)

Эта публикация цитируется в 3 статьях

Критерии значимости отбора признаков классификации

М. П. Кривенко

Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук

Аннотация: Рассмотрена задача отбора признаков классификации и вопросы оценивания качества получаемых решений. Среди различных методов отбора признаков внимание обращено на последовательные процедуры; мерой качества классификации выбрана вероятность правильной классификации. Для оценивания этой характеристики предложено использовать метод перепроверки и бутстреп-метод, а для исследования ряда выборочных значений — сравнительный анализ доверительных интервалов и критерии однородности биномиальных пропорций. При построении байесовского классификатора для данных применялась модель смеси нормальных распределений; ее параметры оценивались с помощью EM (expectation–maximization) алгоритма. В качестве эксперимента рассмотрена задача обоснованного выбора признаков классификации при прогнозировании типа мочевых камней в урологии. Показано, что сокращать совокупность анализируемых показателей можно не только без потери качества принимаемых решений, но и с повышением вероятности правильного прогноза типа камня.

Ключевые слова: селекция признаков; последовательная селекция вперед и назад; байесовская классификация данных; проверка однородности двоичных последовательностей; прогноз типа камня в урологии.

Поступила в редакцию: 14.06.2016

DOI: 10.14357/19922264160305



Реферативные базы данных:


© МИАН, 2024