RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2019, том 13, выпуск 4, страницы 18–26 (Mi ia623)

On comparative efficiency of classification schemes in an ensemble of data sources using average mutual information

[О сравнительной эффективности схем классификации данных на ансамбле источников с использованием средней взаимной информации]

M. M. Lange

Federal Research Center “Computer Science and Control” of the Russian Academy of Sciences, 44-2 Vavilov Str., Moscow 119333, Russian Federation

Аннотация: Исследуется точность многоклассовой классификации наборов объектов от ансамбля источников при различных схемах комплексирования данных. Предлагается новый подход к сравнению нижних границ вероятности ошибки для двух схем классификации с использованием средней взаимной информации между данными источников и множеством классов. Рассмотрена схема WMV (Weighted Majority Vote) на основе композиции решений по объектам источников и схема GDM (General Dissimilarity Measure) на основе композиции метрик на множествах объектов источников. Для исследуемых схем получены оценки усредненных значений средней взаимной информации на один источник. Доказано, что указанная характеристика схемы WMV не превосходит аналогичной характеристики схемы GDM, при этом нижняя граница вероятности ошибки в схеме WMV превосходит нижнюю границу вероятности ошибки в схеме GDM. Полученный теоретический результат подтвержден экспериментальными оценками вероятности ошибки распознавания цветных HSI изображений лиц для двух схем комплексирования данных от источников H, S и I.

Ключевые слова: многоклассовая классификация, ансамбль источников, схема комплексирования, композиция решений, композиция метрик, средняя взаимная информация, вероятность ошибки.

Поступила в редакцию: 01.07.2019

Язык публикации: английский

DOI: 10.14357/19922264190403



© МИАН, 2024