Аннотация:
Предлагается непараметрический алгоритм автоматической классификации статистических данных большого объема. Эта задача возникает при обработке данных дистанционного зондирования природных объектов. Рассматриваемый алгоритм предполагает сжатие исходной информации на основе декомпозиции многомерного пространства признаков. В результате статистическая выборка большого объема преобразуется в массив данных, составленный из центров многомерных интервалов дискретизации и соответствующих им частот принадлежности случайных величин. Полученная информация используется при синтезе регрессионной оценки плотности вероятности. Под классом понимается компактная группа наблюдений случайной величины, соответствующая одномодальному фрагменту плотности вероятности. На этой основе разрабатывается непараметрический алгоритм автоматической классификации, который основан на последовательной процедуре проверки близости центров многомерных интервалов дискретизации и соотношений между частотами принадлежности случайных величин из исходной выборки этим интервалам. Для повышения вычислительной эффективности предлагаемого алгоритма автоматической классификации используется многопоточный метод его программной реализации. Практическая значимость разработанного алгоритма автоматической классификации подтверждается результатами его применения при оценивании состояния лесных массивов по данным дистанционного зондирования.
Ключевые слова:автоматическая классификация, выборки большого объема, дискретизация области значений случайных величин, регрессионная оценка плотности вероятности, данные дистанционного зондирования.