RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2022, том 32, выпуск 4, страницы 14–20 (Mi ssi852)

Обнаружение дрейфа распределения

А. А. Грушоa, Н. А. Грушоa, М. И. Забежайлоa, Д. В. Смирновb, Е. Е. Тимонинаa, С. Я. Шоргинa

a Федеральный исследовательский центр «Информатика и управление» Российской академии наук
b ПАО Сбербанк России

Аннотация: Изменение свойств собираемых данных часто называют дрейфом данных (различные варианты смещения характеристик данных). Существование дрейфа в данных обучения системы искусственного интеллекта часто приводит к снижению эффективности машинного обучения (МО) и построенных на этих данных ошибочных решениях систем искусственного интеллекта (ИИ). В связи с этим проблемы выявления дрейфа в данных МО, момента образования дрейфа и последствий изменений данных обучения становятся актуальными. Предложен метод выявления дрейфа вероятностного распределения в произвольном метрическом пространстве большой размерности. Метод опирается на различие неизвестных вероятностных распределений в разных областях исходного пространства в случае наличия дрейфа. Рассмотрена модель дрейфа, состоящая из двух отличных друг от друга распределений вероятностей. Использование в основе метода шаров в метрическом пространстве позволяет создать эффективный алгоритм вычисления принадлежности точек данных одному из шаров, связанных с различными распределениями модели дрейфа. Это обстоятельство представляется существенным для выявления дрейфа распределения в пространстве большой размерности.

Ключевые слова: дрейф распределения, математическая статистика, эффективно вычисляемый алгоритм.

Поступила в редакцию: 14.09.2022

DOI: 10.14357/08696527220402



© МИАН, 2024