RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2021, том 15, выпуск 4, страницы 79–86 (Mi ia760)

Эта публикация цитируется в 4 статьях

Статистика и кластеры в поисках аномальных вкраплений в условиях больших данных

А. А. Грушоa, Н. А. Грушоa, М. И. Забежайлоa, Д. В. Смирновb, Е. Е. Тимонинаa, С. Я. Шоргинa

a Федеральный исследовательский центр «Информатика и управление» Российской академии наук
b ПАО Сбербанк России

Аннотация: Построены алгоритмы снижения уровня «ложных тревог» (ЛТ) при поиске аномалий в сложных гетерогенных последовательностях объектов (Big Data). Традиционно в математической статистике такое снижение достигается за счет минимизации ошибки ЛТ. Однако в задачах выявления аномалий (редкие вкрапления аномальных данных) такой подход ведет к повышению вероятности потери искомых аномалий. Чтобы не потерять искомые аномалии, в данной работе предлагается, наоборот, в критериях, рассчитанных на наименьшую сложность вычислений, допустить большую ошибку появления ЛТ, но использовать тот факт, что выделенных такими критериями объектов значительно меньше, чем исходных объектов в Big Data. Тогда выделенные объекты можно объединить в один кластер и использовать дополнительную информацию, связанную с объектами этого кластера, для выявления искомых аномалий. Смысл этих действий состоит в том, что более сложно вычислимые характеристики объектов для отсева ЛТ не потребуют больших вычислительных ресурсов на меньшем относительно исходных данных кластере объектов. Показано, что при выполнении некоторых условий порядок использования дополнительной информации не влияет на результат ее использования при фильтрации ЛТ. Результаты применения алгоритма фильтрации в последовательности объектов обобщены на фильтрацию ЛТ в форме причинно-следственных схем в исходных данных. При известных схемах показано, как можно фильтровать ЛТ, выявляя только фрагменты схем.

Ключевые слова: информационная безопасность, поиск аномалий, алгоритмы фильтрации «ложных тревог».

Поступила в редакцию: 17.09.2021

DOI: 10.14357/19922264210411



© МИАН, 2024