Аннотация:
Рассматривается задача выявления статистических аномалий (т. е. существенных превышений от типичных значений полученного и исходящего трафика) нагрузки на узлы сетевой вычислительной инфраструктуры. Рост нагрузки в реальных системах ведет к необходимости регулярного масштабирования вычислительных ресурсов и хранилищ, а также перенаправления потоков данных. Предложена процедура выявления статистических аномалий в сетевом трафике с использованием аппроксимации наблюдений обобщенным гамма-распределением для дальнейшей кластеризации объектов сетевой вычислительной инфраструктуры с {целью} оценки потребности в ресурсах. Все вычислительные статистические процедуры, описанные в {статье}, реализованы с использованием языка программирования R и применены к сетевому трафику, полученному в рамках моделирования на специализированном архитектурно-программном стенде. Предложенные подходы могут быть использованы и для более широкого класса телекоммуникационных задач.