Аннотация:
Обнаружение вредоносного ПО является важным аспектом кибербезопасности, однако его точность часто снижается из-за дисбаланса классов и ограниченного количества размеченных данных. В данном исследовании используются генеративные состязательные сети с условными данными (Conditional Generative Adversarial Networks, cGAN) для генерации синтетических образцов вредоносного ПО, что позволяет решить эти проблемы за счёт увеличения объёма данных в классе меньшинства.
Модель cGAN генерирует реалистичные образцы вредоносного ПО, основываясь на метках классов, балансируя набор данных без изменения класса безопасных образцов. Применённый к набору данных CICMalDroid2020, увеличенный объём данных используется для обучения модели LightGBM, что приводит к повышению точности обнаружения, особенно для слабо представленных классов вредоносного ПО.
Результаты демонстрируют эффективность использования cGAN в качестве надёжного инструмента для увеличения объёма данных, что улучшает производительность и надёжность систем обнаружения вредоносного ПО на основе машинного обучения.
Ключевые слова и фразы:
обнаружение вредоносного ПО, генеративные состязательные сети, машинное обучение, кибербезопасность, увеличение объёма данных.
УДК:
519.683.1: 681.513.7 ББК:
32.813.5+32.973.1
Поступила в редакцию: 05.12.2024 Подписана в печать : 07.12.2024