RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2021, том 33, выпуск 5, страницы 83–104 (Mi tisp629)

Эта публикация цитируется в 2 статьях

Методика сбора обучающего набора данных для модели обнаружения компьютерных атак

А. И. Гетьманab, М. Н. Горюновc, А. Г. Мацкевичc, Д. А. Рыболовлевc

a Институт системного программирования им. В.П. Иванникова РАН
b Национальный исследовательский университет "Высшая школа экономики
c Академия ФСО России

Аннотация: В работе рассмотрены вопросы обучения моделей обнаружения компьютерных атак, основанных на применении методов машинного обучения. Последовательно представлены результаты анализа общедоступных обучающих наборов данных и инструментов анализа сетевого трафика и выделения признаков сетевых сессий. Отмечены недостатки существующих инструментов и возможные ошибки в формируемых с их помощью наборах данных. Сделан вывод о необходимости сбора собственных обучающих данных в условиях отсутствия гарантий достоверности общедоступных наборов данных и ограниченного применения предобученных моделей в сетях с характеристиками, отличными от характеристик сети, в которой производился сбор обучающего трафика. Предложен практический подход к формированию данных обучения для моделей обнаружения компьютерных атак. Произведена апробация предлагаемых решений с целью оценки качества обучения модели на собранных данных и качества обнаружения атак в условиях реальной сетевой инфраструктуры.

Ключевые слова: информационная безопасность, система обнаружения атак, машинное обучение, набор данных, перенос обучения, случайный лес, сетевой трафик, компьютерная атака.

DOI: 10.15514/ISPRAS-2021-33(5)-5



© МИАН, 2024