А. И. Гетьман, М. Н. Горюнов, А. Г. Мацкевич, Д. А. Рыболовлев, “Методика сбора обучающего набора данных для модели обнаружения компьютерных атак”, Труды ИСП РАН, 2021, том 33, выпуск 5,страницы 83

Эта публикация цитируется в 3 статьях

Методика сбора обучающего набора данных для модели обнаружения компьютерных атак

А. И. Гетьман^ab, М. Н. Горюнов^c, А. Г. Мацкевич^c, Д. А. Рыболовлев^c

^a Институт системного программирования им. В.П. Иванникова РАН
^b Национальный исследовательский университет "Высшая школа экономики
^c Академия ФСО России

Аннотация: В работе рассмотрены вопросы обучения моделей обнаружения компьютерных атак, основанных на применении методов машинного обучения. Последовательно представлены результаты анализа общедоступных обучающих наборов данных и инструментов анализа сетевого трафика и выделения признаков сетевых сессий. Отмечены недостатки существующих инструментов и возможные ошибки в формируемых с их помощью наборах данных. Сделан вывод о необходимости сбора собственных обучающих данных в условиях отсутствия гарантий достоверности общедоступных наборов данных и ограниченного применения предобученных моделей в сетях с характеристиками, отличными от характеристик сети, в которой производился сбор обучающего трафика. Предложен практический подход к формированию данных обучения для моделей обнаружения компьютерных атак. Произведена апробация предлагаемых решений с целью оценки качества обучения модели на собранных данных и качества обнаружения атак в условиях реальной сетевой инфраструктуры.

Ключевые слова: информационная безопасность, система обнаружения атак, машинное обучение, набор данных, перенос обучения, случайный лес, сетевой трафик, компьютерная атака.

DOI: 10.15514/ISPRAS-2021-33(5)-5