А. И. Гетьман, М. К. Иконникова, “Идентификация прозрачных, сжатых и шифрованных данных в сетевом трафике”, Труды ИСП РАН, 2021, том 33, выпуск 4,страницы 31

Идентификация прозрачных, сжатых и шифрованных данных в сетевом трафике

А. И. Гетьман^ab, М. К. Иконникова^b

^a Национальный исследовательский университет «Высшая школа экономики»
^b Институт системного программирования им. В.П. Иванникова РАН

Аннотация: В статье рассматривается задача классификации сетевого трафика на три типа, в зависимости от представления данных в нём: прозрачный, сжатый и шифрованный. Описываются существующие методы классификации, служащие для разделения трафика на прозрачный и непрозрачный, сжатый и шифрованный применительно к сетевым данным и документам. На основе них выбираются методы, показавшие лучшие результаты, и производится отбор лучшей их комбинации и вывод единого результата с применением методов машинного обучения (случайный лес). Также исследуется вопрос классификации потоков как единого целого и предлагается новый, отличный от существующих способ. Завершается статья анализом направлений для дальнейших исследований.

Ключевые слова: анализ сетевого трафика, классификация сетевого трафика, машинное обучение, шифрованный трафик.

DOI: 10.15514/ISPRAS-2021-33(4)-3