Аннотация:
Конфиденциальность является важным свойством безопасности при обмене данными по сети. Для её реализации используется семейство протоколов SSL/TLS, которые, однако, в полной мере не скрывают ни посещаемого сайта, ни действий пользователя. Помимо конфиденциальности приватность также играет значимую роль для пользователей сети. Для обеспечения дополнительной приватности были реализованы некоторые программные решения, такие как Tor и I2P. В качестве меры приватности соответствующих решений может использоваться их устойчивость к специализированному классу атак. Одной из атак является Website Fingerprinting, позволяющая по трафику, отправляемому и получаемому известным пользователем, определять, какие именно сайты он посещал. Website Fingerprinting — это задача классификации, где объектом является посещение пользователем веб-сайта, а классом сам веб-сайт. В данной статье исследуется атака Website Fingerprinting для HTTP/2 трафика. В работе присутствует описание и вычисление популярных признаков, используемых при классификации трафика, и оценивается их применимость к задаче Website Fingerprinting. Для реализации атаки Website Fingerprinting строится несколько классификаторов, среди которых выбирается алгоритм, дающий лучший результат на собранном наборе данных. Точность лучшего классификатора составляет 97.8% в определённых допущениях. Кроме того, в работе присутствует оценка и анализ некоторых ограничений реального мира, влияющих на точность классификации.
Ключевые слова:Website Fingerprinting, HTTP/2, машинное обучение