Аннотация:
В статье рассматриваются методы машинного обучения для обнаружения внедрения SQL-кода в сетевые журналы с помощью программы KNIME, основанные на поиске закономерностей между входящими признаками и последующем прогнозировании в задаче бинарной классификации. В отличие от существующих работ, в этой статье рассматривается эффективность пяти методов машинного обучения на основе деревьев. Представлено содержание и последовательность этапов работы. Наиболее высокие результаты показал метод "Случайный лес": точность – 97,58%; площадь под кривой ошибок (ROC-кривой) – 0,976.
Ключевые слова:
машинное обучение; программа KNIME; классификация; набор данных; отбор данных; SQL-инъекция; обнаружение угроз в сети; обнаружение подозрительных шаблонов; защита веб-приложений.