Аннотация:
Приведена усовершенствованная методика анализа и фильтрации информационного потока на основе доверительных сетей Байеса, учитывающая тематическую направленность сообщений. Предварительное определение тематики электронного сообщения позволило не только повысить эффективность работы фильтра, основанного на доверительных сетях Байеса, но и снизить ошибки первого и второго рода при принятии решения об отнесении корреспонденции к категории нежелательной рассылки. Был разработан программный продукт, реализующий предложенную методику, и проведена экспериментальная проверка валидности предлагаемого подхода. Полученные результаты свидетельствуют о том, что эффективность разработанной методики при фильтрации спама на 13 % выше, чем эффективность базового варианта. Кроме того, при использовании данного подхода уменьшается вероятность возникновения ошибок первого и второго рода — основных показателей качества спам-фильтров. Ошибка второго рода, когда легитимное сообщение было расценено как спам, оказалась в 2,8 раза меньше, чем при применении базового варианта.
Ключевые слова:доверительная сеть Байеса, спам, фильтрация информационного потока, тематика почтовых рассылок.