Аннотация:
Обработка информации в настоящее время является одной из наиболее актуальных задач. С ростом и развитием информационных и телекоммуникационных технологий выросли и объемы передаваемой информации по сети Интернет. Одновременно с обработкой информации встает вопрос ее защиты.
Предложен подход к построению распределенной вычислительной системы, осуществляющей обработку снимков сетевого трафика за приемлемое время и обеспечивающей близкий к линейному рост производительности при наращивании вычислительных мощностей.
Ключевые слова:анализ сетевого трафика, большие данные, MapReduce, Hadoop.