Аннотация:
Рассматриваются вопросы автоматизации методов тематического моделирования (ТМ) для мониторинга экстремистской активности в интернете. Объект исследования — русскоязычные тексты сайтов и социальных сетей. Рассмотрены базовые элементы технологии, реализуемой как единый процесс от сбора данных до получения результата. Приведены примеры экспериментов. Технология включает автоматизированное построение авторского показателя — индекса идеологического влияния (ИИВ), рассчитываемого по неявным ссылкам между текстами. Оптимальные параметры алгоритма расчета неявных ссылок находятся автоматически по максимуму корреляции между явными и неявными ссылками.
Ключевые слова:тематическое моделирование, автоматизированные системы, экстремизм, интернет, неявные ссылки.