RUS  ENG
Полная версия
ЖУРНАЛЫ // Системы и средства информатики // Архив

Системы и средства информ., 2019, том 29, выпуск 1, страницы 206–217 (Mi ssi634)

Эта публикация цитируется в 1 статье

Некоторые аспекты автоматизации поиска и анализа веб-текстов экстремистской семантики

М. М. Шарнин, И. В. Галина

Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук

Аннотация: Рассматриваются вопросы автоматизации методов тематического моделирования (ТМ) для мониторинга экстремистской активности в интернете. Объект исследования — русскоязычные тексты сайтов и социальных сетей. Рассмотрены базовые элементы технологии, реализуемой как единый процесс от сбора данных до получения результата. Приведены примеры экспериментов. Технология включает автоматизированное построение авторского показателя — индекса идеологического влияния (ИИВ), рассчитываемого по неявным ссылкам между текстами. Оптимальные параметры алгоритма расчета неявных ссылок находятся автоматически по максимуму корреляции между явными и неявными ссылками.

Ключевые слова: тематическое моделирование, автоматизированные системы, экстремизм, интернет, неявные ссылки.

Поступила в редакцию: 17.10.2017

DOI: 10.14357/08696527190117



Реферативные базы данных:


© МИАН, 2024