RUS  ENG
Полная версия
ЖУРНАЛЫ // Труды института системного программирования РАН // Архив

Труды ИСП РАН, 2021, том 33, выпуск 2, страницы 65–76 (Mi tisp585)

Регулярные выражения для обнаружения Web-рекламы на основе автоматического скользящего алгоритма

Д. Рианьо, Р. Пинон, Г. Молеро-Кастильо, Э. Барсенас, А. Веласкес-Мена

Национальный автономный университет Мексики

Аннотация: Представлена реализация алгоритма распознавания Web-рекламы с использованием регулярных выражений. Сегодня при разработке программного обеспечения важную роль играет использование регулярных выражений, оптического распознавания символов, баз данных и автоматизированного тестирования. Тесты проводились в трех веб-браузерах. Результатом явилось выявление рекламы на испанском языке, которая отвлекает внимание пользователей, а прежде всего, позволяет получать информацию о них. Основная особенность алгоритма заключается в том, что его автоматическое и настраиваемое выполнение не требует доступа к коду рассматриваемой страницы, и будущем может появиться приложение, работающее в фоновом режиме. Кроме того, при поддержке оптического распознавания символов мы получаем приемлемую эффективность при выявлении рекламы.

Ключевые слова: цифровой маркетинг, оптическое распознавание символов, регулярные выражения, интернет-реклама.

DOI: 10.15514/ISPRAS-2021-33(2)-3



© МИАН, 2024