Аннотация:
В настоящей работе рассмотрено применение методов компьютерного зрения и рекуррентных нейронных сетей для решения задачи выявления и классификации действий на видео.
В статье приводится описание подхода, применённого авторами для анализа видеофайлов.
Рекуррентные нейронные сети выступают в качестве классификатора.
На вход классификатору передаются мешки слов, которые являются гистограммами низкоуровневых действий.
Гистограммы представляют собой наборы дескрипторов кадров видеофайлов.
Для поиска дескрипторов на изображениях используются алгоритмы SIFT, ORB, BRISK, AKAZE.
Ключевые слова и фразы:компьютерное зрение, дескрипторы, мешки слов глубинное обучение, рекуррентные нейронные сети, сети долгой краткосрочной памяти, анализ видео.
Поступила в редакцию: 04.12.2017 Подписана в печать : 28.12.2017