RUS  ENG
Полная версия
ЖУРНАЛЫ // Программные системы: теория и приложения // Архив

Программные системы: теория и приложения, 2024, том 15, выпуск 4, страницы 79–96 (Mi ps457)

Искусственный интеллект и машинное обучение

Нейросетевая классификация видеороликов по малому числу кадров

А. В. Смирновa, Д. Д. Парфеновb, И. П. Тищенкоa

a Институт программных систем им. А. К. Айламазяна РАН, Веськово, Россия
b ГУМРФ имени адмирала С.О. Макарова, Санкт-Петербург, Россия

Аннотация: В статье предложен метод нейросетевой классификации коротких видеороликов. Задача классификации рассматривается с точки зрения уменьшения числа требуемых операций для категоризации видеороликов. Предлагаемое решение заключается в использовании небольшого числа кадров (не более 10) для выполнения классификации при помощи самой лёгкой нейросетевой архитектуры семейства моделей ResNet. В ходе исследования создан собственный набор данных для обучения, состоящий из трёх классов: «animals», «cars» и «people». В результате получена точность классификации, равная 79%, а также сформирована база данных классифицируемых видеороликов и разработано приложение с элементами GUI для взаимодействия с классификатором и просмотра результатов.

Ключевые слова и фразы: Классификация видео, набор данных, нейронные сети, графический интерфейс пользователя.

УДК: 004.93'11
ББК: 32.813.52

MSC: Primary 68T10; Secondary 68T45

Поступила в редакцию: 01.10.2024
Подписана в печать : 04.11.2024

DOI: 10.25209/2079-3316-2024-15-4-79-96



© МИАН, 2025