RUS  ENG
Полная версия
ЖУРНАЛЫ // Искусственный интеллект и принятие решений // Архив

Искусственный интеллект и принятие решений, 2023, выпуск 3, страницы 98–108 (Mi iipr41)

Анализ сигналов, аудио и видео информации

Метод обработки фото- и видеоданных с фотоловушек с использованием двухстадийного нейросетевого подхода

В. А. Ефремов, А. В. Леус, Д. А. Гаврилов, Д. И. Мангазеев, И. В. Холодняк, А. С. Радыш, В. А. Зуев, Н. А. Водичев

Московский физико-технический институт (национальный исследовательский университет), Долгопрудный, Московская область, Россия

Аннотация: В работе предложена технология анализа данных с фотоловушек с помощью двухстадийной нейросетевой обработки. Задача первого этапа состоит в отделении пустых изображений от непустых. Для решения задачи проведен сравнительный анализ архитектур YOLOv5, YOLOR, YOLOX и выявлена наиболее оптимальная модель детектора. Задача второго этапа заключается в классификации объектов, найденных детектором. Сравнивались модели EfficientNetV2, SeResNet, ResNeSt, ReXNet, ResNet. Для обучения модели детектора и классификатора разработан подход подготовки данных, заключающийся в удалении изображений-дубликатов из выборки. Метод был модифицирован с помощью агломеративной кластеризации для разделения выборки на обучение, валидацию и тест. В задаче обнаружения объектов лучшим на наборе данных оказался алгоритм YOLOv5-L6 с точностью нахождения 98,5%. В задаче классификации найденных объектов, лучше всех себя показала архитектура ResNeSt-101 с качеством распознавания 98,339% на тестовых данных.

Ключевые слова: изображения с фотоловушек, агломеративная кластеризация, глубокие сверточные нейронные сети, детекция, классификация, двухстадийный подход.

DOI: 10.14357/20718594230310



Реферативные базы данных:


© МИАН, 2024