RUS  ENG
Полная версия
ЖУРНАЛЫ // Компьютерные исследования и моделирование // Архив

Компьютерные исследования и моделирование, 2024, том 16, выпуск 7, страницы 1747–1763 (Mi crm1246)

СПЕЦИАЛЬНЫЙ ВЫПУСК

Tree species detection using hyperspectral and Lidar data: A novel self-supervised learning approach

[Новый подход к самообучению для обнаружения видов деревьев с использованием гиперспектральных и лидарных данных]

L. Shaheen, B. Rasheed, M. Mazzara

Innopolis University, 1 Universitetskaya st., Innopolis, 420500, Russia

Аннотация: Точное определение деревьев имеет решающее значение для экологического мониторинга, оценки биоразнообразия и управления лесными ресурсами. Традиционные методы ручного обследования трудоемки и неэффективны на больших территориях. Достижения в области дистанционного зондирования, включая лидар и гиперспектральную съемку, способствуют автоматизированному и точному обнаружению в различных областях.
Тем не менее, эти технологии обычно требуют больших объемов размеченных данных и ручной инженерии признаков, что ограничивает их масштабируемость. Данное исследование предлагает новый метод самообучения (Self-Supervised Learning, SSL) с использованием архитектуры SimCLR для улучшения классификации видов деревьев на основе неразмеченных данных. Модель SSL автоматически обнаруживает сильные признаки, объединяя спектральные данные гиперспектральной съемки со структурными данными лидара, исключая необходимость ручного вмешательства.
Мы оцениваем производительность модели SSL по сравнению с традиционными классификаторами, такими как Random Forest (RF), Support Vector Machines (SVM), а также методами обучения с учителем, используя набор данных конкурса ECODSE, который включает как размеченные, так и неразмеченные образцы видов деревьев на биологической станции Ordway-Swisher во Флориде. Метод SSL показал значительно более высокую эффективность по сравнению с традиционными методами, продемонстрировав точность 97,5% по сравнению с 95,56% для Semi-SSL и 95,03% для CNN при обучении с учителем.
Эксперименты по выборке показали, что техника SSL остается эффективной при меньшем количестве размеченных данных, и модель достигает хорошей точности даже при наличии всего 20% размеченных образцов. Этот вывод демонстрирует практическое применение SSL в условиях недостаточного объема размеченных данных, таких как мониторинг лесов в больших масштабах.

Ключевые слова: самообучение, обнаружение видов деревьев, SimCLR, гиперспектральные изображения, лидарные данные

УДК: 519.8

Поступила в редакцию: 29.10.2024
Исправленный вариант: 18.11.2024
Принята в печать: 25.11.2024

Язык публикации: английский

DOI: 10.20537/2076-7633-2024-16-7-1747-1763



© МИАН, 2025