RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Санкт-Петербургского университета. Серия 10. Прикладная математика. Информатика. Процессы управления // Архив

Вестн. С.-Петербург. ун-та. Сер. 10. Прикл. матем. Информ. Проц. упр., 2024, том 20, выпуск 1, страницы 20–33 (Mi vspui607)

Информатика

Методы генерации синтетических данных для обучения нейросетей в задаче сегментации уровня азотного режима растений на снимках беспилотных летательных аппаратов на сельскохозяйственном поле

А. Е. Молинa, И. С. Блекановa, Е. П. Митрофановab, О. А. Митрофановаba

a Санкт-Петербургский государственный университет, Российская Федерация, 199034, Санкт-Петербург, Университетская наб., 7–9
b Агрофизический научно-исследовательский институт, Российская Федерация, 195220, Санкт-Петербург, Гражданский пр., 14

Аннотация: Работа посвящена автоматизации процесса построения масок изображений объектов сельского хозяйства больших размеров в задачах точного земледелия для обучения нейросетевых методов анализа обеспеченности растений полезными веществами по геопривязанным снимкам. Это направление крайне актуально, поскольку позволяет автоматизировать и заменить ручной процесс разметки данных, существенно сократив затраты ресурсов на подготовку обучающей выборки. Предложены четыре новых метода генерации синтетических данных для обучения нейросетей, направленных на сегментацию снимков беспилотных летательных аппаратов (БПЛА) по уровню обеспеченности растений азотом на сельскохозяйственном поле. В частности, описаны алгоритмы генерации синтетических данных на основе построения рядов, парабол и пятен. Поставлен эксперимент по тестированию и оценке качества приведенных алгоритмов на восьми современных методах сегментации изображений: два классических метода машинного обучения (Random Forest и XGBoost), четыре сверточных нейросетевых метода на базе архитектуры U-Net, два трансформера (TransUnet и UnetR). Эксперимент показал, что два алгоритма на основе пятен показывают наилучшую точность для обучения сверточных нейросетей и трансформеров — 98–100 %. Классические методы машинного обучения на сгенерированных синтетических данных показали очень низкие значения по всем метрикам качества — 27–44 %.

Ключевые слова: сегментация уровня азота, глубокое обучение, машинное обучение, генерация синтетических данных, снимки БПЛА, разметка данных дистанционного зондирования земли, умное сельское хозяйство.

УДК: 004.93

MSC: 93B03

Поступила: 15 ноября 2023 г.
Принята к печати: 26 декабря 2023 г.

DOI: 10.21638/11701/spbu10.2024.103



© МИАН, 2024