RUS  ENG
Полная версия
ЖУРНАЛЫ // Программные системы: теория и приложения // Архив

Программные системы: теория и приложения, 2025, том 16, выпуск 2, страницы 111–152 (Mi ps470)

Искусственный интеллект и машинное обучение

Improving the accuracy of segmentation masks using a generative-adversarial network model

[Повышение точности сегментирования объектов с использованием генеративно-состязательной сети]

I. V. Vinokurov

Financial University under the Government of the Russian Federation, Moscow, Russia

Аннотация: Маски, полученные с использованием модели глубокого обучения Mask R-CNN, в ряде случаев могут содержать фрагментированные контуры, неровные границы, ложные сращивания соседних объектов и участки с пропущенной сегментацией. Чем больше объектов детектирования на изображении и меньше их размер, тем более чаще встречаются различного вида недостатки их масок. Примерами таких изображений могут являться аэрофотоснимки коттеджных и садовых товариществ и кооперативов, характеризующихся высокой плотности застройки. Для коррекции указанных недостатков предлагается использовать модель генеративно-состязательной сети, выполняющую постобработку предсказанных Mask R-CNN масок.
Качественная оценка сформированной в работе модели продемонстрировала, что она способна на приемлемом уровне восстанавливать целостность контуров, заполняет пропущенные области и разделять ошибочно объединенные объекты. Количественный анализ по метрикам IoU, precision, recall и F1-score показал статистически значимое улучшение качества сегментации по сравнению с исходными масками Mask R-CNN. Полученные результаты подтвердили, что предложенный подход позволяет довести точность формирования масок объектов до уровня, удовлетворяющего требованиям их практического применения в системах автоматизированного анализа аэрофотоснимков.

Ключевые слова и фразы: компьютерное зрение, сегментация изображений, маски объектов, генеративно-состязательные сети, Mask R-CNN, PyTorch.

УДК: 004.932.75'1, 004.89
ББК: 32.813.5: 32.973.202-018

MSC: Primary 68T20; Secondary 68T07, 68T45

Поступила в редакцию: 21.04.2025
Подписана в печать : 11.06.2025

Язык публикации: русский и английский

DOI: 10.25209/2079-3316-2025-16-2-111-152



© МИАН, 2025