RUS  ENG
Полная версия
ЖУРНАЛЫ // Искусственный интеллект и принятие решений // Архив

Искусственный интеллект и принятие решений, 2021, выпуск 4, страницы 62–74 (Mi iipr119)

Анализ сигналов, аудио и видео информации

Основные подходы к подготовке визуальных данных для обучения нейросетевых алгоритмов

А. Г. Лапушкинa, Д. А. Гавриловab, Н. Н. Щелкуновa, Р. Н. Бакеевc

a Московский физико-технический институт (государственный университет), г. Долгопрудный, Россия
b Институт точной механики и вычислительной техники имени С. А. Лебедева РАН, г. Москва, Россия
c Фонд перспективных исследований, г. Москва, Россия

Аннотация: Проведен анализ основных подходов, которые используют разработчики нейросетевых алгоритмов для подготовки обучающих данных и формирования обучающих выборок. Рассмотрены возможные способы получения размеченных изображений. В качестве примеров открытых библиотек размеченных изображений показаны ImageNet или Coco, предлагающие размеченные и аннотированные фотоизображения, а также библиотеки наборов трехмерных данных. Исследованы специализированные редакторы разметки изображений для работы с нестандартными и неполно представленными в общедоступных библиотеках объектами, позволяющие размечать данные как вручную, так и в полуавтоматическом режиме. Рассмотрены генераторы синтетических данных и симуляторы, позволяющие имитировать трудновоспроизводимые события, а также комбинированный подход с использованием сетей типа GAN. Выполнен анализ основных сложностей, возникающих у разработчиков при подготовке обучающих данных, в том числе проанализированы недостатки готовых наборов данных, синтетических генераторов и подхода, использующего сети типа GAN.

Ключевые слова: нейронные сети, обучающие выборки, визуальные данные, разметка, симулятор.

DOI: 10.14357/20718594210406


 Англоязычная версия: , 2022, 49:6, 463–471

Реферативные базы данных:


© МИАН, 2024