RUS  ENG
Полная версия
ЖУРНАЛЫ // Известия Саратовского университета. Новая серия. Серия: Математика. Механика. Информатика // Архив

Изв. Сарат. ун-та. Нов. сер. Сер.: Математика. Механика. Информатика, 2023, том 23, выпуск 1, страницы 113–125 (Mi isu972)

Научный отдел
Информатика

Метод автоматического поиска структуры и параметров нейронных сетей для решения задач обработки информации

А. Д. Обухов

Тамбовский государственный технический университет, Россия, 392000, г. Тамбов, ул. Советская, д. 106

Аннотация: Нейронные сети активно применяются при решении различных прикладных задач анализа, обработки и генерации данных. При их использовании одним из сложных этапов является подбор структуры и параметров нейронных сетей (количество и типы слоев нейронов, функции активации, оптимизаторы и т. д.), обеспечивающих наибольшую точность и, следовательно, успешность решения поставленной задачи. В настоящее время данный вопрос решается путем аналитического подбора архитектуры нейронной сети исследователем или разработчиком программного обеспечения. Существующие автоматические инструменты (AutoKeras, AutoGAN, AutoSklearn, DEvol и др.) недостаточно универсальны и функциональны. Поэтому в рамках данной работы рассматривается метод автоматического поиска структуры и параметров нейронных сетей различного типа (многослойных плотных, сверточных, генеративно-состязательных, автоэнкодеров и др.) для решения широкого класса задач. Представлена формализация метода и его основные этапы. Рассмотрена апробация метода, доказывающая его эффективность относительно аналитического решения при подборе архитектуры нейронной сети. Проведено сравнение метода с существующими аналогами, выявлено его преимущество по точности сформированных нейронных сетей и времени поиска решения. Результаты исследования могут использоваться при решении большого класса задач обработки данных, для которых требуется автоматизировать подбор структуры и параметров нейронной сети.

Ключевые слова: нейронные сети, машинное обучение, оптимизация структуры нейронных сетей, анализ и обработка данных, сверточные нейронные сети, автоэнкодеры, генеративно-состязательные сети.

УДК: 004.89

Поступила в редакцию: 26.07.2021
Принята в печать: 12.09.2022

DOI: 10.18500/1816-9791-2023-23-1-113-125



© МИАН, 2024