RUS  ENG
Полная версия
ЖУРНАЛЫ // Компьютерные исследования и моделирование // Архив

Компьютерные исследования и моделирование, 2024, том 16, выпуск 7, страницы 1621–1636 (Mi crm1238)

СПЕЦИАЛЬНЫЙ ВЫПУСК

Особенности применения физически информированных нейронных сетей для решения обыкновенных дифференциальных уравнений

И. В. Конюховabc, В. М. Конюховd, А. А. Черницаa, А. Дюсеноваa

a Университет Иннополис, Россия, 420500, г. Иннополис, ул. Университетская, д. 1
b КазО МСЦ РАН – филиал ФГУ ФНЦ НИИСИ РАН, Россия, 420111, г. Казань, ул. Лобачевского, д. 2, корп. 31
c Национальный исследовательский центр «Курчатовский институт», Россия, 123098, г. Москва, пл. Академика Курчатова, д. 1
d ФГАОУ ВО «Казанский (Приволжский) федеральный университет», Россия, 420008, г. Казань, ул. Кремлевская, д. 18, корп. 1

Аннотация: Рассматривается применение физически информированных нейронных сетей с использованием многослойных персептронов для решения задач Коши, в которых правые части уравнения являются непрерывными монотонно возрастающими, убывающими или осциллирующими функциями. С помощью вычислительных экспериментов изучено влияние метода построения приближенного нейросетевого решения, структуры нейронной сети, алгоритмов оптимизации и средств программной реализации на процесс обучения и точность полученного решения. Выполнен анализ эффективности работы наиболее часто используемых библиотек машинного обучения при разработке программ на языках программирования Python и C#. Показано, что применение языка C# позволяет сократить время обучения нейросетей на 20–40%. Выбор различных функций активации влияет на процесс обучения и точность приближенного решения. Наиболее эффективными в рассматриваемых задачах являются сигмоида и гиперболический тангенс. Минимум функции потерь достигается при определенном количестве нейронов скрытого слоя однослойной нейронной сети за фиксированное время обучения нейросетевой модели, причем усложнение структуры сети за счет увеличения числа нейронов не приводит к улучшению результатов обучения. При этом величина шага сетки между точками обучающей выборки, обеспечивающей минимум функции потерь, в рассмотренных задачах Коши практически одинакова. Кроме того, при обучении однослойных нейронных сетей наиболее эффективными для решения задач оптимизации являются метод Adam и его модификации. Дополнительно рассмотрено применение двух- и трех-слойных нейронных сетей. Показано, что в этих случаях целесообразно использовать алгоритм LBFGS, который по сравнению с методом Adam в ряде случаев требует на порядок меньшего времени обучения при достижении одинакового порядка точности. Исследованы также особенности обучения нейронной сети в задачах Коши, в которых решение является осциллирующей функцией с монотонно убывающей амплитудой. Для них необходимо строить нейросетевое решение не с постоянными, а с переменными весовыми коэффициентами, что обеспечивает преимущество такого подхода при обучении в тех узлах, которые расположены вблизи конечной точки интервала решения задачи.

Ключевые слова: обыкновенные дифференциальные уравнения, машинное обучение, физически информированные нейронные сети, численные методы

УДК: 519.622

Поступила в редакцию: 22.10.2024
Исправленный вариант: 12.11.2024
Принята в печать: 25.11.2024

DOI: 10.20537/2076-7633-2024-16-7-1621-1636



© МИАН, 2025