RUS  ENG
Полная версия
ЖУРНАЛЫ // Информатика и её применения // Архив

Информ. и её примен., 2020, том 14, выпуск 1, страницы 10–16 (Mi ia639)

Эта публикация цитируется в 2 статьях

Анализ конфигураций LSTM-сетей для построения среднесрочных векторных прогнозов

А. К. Горшенинab, В. Ю. Кузьминc

a Институт проблем информатики Федерального исследовательского центра «Информатика и управление» Российской академии наук
b Факультет вычислительной математики и кибернетики Московского государственного университета имени М. В. Ломоносова
c ООО "Вай2Гео"

Аннотация: Проанализированы 36 конфигураций архитектур LSTM-сетей (Long Short-Term Memory, долгая краткосрочная память) для построения прогнозов длительностью до 70 шагов по данным, размер которых составляет 300–500 элементов. Для вероятностной аппроксимации наблюдений применена модель на основе конечных смесей нормальных распределений, поэтому в качестве исходных данных для прогнозирования использованы математическое ожидание, дисперсия, коэффициенты асимметрии и эксцесса этих смесей. Определены оптимальные конфигурации нейронных сетей и продемонстрирована практическая возможность построения качественных среднесрочных прогнозов при ограниченном времени обучения. Полученные результаты важны для развития вероятностно-статистического подхода к описанию эволюции турбулентных процессов в магнитоактивной высокотемпературной плазме.

Ключевые слова: LSTM, прогнозирование, глубокое обучение, высокопроизводительные вычисления, CUDA.

Поступила в редакцию: 15.01.2020

DOI: 10.14357/19922264200102



© МИАН, 2024