Аннотация:
Актуальность исследования состоит в выявлении точности оценки, полученной алгоритмом A2C, а также в необходимости верификации обучения с подкреплением при работе с оптимизацией экономических процессов. Целью исследования является анализ эффективности алгоритма A2C, вместе со спецификой его реализации, на решении оптимизационных экономических задач. В качестве задач рассматривались максимизация потребления в модели Солоу, Ромера и Шумпетерианской модели эндогенного экономического роста, и максимизация подушевого дохода в последних двух, по норме потребления (в последних двух – сбережения) и доле ученых в экономике, соответственно. Результаты показали, что для детерминированных моделей (модель Солоу, модель Ромера) дисперсия оценки параметра минимальна и среднее отличается от значения, полученного аналитически, не более, чем тысячной частью при достаточно высоком количестве временных периодов в модели. Тем не менее, в стохастических моделях (Шумпетерианская модель), во-первых, для соответствия оценки значению, полученному аналитически, требуется высокое количество временных периодов в модели, а во-вторых, оценка, полученная таким образом, хоть и смещена не более, чем на тысячную долю, но обладает высокой дисперсией.
Ключевые слова:обучение с подкреплением, макроэкономическое моделирование, модель Солоу, модель Ромера, Шумпетерианская модель эндогенного экономического роста, оптимизация макроэкономических процессов, теория экономического роста.