Аннотация:
Современные методы машинного обучения не позволяют достичь того уровня адаптивности, который наблюдается в поведении животных в сложных средах с множеством целей. Данное обстоятельство диктует необходимость исследования общих принципов формирования сложных управляющих систем, позволяющих обеспечивать эффективное целенаправленное поведение. Нами была разработана оригинальная модель нейроэволюции агентов в стохастической среде с иерархией целей. В работе проведен анализ эволюционной динамики поведенческих стратегий агентов. Результаты анализа показали, что в процессе эволюции возникают нейросетевые контроллеры, позволяющие агентам хранить информацию в кратковременной памяти за счет различных нейродинамических механизмов и использовать ее в поведении с альтернативными действиями. При исследовании нейронального обеспечения поведения агентов мы обнаружили, что группы нейронов могут отвечать за разные этапы поведения.
Ключевые слова:целенаправленное поведение, альтернативное поведение, кратковременная память, нейроэволюция, среды с множественными целями, рекуррентные нейронные сети.
УДК:519.7
Материал поступил в редакцию 21.05.2013, опубликован 26.08.2013