RUS  ENG
Полная версия
ЖУРНАЛЫ // Математическая теория игр и её приложения // Архив

МТИП, 2015, том 7, выпуск 4, страницы 40–55 (Mi mgta167)

Эта публикация цитируется в 7 статьях

Альтруистическое поведение в неантагонистической позиционной дифференциальной игре

Анатолий Ф. Клейменов

Институт математики и механики им. Н. Н. Красовского УрО РАН, 620990, Екатеринбург, ул. С. Ковалевской, 16

Аннотация: Рассматривается неантагонистическая позиционная дифференциальная игра (НПДИ) двух лиц c динамикой, описываемой обыкновенным нелинейным векторным дифференциальным уравнением. Ограничения на значения управлений игроков являются геометрическими. Момент окончания игры фиксирован. Функционалы выигрыша обоих игроков являются терминальными. Формализация позиционных стратегий в НПДИ основана на формализации и результатах общей теории антагонистических позиционных дифференциальных игр (АПДИ) (см. монографии Н.Н. Красовского и А.И. Субботина [3, 4]). В настоящей статье дополнительно предполагается, что каждый игрок помимо обычного, нормального (nor), типа поведения, ориентированного на максимизацию собственного функционала, может использовать другие типы поведения, введенные в [1, 2]. В частности, это могут быть альтруистический (alt), агрессивный (agg) и парадоксальный (par) типы. Далее полагается, что по ходу игры игроки могут осуществлять переключения своего поведения с одного типа на другой. Использование игроками возможности такого переключения в повторяющейся биматричной $2\times2$ игре позволило в работах [5, 6] получить новые решения этой игры. В настоящей статье распространение указанного подхода на неантагонистические позиционные дифференциальные игры приводит к новым постановкам задач. В частности, представляет интерес как трансформируются выигрыши игроков, получаемые на нэшевских решениях. Актуальной становится задача минимизации времени «ненормального» поведения при условии достижения удовлетворительного результата. В статье предлагается формализация НПДИ двух лиц с типами поведения (НПДИсТП). Предполагается, что в НПДИсТП каждый игрок одновременно с выбором позиционной стратегии выбирает также индикаторную функцию, определенную на всем отрезке игры и принимающую значения в множестве $\{$nor, alt, agg, par$\}$. Индикаторная функция игрока показывает динамику изменения типа поведения, которой придерживается этот игрок. Таким образом, в НПДИсТП каждый игрок управляет выбором пары действий $\{$позиционная стратегия, индикаторная функция$\}$. Дается определения понятия $BT$-решения такой игры. Ожидаемо, что в НПДИсТП использование типов поведения, отличных от нормального (так называемых ненормальных (abnormal) типов), в ряде случаев может привести к исходам, более предпочтительным для игроков, чем в игре НПДИ. В статье рассматриваются два примера игры с динамикой простого движения на плоскости, в каждом из которых один игрок придерживается альтруистического типа поведения в течение некоторого промежутка времени. Показывается, что по сравнению с игрой с нормальными типами поведения игроков, в первом примере на $BT$-решении происходит увеличение выигрыша каждого из игроков, а во втором примере — увеличивается суммарный выигрыш игроков.

Ключевые слова: неантагонистическая позиционная дифференциальная игра, терминальные показатели качества, типы поведения игроков, альтруистический тип поведения, решения нэшевского типа.

УДК: 517.917
ББК: 22.1


 Англоязычная версия: Automation and Remote Control, 2017, 78:4, 762–769


© МИАН, 2024