Эта публикация цитируется в
7 статьях
Альтруистическое поведение в неантагонистической позиционной дифференциальной игре
Анатолий Ф. Клейменов Институт математики и механики им. Н. Н. Красовского УрО РАН,
620990, Екатеринбург, ул. С. Ковалевской, 16
Аннотация:
Рассматривается неантагонистическая позиционная дифференциальная игра (НПДИ) двух лиц c динамикой, описываемой обыкновенным нелинейным векторным дифференциальным уравнением. Ограничения на значения управлений игроков являются геометрическими. Момент окончания игры фиксирован. Функционалы выигрыша обоих игроков являются терминальными. Формализация позиционных стратегий в НПДИ основана на формализации и результатах общей теории антагонистических позиционных дифференциальных игр (АПДИ) (см. монографии Н.Н. Красовского и А.И. Субботина [3, 4]). В настоящей статье дополнительно предполагается, что каждый игрок помимо обычного,
нормального (
nor), типа поведения, ориентированного на максимизацию собственного функционала, может использовать другие типы поведения, введенные в [1, 2]. В частности, это могут быть
альтруистический (
alt),
агрессивный (
agg) и
парадоксальный (
par) типы. Далее полагается, что по ходу игры игроки могут осуществлять переключения своего поведения с одного типа на другой.
Использование игроками возможности такого переключения в повторяющейся биматричной
$2\times2$ игре позволило в работах [5, 6] получить новые решения этой игры.
В настоящей статье распространение указанного подхода на неантагонистические
позиционные дифференциальные игры приводит к новым постановкам задач.
В частности, представляет интерес как трансформируются выигрыши игроков, получаемые на нэшевских решениях. Актуальной становится задача минимизации времени «ненормального» поведения при условии достижения удовлетворительного результата.
В статье предлагается формализация НПДИ двух лиц с типами поведения
(НПДИсТП). Предполагается, что в НПДИсТП каждый игрок одновременно с
выбором позиционной стратегии выбирает также индикаторную функцию,
определенную на всем отрезке игры и принимающую значения в множестве
$\{$nor,
alt,
agg,
par$\}$. Индикаторная функция игрока показывает динамику изменения типа поведения, которой придерживается этот игрок.
Таким образом, в НПДИсТП каждый игрок управляет выбором пары действий
$\{$позиционная стратегия, индикаторная функция
$\}$.
Дается определения понятия
$BT$-решения такой игры. Ожидаемо, что в НПДИсТП использование типов поведения, отличных от нормального (так называемых
ненормальных (
abnormal) типов), в ряде случаев может привести к исходам, более предпочтительным для игроков, чем в игре НПДИ. В статье рассматриваются два примера игры с динамикой простого движения на плоскости, в каждом из которых один игрок придерживается альтруистического типа поведения в течение некоторого промежутка времени. Показывается, что по сравнению с игрой с нормальными типами поведения игроков, в первом примере на
$BT$-решении происходит увеличение выигрыша каждого из игроков, а во втором примере — увеличивается суммарный выигрыш игроков.
Ключевые слова:
неантагонистическая позиционная дифференциальная игра, терминальные показатели качества, типы поведения игроков, альтруистический тип поведения, решения нэшевского типа.
УДК:
517.917
ББК:
22.1