Аннотация:
В стандартных проблемах оптимальной остановки возможность действовать
обычно приурочена к моментам получения новых данных о затратах и
выгодах проекта. В стандартной литературе по экспериментированию и
машинному обучению, основанной на так называемых двуруких Пуассоновых
бандитах, допускается возможность действовать в период отсутствия
наблюдений. Однако, в этой литературе не принимается во внимание, что
принятие решений зависит не только от того, с какой частотой прибывает
новая информация о затратах и прибылях, но и от реализации стохастических
процессов, моделирующих затраты или прибыли, в момент наблюдения. Наша
статья показывает, что для принятия решений имеют значение как
представления о частоте случайных поломок или прорывов, так и величина
затрат в случае поломок или прибылей в случае прорывов.
Мы предлагаем две модели: одна рассматривает экспериментирование с
новой технологией, подверженной случайным поломкам; другая — оптимальное
инвестирование венчурного капитала в проект со случайными прорывами.
Время, когда случаются поломки или прорывы моделируется как
процесс Пуассона, чей параметр может принимать одно из двух значений.
Истинная величина этого параметра изначально неизвестна. Дано априорное
распределение для этого параметра; апостериорное распределение
корректируется по правилу Байеcа. Стохастические затраты или прибыли
моделируются как процесс Леви , независимый от процесса Пуассона. Наша
модель показывает, что, если в момент наблюдения действовать не
оптимально, то оптимально фиксировать время $T(x)$, зависящее от последней
реализации стохастического процесса $x$, и погасить опцион в
момент времени $T(x)$, если новое наблюдение не случится раньше. Мы исследуем
регулярность решения задачи и формулируем следующую дихoтомию: либо
функция $T(x)$ непрерывна на свободной границе, и выполняется принцип
гладкой склейки; либо в функции $T(x)$ наблюдается скачок, и целевая
функция имеет излом на границе.
|