Аннотация:
В работе рассматривается задача дельта-хеджирования на неликвидных рынках, где существенную роль играют транзакционные издержки, ограниченная глубина лимитного стакана и рыночное воздействие крупных сделок. Классические методы, основанные на модели Блэка–Шоулза, предполагают непрерывную торговлю и бесконечную ликвидность, что приводит к существенным искажениям при практическом применении. Для преодоления этих ограничений предлагается подход, основанный на обучении с подкреплением с использованием риск-аверсивного оператора Беллмана. В качестве среды используется агентно-ориентированный симулятор биржи с поддержкой торговли базовым активом и опционами, моделирующий микроструктуру рынка и динамику лимитного стакана. Для извлечения признаков стакана применяется сверточный энкодер DeepLOB, что позволяет учитывать скрытые характеристики ликвидности. Численные эксперименты показывают, что предложенный метод формирует распределение реализованного PnL, центрированное около нуля и с менее тяжелыми хвостами по сравнению с классическим дельта-хеджером Блэка–Шоулза. Кроме того, параметр риск-аверсивности $\lambda$ позволяет управлять компромиссом между средней доходностью и контролем хвостовых рисков. Результаты демонстрируют эффективность подхода и его применимость для построения устойчивых стратегий хеджирования в условиях неликвидного рынка.
Ключевые слова:
дельта-хеджирование, глубокое хеджирование, обучение с подкреплением, риск-аверсивный оператор Беллмана, агентно-ориентированное моделирование, лимитный стакан, опционные деривативы.
УДК:517.54
Поступило: 20.08.2025 Принято к публикации: 29.09.2025