RUS  ENG
Полная версия
ЖУРНАЛЫ // Проблемы передачи информации // Архив

Пробл. передачи информ., 1973, том 9, выпуск 4, страницы 58–65 (Mi ppi923)

Теория автоматов

Об одной модели оптимального поведения в неизвестной среде

А. В. Васильев, А. В. Коганов


Аннотация: В статье рассматривается модель приспособления к неизвестной среде, в которой обучающийся объект имеет несколько действий, а среда выдает фиксированный выигрыш за каждое действие. Объект имеет конечное время обучения и должен за это время получить наибольшую сумму выигрышей. Среда заранее неизвестна, но задан класс сред. Эту модель можно рассматривать как игру, в которой стратегиями являются алгоритмы поведения объекта (помнящего уже полученные ответы среды) и задание до начала работы объекта некоторой среды из допустимого класса сред == стратегия “природы”. Для игры исследуются минимаксные и максиминные точки и находится седловая точка на классе смешанных стратегий.

УДК: 519.87, 62-507

Поступила в редакцию: 20.03.1972


 Англоязычная версия: Problems of Information Transmission, 1973, 9:4, 314–320

Реферативные базы данных:


© МИАН, 2024