Аннотация:
Рассмотрены проблемы построения отказоустойчивых серверов, возникающие в связи с недетерминированностью поведения приложений. Предложена формальная модель, описывающая поведение приложения, основными объектами которой являются ресурсы и события. Предложены алгоритмы протоколирования работы приложения на резервном узле кластера, а также восстановления и продолжения его работы при отказе основного узла. При этом для клиентов сбой остается незаметным, за исключением некоторого увеличения времени обслуживания.