RUS  ENG
Полная версия
ЖУРНАЛЫ // Вестник Южно-Уральского государственного университета. Серия «Математическое моделирование и программирование» // Архив

Вестн. ЮУрГУ. Сер. Матем. моделирование и программирование, 2010, выпуск 6, страницы 91–103 (Mi vyuru231)

О восстановлении программ из контрольных точек

А. Ю. Поляков

Институт физики полупроводников им. А. В. Ржанова СО РАН

Аннотация: В работе описаны два подхода к проблеме восстановления распределенных программ из контрольных точек. Предложен алгоритм восстановления взаимосвязей типа «родитель-потомок» и алгоритм принадлежности к группам и сеансам для набора процессов в рамках элементарной машины распределенной вычислительной системы. Предложен алгоритм координированного восстановления набора связанных процессов, перезапускаемых раздельно (на различных элементарных машинах или терминалах). Описанные подходы реализованы в системе создания контрольных точек DMTCP (Distributed MultiThreaded CheckPointing).

Ключевые слова: распределенные вычислительные системы, контрольные точки восстановления, отказоустойчивость.

УДК: 004.451

Поступила в редакцию: 16.04.2010



© МИАН, 2024