Аннотация:
Оценка отказоустойчивости управляющей параллельной вычислительной системы аналитически определяется на основе формализованных описаний и математических моделей вычислительных процессов как вероятность успешного завершения произвольного комплекса взаимосвязанных программных модулей за заданное (пользователем) директивное время при случайных временах реализации этих модулей, как при синхронном, так и при асинхронном их резервировании. Впервые формально обоснована, синтезирована и логически описана структура унифицированного программного блока диагностирования для определения координаты одиночной ошибки вычислительных ресурсов системы, типа ошибки (сбой или отказ процессора), а также для идентификации программного модуля
с искаженными результатами его выполнения.
PACS:
07.05.Вх, 07.05.Тр
Статья представлена к публикации членом редколлегии:П. П. Пархоменко