Аннотация:
Целью данной работы является разработка и верификация модели мониторинга отказоустойчивости и доступности распределенных систем, построенной на основе вероятностных характеристик компонентов и учета зависимых отказов. Современные распределенные системы требуют точных методов прогнозирования отказов, способных учитывать сложные зависимости между узлами и обеспечивать надежную работу при высоких нагрузках. Традиционные подходы, основанные на анализе эмпирических данных, часто оказываются недостаточными для предсказания состояния системы в условиях изменяющейся нагрузки, что ограничивает их применимость. В ходе исследования разработанная вероятностная модель прошла верификацию с использованием численного моделирования и оценки точности через расхождение Кульбака–Лейблера и среднеквадратичную ошибку (MSE), что подтвердило ее точность и практическую ценность. Экспериментально была доказана универсальность модели: она демонстрирует способность адаптироваться к различным типам распределенных систем, обеспечивая точное прогнозирование доступности и отказоустойчивости в реальном времени. Численные эксперименты показали, что предложенная модель может служить надежным инструментом для управления отказоустойчивостью и балансировкой нагрузки. Таким образом, разработанная модель является эффективным решением для повышения надежности распределенных систем и обладает высокой степенью универсальности, что делает ее ценной для широкого спектра применений.
Ключевые слова:
мониторинг, распределенные системы, отказоустойчивость, вероятностное моделирование, доступность.