• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2005, Vol. 27 ›› Issue (5): 104-107.

• 论文 • 上一篇    下一篇

并行计算机高可用性分析与设计

刘睿涛   

  • 出版日期:2005-05-01 发布日期:2010-07-03

  • Online:2005-05-01 Published:2010-07-03

摘要:

随着并行计算机系统规模的不断增大,系统的失效率呈线性增长。如何保证大规模并行系统能够提供持续不断的服务,即提高系统的可用性,达到高可用的目标,已成为并行 系统设计的重要方面。系统级容错的概念目前已经提出,但系统可用性的度量仍然需要深入研究。本文运用组合模型和马尔科夫过程模型,对系统可靠性和可用性进行了建模 模和分析,推导了基于马尔科夫过程的可用性度量公式,得出运用高可用技术可以提高系统的可用性。在此基础上,还给出了一个大规模并行计算机系统的高可用系统结构。

关键词: 并行计算机 高可用性分析 设计 可靠性 马尔科夫过程