• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2005, Vol. 27 ›› Issue (9): 69-70.

• 论文 • 上一篇    下一篇

并行计算机系统容错设计

屈婉霞 蒋旬平 杨晓东 徐炜遐   

  • 出版日期:2005-09-01 发布日期:2010-07-03

  • Online:2005-09-01 Published:2010-07-03

摘要:

容错设计是提高计算机系统可靠性的有效手段。本文提出了一种分布共享主存的并行计算机系统的容错结构,着重分析了结构采用的故障诊断机制,提出了系统中备份节点机 配置的优化策略。

关键词: 并行计算机系统 容错 可靠性 故障诊断

Abstract:

Fault-tolerant design is an effective method to improve the reliability of computer systems. This paper proposes a fault-tolerant architecture for par  allel computer systems, analyzes the fault diagnosis techniques employed in this architecture and presents the configuration optimization strategy for s  tand-by nodes.

Key words: (parallel computer system, fault-tolerance, reliability, fault diagnosis)