计算机工程与科学 ›› 2021, Vol. 43 ›› Issue (08): 1366-1375.
袁远,李世杰,邢建英,蒋句平
YUAN Yuan,LI Shi-jie,XING Jian-ying,JIANG Ju-ping
摘要: 随着E级高性能计算机系统组装密度成倍增加,结点规模不断扩大,监控分系统在可扩展性、可靠性、可服务性和高效运维上面临巨大挑战。针对这些挑战,从架构、网络、功能和运维4个方面介绍了监控分系统的设计思路,并通过原型系统验证了部分设计的可行性与优势,对未来E级系统的构建具有较大的支撑作用。