计算机工程与科学 ›› 2022, Vol. 44 ›› Issue (09): 1532-1541.
温瑞林1,樊春2,3,4,马银萍2 ,王政丹5,向广宇5 ,付振新2
WEN Rui-lin1,FAN Chun2,3,4,MA Yin-ping2,WANG Zheng-dan5,XIANG Guang-yu5,FU Zhen-xin2
摘要: 目前使用较为广泛的Slurm任务调度系统存在代码臃肿、新功能开发效率低和难以维护的问题,在参考目前较为成熟的任务调度系统(如Slurm和HTCondor)的优缺点的基础上,设计了一个性能优异、可扩展性好和维护方便的高性能任务及资源调度系统SlurmX。讨论了通过使用面向对象的手段,对Slurm内部的组件从上至下进行了功能级别的重新抽象和组织,并从系统架构设计和组件内部设计等方面,简述了该调度系统如何在保障性能的情况下,提供高可扩展性和内部模块之间的低耦合性。