计算机工程与科学 ›› 2021, Vol. 43 ›› Issue (07): 1160-1167.
杨坚伟,孟敏,黄家乐,武继刚
YANG Jian-wei,MENG Min,HUANG Jia-le,WU Ji-gang
摘要: 分布式机器学习中的工作结点在训练过程中经常需要处理异构任务,但任务发布者可能无法根据有效的先验知识确定边缘服务器集群中哪些是处于训练状态的工作结点。针对边缘服务器集群无法同时满足训练性能与服务质量最大化的问题,对异构任务调度算法进行了研究。首先在集群资源约束下分析了分布式训练收敛性能的影响因素;其次建立了最大化训练性能的优化目标;最后转化为多维多选择背包问题进行求解。仿真结果表明,所提异构任务调度算法能够在保证服务质量的同时,最大化分布式训练性能。