摘要: 进化策略算法是一种高效的优化算法,适用于解决无梯度信息或难以获取梯度信息的问题,广泛应用于强化学习和黑盒优化等任务。随着问题规模和复杂度的增加,进化策略算法的采样规模也越来越大,相应地,计算并行度也随之增加。面向大规模系统,提出了新的并行进化策略算法框架,主要优化进化策略算法在超大规模并行执行中的容错计算和通信开销问题。针对这些问题,提出了高并发的规约机制,并针对算法特点提出了低开销的容错方法。实验显示,新的并行进化策略算法框架在大规模系统中的并行效率在54.7%以上,且在并行规模上升至上万节点时,并行效率比OpenAI-NES高出23%。