计算机工程与科学 ›› 2021, Vol. 43 ›› Issue (12): 2105-2114.
朱浩1,2,周博洋2,卢雪山3,杜溢墨4
ZHU Hao1,2,ZHOU Bo-yang2,LU Xue-shan3,DU Yi-mo4
摘要: 随着智能计算和大数据应用的发展,人们对GPU等加速部件的需求不断增长。计算软件栈比如CUDA、OpenCL软件栈是能充分发挥GPU硬件性能的关键。考虑计算软件栈未来在国产基础软硬件平台(比如飞腾CPU和麒麟操作系统)上的可移植性和适配性,重点研究OpenCL开源计算软件栈。测试分析OpenCL应用在不同平台上的表现,评估应用在不同OpenCL软件栈上
(比如Mesa、ROCm等)进行GPU计算的表现,评估软件栈中驱动、内核等对GPU计算的影响,并且整个测试涵盖了编译、数据传输和内核执行等OpenCL计算各个阶段的时间开销。经过测试评估发现,国产平台更迫切也更适合使用GPU进行加速计算,ROCm是比较理想的OpenCL开源软件栈,有较好的性能和稳定性,并且与闭源软件栈相比存在一定的优化空间。