计算机工程与科学 ›› 2022, Vol. 44 ›› Issue (10): 1721-1729.
张勇1,张曦2,万云博1,何先耀1,赵钟1,卢宇彤2
ZHANG Yong1 ,ZHANG Xi2 ,WAN Yun-bo1 ,HE Xian-yao1 ,ZHAO Zhong1 ,LU Yu-tong2
摘要: 网格重排序是提升流体力学CPU和GPU并行计算效率的重要手段之一。对于非结构网格,由于其数据存储无规律,数据的间接访问会导致访存延迟,尤其是在GPU并行计算时,数据的间接访问将引起内存的非对齐访问,放大了访存延迟的影响。对此,采用Reverse Cuthill-Mckee网格重排序方法优化了非结构网格的数据局部性,并设计了一种面向编号重排序方法。算例测试表明,网格重排序不影响最终计算结果。对比分析了网格重排序对非结构求解器在CPU和GPU上的性能影响:对CPU计算,可以使部分热点函数运行时间降低约20%,整体运行时间降低15%~20%;对GPU计算,大部分热点函数运行时间可降低35%~60%,程序整体运行时间降低约40%。
中图分类号: