计算机工程与科学 ›› 2025, Vol. 47 ›› Issue (12): 2119-2128.
刘忠民,张翔,马迪,孙扬,周磊,邱琪,龚春叶
LIU Zhongmin,ZHANG Xiang,MA Di,SUN Yang,ZHOU Lei,QIU Qi,GONG Chunye
摘要: 流体力学开源软件OpenFOAM中的不可压缩等流体模拟求解器具有跨平台适用性,但它们的性能优化大多是针对Intel等现有架构的超算系统,故其算法优化无法发挥天河超算系统上ARM架构的向量化并行优势。为此,以不可压缩流体模拟求解器为研究对象,运用ARM向量化技术来优化它的对称高斯赛德尔法和对角不完全Cholesky预条件共轭梯度法,提升求解器的运行效率。为实现向量化目标,分析了2类求解算法的一次迭代中近邻网格单元间的关系,发现这些近邻单元数目最多为2,且近邻之间无依赖。利用该先验信息,以尽可能最小的成本改动原有算法代码,即新增4行if-else条件语句,就能向量化近邻单元,加速算法。不同配置下的实验结果表明,改进后算法的单核加速比最高为1.75,多核加速比最高为149.16,且并行效率仍有29.13%。