计算机工程与科学 ›› 2025, Vol. 47 ›› Issue (9): 1544-1554.
石永振1,2,莫淏天1,2,胡星宇1,2,刘杰1,2,王庆林1,2
SHI Yongzhen1,2,MO Haotian1,2,HU Xingyu1,2,LIU Jie1,2,WANG Qinglin1,2
摘要: ILU分解被广泛应用于求解大规模稀疏线性系统,能够有效减少迭代次数、提高求解效率,但限于线性系统的数据依赖性和分解过程中计算访存的不规则,较难进行高效的并行优化。多指令多数据(MIMD)众核架构中众多并行计算线程可以执行不同的指令,对于控制流不规则的算法具有天然的适应性。基于MIMD众核架构PEZY-SC3s处理器开展ILU分解并行算法优化研究,提出了一种面向MIMD架构的ILU并行算法,并采用基于图着色的并行性优化、基于向量单元的访存优化、基于线程分组的负载平衡优化以及基于片上局部存储的数据局部性优化等措施来优化算法性能。实验结果表明,所提ILU并行分解算法与Intel Xeon 4314 CPU上MKL实现和NVIDIA A30 GPU上cuSPARSE实现相比,分别获得了16.70与1.39的平均加速比。