摘要:
大规模三角线性方程求解是科学与工程应用中重要的计算核心,受限于处理器的缓存容量和结构设计,其在CPU和GPU等平台上的计算效率不高。大规模三角线性方程的分块求解中,矩阵乘是主要运算,其计算效率对提升三角线性方程求解的计算效率至关重要。以矩阵乘计算效率较高的矩阵乘协处理器为计算平台,针对其结构特点提出了矩阵乘协处理器上大规模三角线性方程分块求解的实现方法和性能分析模型。实验结果表明,矩阵乘协处理器上大规模三角线性方程求解的计算效率最高可达85.9%,其实际性能和资源利用率分别为同等工艺下GPU的2.42倍和10.72倍。
贾迅,邬贵明,钱磊,谢向辉,吴东. 大规模三角线性方程的高效求解[J]. 计算机工程与科学.
JIA Xun,WU Guiming,QIAN Lei,XIE Xianghui,WU Dong. An efficient solver for large-scale triangular linear equations[J]. Computer Engineering & Science.