摘要:
基于OpenBLAS和BLIS开源线性代数基础算法库,对稠密矩阵乘法GEMM运算的性能优化展开研究。针对如何选取稠密矩阵分块并行算法的关键分块参数这一问题,建立性能优化模型。采用改进的遗传算法求解上述优化模型,将某一分块参数组合(种群个体)所对应的稠密矩阵乘法的性能值作为该个体的适应度,通过不断迭代地进行选择、交叉、变异操作,找到最优的分块参数组合,使得稠密矩阵运算的性能值最优。数值实验表明,基于遗传算法求解得出最优分块参数下的GEMM性能值优于默认分块参数下的性能值,达到了优化的目的。
孙成国1,兰静2,姜浩1. 一种基于遗传算法的BLAS库优化方法[J]. 计算机工程与科学.
SUN Cheng-guo1,LAN Jing2,JIANG Hao1.
A BLAS library optimization method
based on genetic algorithm
[J]. Computer Engineering & Science.