计算机工程与科学 ›› 2022, Vol. 44 ›› Issue (11): 1909-1917.
郭盼盼1,2,陈梦雪3,梁祖达1,2,马晓畅3,许邦建4
GUO Pan-pan1,2,CHEN Meng-xue3,LIANG Zu-da1,2,MA Xiao-chang3,XU Bang-jian4
摘要: 基于国产的FT-M7002平台高性能DSP,针对不同类型的点积算法进行了优化实现,完善了该处理器平台数学库的技术链,充分发挥了FT-M7002内核体系结构优势,对点积算法实现了SIMD向量并行化、DMA双通道传输和SVR传输等优化。该研究充分挖掘了程序的向量并行性,有效地提升了数据传输的速度,提高了程序性能。实验结果表明,输入不同规模大小的数组,不同类型的点积算法在FT-M7002平台上优化后和优化前的平均性能比为12.416 6~45.233 8。相较于TI官网的dsplib库中不同类型的点积函数在TMS320C6678处理器上运行的性能,FT-M7002平台优化后的性能与TI平台的平均性能比为1.371 6~4.519 6。实验结果表明了该DSP平台相对于TI主流平台的计算性能优势。