基于RISC-V向量指令的稀疏矩阵向量乘法实现与优化

计算机工程与科学 ›› 2022, Vol. 44 ›› Issue (1): 1-8.

基于RISC-V向量指令的稀疏矩阵向量乘法实现与优化

顾越,赵银亮

(西安交通大学计算机学院，陕西西安 710049)

收稿日期:2020-03-23 修回日期:2021-08-24 出版日期:2022-01-25 发布日期:2022-01-13
基金资助:
广东省重点领域研发计划(2019B090916003)

Implementation and optimization of sparse matrix vector multiplication based on RISC-V vector instruction

GU Yue,ZHAO Yin-liang

(School of Computer,Xi’an Jiaotong University,Xi’an 710049,China)

Received:2020-03-23 Revised:2021-08-24 Online:2022-01-25 Published:2022-01-13

摘要/Abstract

摘要： 开源指令集架构RISC-V具有高性能、模块化、简易性和易拓展等优势，在物联网、云计算等领域的应用日渐广泛，其向量拓展部分V模块更是很好地支持了矩阵数值计算。稀疏矩阵向量乘法SpMV作为矩阵数值计算的一个重要组成部分，具有深刻的研究意义与价值。利用RISC-V 指令集的向量可配置性和寻址特性，分别对基于CSR、ELLPACK和HYB压缩格式存储的稀疏矩阵向量乘法进行向量化。同时，考虑稀疏矩阵极度稀疏和每行非零元素数量波动较大的情况，通过压缩非零元素密度低的行向量的存储、调整HYB分割阈值等手段，改进了HYB存储格式，显著改善了计算效率和存储效率。

关键词: RISC-V, 向量拓展, 稀疏矩阵, SpMV

Abstract: Open source instruction set architecture RISC-V has the advantages of high performance, modularization, simplicity, easy extension, etc., and is widely used in the Internet of Things, cloud computing and other fields. The V module of its vector expansion part supports matrix numerical calculation well. As an important part of matrix numerical calculation, sparse matrix vector multiplication (SpMV) has profound research significance and value. Using the vector configurability and addressing characteristics of RISC-V instruction set, vector multiplication of sparse matrix based on CSR, ELLPACK and HYB compressed format is vectorized respectively. Meanwhile, considering that the sparse matrix is extremely sparse and the number of non-zero elements in each row fluctuates greatly, the HYB storage format is improved by compressing the storage of row vectors with low density of non-zero elements and adjusting the HYB segmentation threshold, which significantly improves the computational efficiency and storage efficiency.

Key words: RISC-V, vector expansion, sparse matrix, SpMV

顾越, 赵银亮. 基于RISC-V向量指令的稀疏矩阵向量乘法实现与优化[J]. 计算机工程与科学, 2022, 44(1): 1-8.

GU Yue, ZHAO Yin-liang. Implementation and optimization of sparse matrix vector multiplication based on RISC-V vector instruction[J]. Computer Engineering & Science, 2022, 44(1): 1-8.

[1]	张钰儿, 席宇浩, 刘鹏. 基于多操作数的RISC-V指令集设计与功能优化方法[J]. 计算机工程与科学, 2025, 47(6): 968-975.
[2]	张伟伟, 陈虎. 用于低间隔加速部件控制的多线程无中断RISC-V处理器[J]. 计算机工程与科学, 2025, 47(5): 787-796.
[3]	彭林, 张鹏, 陈俊峰, 唐滔, 黄春. 基于监督学习的稀疏矩阵乘算法优选[J]. 计算机工程与科学, 2025, 47(3): 381-391.
[4]	连子涵, 何卫锋. 基于动态时序裕量压缩的高性能处理器设计[J]. 计算机工程与科学, 2025, 47(2): 219-227.
[5]	张宗茂, 董德尊, 王子聪, 常俊胜, 张晓云, 王绍聪. 基于便笺式存储器的向量化SpMV算法的性能评估与分析[J]. 计算机工程与科学, 2024, 46(9): 1521-1528.
[6]	周智, 高建花, 计卫星. 基于FPGA和行折叠的稀疏矩阵向量乘优化[J]. 计算机工程与科学, 2024, 46(8): 1340-1348.
[7]	姜晶菲, 何源宏, 许金伟, 许诗瑶, 钱希福. NM-SpMM：面向国产异构向量处理器的半结构化稀疏矩阵乘算法[J]. 计算机工程与科学, 2024, 46(7): 1141-1150.
[8]	施禹, 董攀, 张利军. 一种不规则稀疏矩阵的SpMV方法[J]. 计算机工程与科学, 2024, 46(7): 1175-1184.
[9]	王洁, 付丹阳, . 基于RISC-V的超标量处理器的ROB压缩方法[J]. 计算机工程与科学, 2024, 46(7): 1185-1192.
[10]	魏一, 杨智杰, 铁俊波, 石伟, 周理, 王耀, 王蕾, 徐炜遐. 基于蜂鸟E203的多级动态分支预测器[J]. 计算机工程与科学, 2024, 46(5): 785-793.
[11]	王宇华, 何俊飞, 张宇琪, 徐悦竹, 崔环宇. DRM:基于迭代归并策略的GPU并行SpMV存储格式[J]. 计算机工程与科学, 2024, 46(3): 381-394.
[12]	李飞, 郭绍忠, 周蓓, 宋广辉, 郝江伟, 许瑾晨. RISC-V基础数学库性能优化[J]. 计算机工程与科学, 2023, 45(9): 1532-1543.
[13]	孙彩霞, 隋兵才, 邓全, 郑重, 倪晓强, 王永文. 应用级兼容RISC-V的混合指令集处理器[J]. 计算机工程与科学, 2023, 45(8): 1347-1353.
[14]	李小玲, 方建滨, 马俊, 谭霜, 谭郁松. 基于监督学习的稀疏矩阵自动任务分配[J]. 计算机工程与科学, 2023, 45(5): 782-789.
[15]	周理, 赵祉乔, 潘国腾, 铁俊波, 赵王. 基于RISC-V的图卷积神经网络加速器设计[J]. 计算机工程与科学, 2023, 45(12): 2113-2120.