摘要:
近年来,以神经网络为代表的机器学习领域快速发展,已广泛地应用于语音识别和图像识别等各个工业领域。随着应用环境越来越复杂,精度要求越来越高,网络规模也越来越大。大规模神经网络既是计算密集型又是存储密集型结构,其中卷积层是计算密集型层次,全连接层是存储密集型层次。前者的处理速度跟不上存取速度,后者的存取速度跟不上处理速度。基于神经网络本身训练的预测准确率置信区间,提出了一种使用Kmeans加速和压缩神经网络的方法。通过将卷积过程中的输入特征图采用Kmeans压缩来减少计算量;通过将全连接层的权重压缩来减少存储量。所提方法对AlexNet网络单个卷积层的计算量最多能降低2个数量级,加入合适的Kmeans层,整个网络的处理时间加速比能达到2.077,对网络压缩率达到8.7%。
陈桂林,马胜,郭阳,李艺煌,徐睿. 通过K-means算法实现神经网络的加速和压缩[J]. 计算机工程与科学.
CHEN Guilin,MA Sheng,GUO Yang,LI Yihuang,XU Rui.
Towards convolutional neural network acceleration
and compression via K-means algotrithm
[J]. Computer Engineering & Science.