计算机工程与科学 ›› 2022, Vol. 44 ›› Issue (07): 1265-1272.
黄志强1,李军1,张世义2
HUANG Zhi-qiang1,LI Jun1,ZHANG Shi-yi2
摘要: 由于以CSPDarknet53为主干的YOLOv4神经网络参数量巨大,将其移植至手机等小型设备上时会降低其检测精度和速度,为了提高检测速度同时将检测精度控制在合理范围内,提出将原有的53层神经网络改为15层,并对其中的聚类算法进行优化,引入K-means++聚类算法对数据集进行分析,生成满足检测条件的Anchor Box;使用在负区间带有一定斜率的LeakyReLU激活函数代替存在梯度消失问题的Sigmoid激活函数,从而增强浅层网络的学习能力;同时考虑到Bounding Box与Anchor Box之间的中心距和宽高比具有一定的相关性,提出在原有损失函数的基础上增加相应的惩罚项生成LCIoU损失函数,使损失函数在反向传播时梯度下降的方向性更好。实验结果表明,改进后的CSPDarknet15神经网络在VOC2007数据集上检测的平均精度达到83.94%,检测一幅图像的时间为3 625 ms,与CSPDarknet53神经网络相比,检测速度提高了54.43%,能满足小型设备实时检测的速度和精度要求。