计算机工程与科学 ›› 2023, Vol. 45 ›› Issue (12): 2197-2205.
梁秀满1,周佳润1,杨若兰2
LIANG Xiu-man1,ZHOU Jia-run1,YANG Ruo-lan2
摘要: 在驾驶场景中,针对行人间的遮挡和尺度多变现象导致的检测精度较低、模型参数量过大和难以部署到移动端等问题,提出了一种基于YOLOv5s模型的轻量级实时行人检测模型LPD-YOLO。首先,在特征提取部分采用MES Net替换原主干网络,并在主干网络中嵌入注意力模块SA,增强网络特征提取能力;其次,在特征融合部分采用DS-ASFF结构改进原PANet,使其充分融合不同尺寸的特征图;然后,采用GS卷积代替特征融合网络中的部分标准卷积,在不影响精度的条件下,进一步减少模型参数量和计算量;最后,在预测部分使用OTA标签分配策略结合α-IOU改进原损失函数,加速模型收敛。实验结果表明,该模型相较于YOLOv5s,参数量减少了81.2%,浮点运算量降低了46.3%,模型大小减小了75.8%,检测精度提高了3.3%。单幅图像检测速度达到了13.2 ms,更好地满足了驾驶场景下密集行人的实时检测要求。