计算机工程与科学 ›› 2024, Vol. 46 ›› Issue (06): 1050-1062.
王泽宇1,徐慧英1,朱信忠1,李琛1,刘子洋1,王子奕2
WANG Ze-yu1,XU Hui-ying1,ZHU Xin-zhong1,LI Chen1,LIU Zi-yang1,WANG Zi-yi2
摘要: 在大型人员密集的场所中,人群异常聚集情况时有发生,对自动驾驶和大型公共场所人流量监控系统等应用场景中涉及到的密集行人检测技术带来了一定挑战,新一代的密集行人检测技术要求精确度更高、计算开销更小、检测速度更快以及部署更加方便等。针对上述需求,提出了一种基于YOLOv8改进的轻量级密集行人检测算法MER-YOLO,首先采用MobileViT作为主干网络,提升模型在总体上对行人聚集区域的特征提取能力;引入EMA注意力机制模块,对全局信息进行编码,通过维度交互来进一步聚合像素级特征,并结合160×160尺度的检测头加强小目标检测能力;使用排斥损失(Repulsion Loss)作为边界框损失函数,减少了人群密集情况下小目标行人的漏检误检的情况。实验结果表明,相较于YOLOv8n,MER-YOLO行人检测算法在Crowd Human数据集上mAP@0.5提升了4.5%,在WiderPerson数据集上mAP@0.5提升了2.1%,同时只有3.1×106的参数量和9.8 GFLOPs,满足低算力兼顾高精度的部署需求。
中图分类号: