计算机工程与科学 ›› 2024, Vol. 46 ›› Issue (12): 2205-2214.
赵佳彬1,2,徐慧英1,朱蓉2,3,4,陈滨2,5,王晓琳2,5,朱信忠1
ZHAO Jia-bin1,2,XU Hui-ying1,ZHU Rong2,3,4,CHEN Bin2,5,WANG Xiao-Lin2,5 ,ZHU Xin-zhong1
摘要: 针对复杂场景中的密集人群尺度变化、分布不均匀、背景遮挡等问题,提出一种基于多尺度特征融合与背景抑制的MFFBSNet人群计数算法。以视觉几何组网络VGG-16的前13层作为网络前端部分,引入空洞空间卷积池化金字塔(ASPP)和基于轻量级金字塔切分注意力机制(PSA)构建多尺度特征融合模块,以解决密集人群尺度变化问题;在网络的中间部分加入空间注意力机制以及通道注意力机制对特征图进行校准,突出图像人头区域;网络后端部分使用可加大感受野且不丢失图像分辨率的空洞卷积生成背景分割注意力图,抑制图像中背景噪声,提升人群分布密度图的质量。在ShanghaiTech、UCF_CC_50及NWPU-Crowd 3个公开数据集上的实验结果表明,相较于MCNN、SwitchCNN、CSRNet等算法,提出的基于MFFBSNet的人群计数算法的计数准确度较高。