计算机工程与科学 ›› 2023, Vol. 45 ›› Issue (07): 1216-1225.
曹玉东1,陈冬昊1,曹睿2,赵朗1
CAO Yu-dong1,CHEN Dong-hao1,CAO Rui2,ZHAO Lang1
摘要: 在计算机视觉领域中,行人目标检测与跟踪是备受关注的焦点。提出一种改进的多目标行人跟踪模型,改进Deep SORT基础框架,融合Mask R-CNN实现行人的检测、跟踪和姿态估计功能。采用更符合行人目标宽高比的锚框替代区域预测网络中的锚框,在不增加计算量的情况下提高模型的性能。在深度残差网络中引入注意力机制,采用轻量级的SKNet自适应地选取最佳的卷积核,提高对检测目标的特征表示能力。采用融合了颜色信息的梯度直方图特征取代卷积特征,提高Deep SORT模型中外观信息特征关联匹配的成功率。通过消融研究验证各种改进对模型性能的影响,将改进的模型与当前主流的行人检测跟踪模型进行对比,实验结果表明改进的模型是有效的,在MOT16跟踪数据集上比NSH的MOTA性能提高了6%,在公开数据集上的测试性能优于几种对比模型的,当背景移动或行人目标被遮挡时,仍能实现有效跟踪。