计算机工程与科学 ›› 2023, Vol. 45 ›› Issue (10): 1814-1821.
牛为华1,2,翟瑞冰1
NIU Wei-hua1,2,ZHAI Rui-bing1
摘要: 针对人体行为在视频中呈现的时序性特点,提出了一种融合非对称卷积和CBR模块的视频人体行为识别方法。该方法使用3D ResNet-50作为主干网络。首先,将网络中较大的卷积核拆分为2个非对称3D卷积核的串联,加深卷积层在水平和竖直方向上的局部关键特征提取;其次,加入了CBR模块,以增加网络层数。该网络对连续的视频帧序列进行图像和时序的多角度特征提取,并根据特征数据对其进行分类,最后输出识别结果。在基准数据集UCF101上的大量实验结果表明,所提方法的Top1准确率和Top5准确率与原始3D ResNet网络相比分别提升了4.03%和4.99%,且该方法的识别准确率也优于其他主流方法的识别准确率。