叶亚琴, 汤子健, 牛嘉诚, 张新欢
Yaqin Ye, Zijian Tang , Jiacheng Niu, Xinhuan Zhang
摘要: 视频异常检测在现代社会中越来越重要,由于视频中存在多样的模糊行为,并且类别无法穷举,基于单分类的方法难以界定正常和异常。针对以上问题,本文提出了基于条件扩散概率模型的视频异常检测模型CDiffuVAD。该方法首先设计了一个常态内容生成器,用于提高模型生成图像的内容准确程度。它通过记忆池增强模型对正常样本分布特征的理解,并借助扩散概率模型来学习视频数据的复杂分布。其次,设计引入了隐式运动条件来学习视频片段的时空特征,将双向光流信息作为扩散过程的隐式运动条件,并采用坐标归一化方法提供片段帧的坐标嵌入,从而实现对多帧序列数据中的运动趋势的学习拟合,缓解模型对视频中的硬正态信息敏感。最终实验表明,所提出的方法分别在Avenue数据集、ShanghaiTech数据集和UBnormal数据集上达到帧级AUC 85.7%,75.5%以及65.7%的精度,表明其可以发现正常样本中多样的特征,并在视频异常检测任务上具有有效性。