现有的基于帧预测的方法精度低的原因大多是不紧凑的正常分布学习,导致了异常事件的强泛化。对此,提出了动态运动约束下的视频异常检测(dynamic motion constraints for video anomaly detection,DMC-VAD)框架。提出了时空约束模块,使...现有的基于帧预测的方法精度低的原因大多是不紧凑的正常分布学习,导致了异常事件的强泛化。对此,提出了动态运动约束下的视频异常检测(dynamic motion constraints for video anomaly detection,DMC-VAD)框架。提出了时空约束模块,使得模型能够基于光流显著目标和运动信息,对正常运动施加时空约束。设计了时空对齐融合模块,用校正对齐模块抑制光流中低质量的特征响应,增强正常帧的全局外观与运动上下文约束。这些动态约束能够使模型学习到更紧凑的正常分布,异常帧因为偏离这些约束从而产生高误差。引入光流重构以更好地训练运动编码器,融合光流平均误差和视频帧峰值信噪比作为异常分数。在UCSD Ped2和Shanghaitech上获得了最优的受试者操作特性(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC):99.42%(+1.19%),74.50%(+0.28%)。在CUHK Avenue上获得了与AMSTE相当的结果(88.07%),但提出模型的参数量仅是AMSTE的16%。展开更多
文摘现有的基于帧预测的方法精度低的原因大多是不紧凑的正常分布学习,导致了异常事件的强泛化。对此,提出了动态运动约束下的视频异常检测(dynamic motion constraints for video anomaly detection,DMC-VAD)框架。提出了时空约束模块,使得模型能够基于光流显著目标和运动信息,对正常运动施加时空约束。设计了时空对齐融合模块,用校正对齐模块抑制光流中低质量的特征响应,增强正常帧的全局外观与运动上下文约束。这些动态约束能够使模型学习到更紧凑的正常分布,异常帧因为偏离这些约束从而产生高误差。引入光流重构以更好地训练运动编码器,融合光流平均误差和视频帧峰值信噪比作为异常分数。在UCSD Ped2和Shanghaitech上获得了最优的受试者操作特性(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC):99.42%(+1.19%),74.50%(+0.28%)。在CUHK Avenue上获得了与AMSTE相当的结果(88.07%),但提出模型的参数量仅是AMSTE的16%。