基于动态感知与异常注意的目标描述方法研究
【摘要】:视频异常目标检测与分析的目的是快速检测并定位场景中的异常,具有重要的学术研究价值与广阔的应用前景。该课题的难点在于异常的定义在不同的应用场景中具有多样性和复杂性,目前的研究主要集中在有限类别的简单行为识别或者特定场景中的异常行为检测上。
人类视觉注意机制很少被考虑用作异常识别系统的关键标准。动态感知是一个基于视觉注意特性估计场景中运动元素速度和方向的过程,人类视觉对动态特征感知的优先级要大于其他低层特征,在感知范围内的视觉刺激被注意,在范围之外则被忽略。动态感知的建模为异常检测方法提供了一种新的思路。
异常检测方法通常先建立正常行为的先验模板或统计参数模型,计算待检测样本与先验模板(或模型)的差别来判别异常,惊奇计算模型基于贝叶斯理论来衡量先验分布与后验分布之间的差别。
有效的异常检测算法关键在于提取出的特征是否具有高效的分类性能和描述行为的最精简表示性。近期研究表明,人类视觉系统具有对自然场景中关键信息的稀疏“捕获”能力,稀疏编码模型能够以最精简的基向量来表达场景中行为。
针对上述问题,本文开展基于动态感知模型、惊奇计算模型与稀疏编码模型的异常目标描述方法研究。
论文的主要工作和创新如下:
1)结合人类视觉系统具有运动注意机制,提出一种基于动态感知模型的异常目标发现方法,采用基于DCT块分类的运动注意模型,对动态感知区域建模得到运动注意块集合,提取运动注意块的HNF特征作为特征样本,对其稀疏编码建模生成字典。使用重构误差作为目标函数进行异常目标发现的判别。实验表明该算法是有效和实用的,且易于实现。
2)针对视频中异常发生时导致先验分布与后验分布的显著差别,提出一种基于贝叶斯惊奇计算模型的群体异常发现方法,首先提取场景中每一帧的运动矢量图,然后计算出多尺度运动直方图特征,基于惊奇计算模型获得每一帧的惊奇度,根据惊奇度的大小来判断当前帧中是否含有群体异常。该方法能够发现特定类别的群体异常行为(四散逃逸),实验结果与真实结果比较显示了该方法的有效性。
3)提出一种基于贝叶斯惊奇计算模型的个体异常发现方法,用混合高斯模型对背景建模,检测出前景目标并计算其围盒长宽比,同时进行每帧图像的光流场估计,提取前景目标的平均速度,利用二元惊奇计算模型检测出时间上具有突然变化特征值的异常目标。实验表明算法能有效检测出奔跑、摔倒两类的个体异常。
4)结合人类视觉系统具有对自然场景中关键信息的稀疏“捕获”能力,提出一种基于稀疏编码模型的群体异常发现方法,提取每一帧的多尺度运动直方图,通过快速稀疏编码算法学习字典,场景中的高维特征基于字典的重构误差超过预设阈值,则判断为异常,实现帧级场景异常检测,实验结果与真实结果比较表明本方法能够及时对场景中的群体异常报警。
5)提出一种基于稀疏编码模型的异常发现方法,以场景中的时空兴趣点作为候选检测位置,提取正常场景中的HOF/HOG高维特征,通过快速稀疏编码算法学习字典,基于字典的重构误差超过预设阈值则判断为异常。实验表明该方法在简单场景中对奔跑和跳跃类型的个体异常具有有效性。