视觉注意机制建模中的特征调制和选择策略研究
【摘要】:视觉是人类从外界获取信息最重要的手段,关于视觉信息的研究是当前科学研究的重要课题。自从计算机发明以后,人们就梦想着有一天计算机能够像人类一样去认识和改造世界。但是,现在的计算机视觉的能力远远低于人类视觉的能力。为此,科学家们提出了许多符合人类视觉特性的图像处理方法来提高计算机视觉的能力。视觉注意机制计算模型正是近年来兴起的一种处理图像的方法。
本文的创新之处和主要工作如下:
从图像中搜索视觉显著区域的时候,将人类视觉系统的感知特性与自下而上的图像信息整合起来是很有必要的,但是以前的研究工作关于这两方面整合的很少,主要是关于自下而上的图像信息的研究。本文将人类的视觉亮度适应特性(也叫视觉阈值效应)应用到了数据驱动视觉注意机制当中,构成了新的视觉感知匹配的数据驱动视觉注意机制计算模型。具体来说,我们使用特征图局部区域的亮度敏感值对初级视觉特征(如,亮度和朝向)进行调整,然后合成最终的基于感知的显著图,实验结果表明该模型的预测结果与人眼视觉感知结果一致。
任务驱动视觉注意机制计算模型的主要难点在于寻找自上而下的任务信息对特征图的最准确的影响,从而使任务目标的搜索速度达到最大。一些研究工作使用目标物和干扰物的平均显著值之比作为搜索过程中特征图的合并权值,但是这种算法只适用于显著值在特征图中平均分布的情形,而这种情况在实际场景中是非常少见的。本文提出了一种基于目标物和干扰物的刺激强度比的最优特征权值调整策略,从而最大化显著图中目标物的相对显著值。目标物或干扰物的刺激强度是由两方面的因素决定的:平均活动系数和显著值的累积总量。
本文还提出了一种特征图裁剪策略(从所有的特征图中,提取一个特征图的计算权值大于给定阈值的特征图子集参与最终的合并显著图运算)来减低目标搜索过程中的计算代价。人工图像和自然图像两组实验结果表明,本文提出的特征图权值调整策略和特征图裁剪策略,确实能够提高目标的搜索速度和搜索精度。