基于ML_pLSA模型和特征包算法的目标识别方法
【摘要】:目标识别技术是计算机视觉中目前比较热门的领域,受到人们越来越多的关注。它已经在卫星遥感图像和医学图像分析、人脸和车辆车牌识别等各个方面发挥着重要的作用。但是目标识别技术仍然面临很大的挑战和问题,比如目标尺度的变化、目标旋转或遮挡、光照变化等。
本文提出了一种基于ML_pLSA模型和特征包算法的目标识别方法。该方法走出了以往目标识别方法分割、识别先后进行的思想束缚,而是使目标分割与目标检测识别两个部分相互依赖、相互促进,这避免了前一过程误差对后一过程结果的影响。方法首先选取多种分割算法对图像进行分割,再结合ML_pLSA模型、特征包算法以及分类器对不同分割方法得到的每一个分割区域进行目标类别估计,给出分类置信值。最后通过不同尺度的置信值的叠加确定目标的最终位置信息以及类别信息,并将其分割出来,从而达到目标识别的目的。与传统目标识别方法相比,我们的方法拥有更宽的适用范围和鲁棒性,可以更好进行无监督学习。
本文将在文本检索领域取得显著效果的概率生成模型(pLSA模型)算法引入到了计算机视觉领域当中,提出了ML_pLSA模型(Multi-Level-probabilistic Latent Semantic Analysis)。该模型每一个变量以及对应的概率分布和条件分布在本文中都有明确的物理解释,并且将pLSA模型在文本检索中解决同义词和多义词的能力用到了解决图像类间类内差异问题上,在Graz-O2数据库取得了很好的效果。