收藏本站
《北京邮电大学》 2017年
收藏 | 手机打开
二维码
手机客户端打开本文

物体检索与定位技术研究

姜文晖  
【摘要】:物体检索与定位,是指给定查询目标在某种模态下的信息,在大规模图像视频数据集中定位该目标的技术。物体检索与定位具有广泛且重要的应用价值,是计算机视觉技术最核心的课题之一。然而,由于光照、视角、遮挡等外部因素和物体本身的形变、类别多样性等内部因素的共同影响,图像在不同层次上存在复杂的表象变化。除此之外,示例、图像和标签之间的层次关联繁杂多样。这些都给物体检索与定位带来了很大的困难。本文从实际应用的角度出发,针对示例检索、标签检索和物体定位三个相关问题展开研究。以视觉词袋模型和深度卷积网络模型为基础,从模型表示、模型学习和关联匹配几个方面进行扩展和完善。具体的研究工作包括:1.针对基于视觉词组的示例检索模型进行了研究。首先,优化了视觉词组的定义方式,提高了视觉词组的区分性。其次,分析了一类容易被忽视的现象,即视觉词组的突爆匹配。接着,基于概率模型,提出了一种新颖的贝叶斯池化模型用于消除突爆匹配,从而优化了图像之间的相似性度量,提高了示例检索的准确性。2.针对基于深度卷积网络的示例检索模型进行了研究。针对示例检索的查询敏感的空间位置关联性问题,提出了一种空间位置对齐的模型框架。更进一步,提出了一种基于排序的深度卷积网络,用于建模物体的类内和类间差异性。为了训练这个网络,设计了一种半监督的训练样本收集策略。该策略不需要任何对查询物体的先验知识,并且极大地减少了人工收集训练样本所需的成本。实验结果表明这一方法显著地提高了深度模型下示例检索的准确性。3.针对前背景的模糊性,从特征学习的角度,提出了一种多示例在线学习模型解决弱监督条件下的图像标注和物体定位问题。首先,在现有的多示例学习模型的基础上,改进了训练样本的选择和更新策略。改进后的策略能够收集准确多样的正样本以及有区分性的负样本,从而提高前背景的区分性。其次,设计了一个端到端的模型同时进行训练样本的选择和物体检测器的训练。最后,通过对示例标注和图像标注进行关联,从而通过一个模型联合学习图像标注和物体检测算法。实验结果表明,这一模型有效地提高了图像标注和物体定位的性能。4.从特征表示的角度对标签检索和物体定位问题进行了研究。具体地,本文提出了一种基于显著性的深度特征模型,改善基于矩形框的物体特征表示。显著性模型使得矩形框内背景区域的特征响应被抑制,而前景中重要的视觉区域的特征激活得到增强。这样的特征表示模型使得前景区域和背景区域的类内差异变小,类间差异变大,从而减少了前背景的模糊性。这一显著性特征模型可以与当前最好的弱监督物体检测模型融合,从而进行端到端的联合训练。这一方法在多个数据集上验证了其可靠性。
【学位授予单位】:北京邮电大学
【学位级别】:博士
【学位授予年份】:2017
【分类号】:TP391.41

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 张学军;郭建;;图像纹理分析的方法与应用[J];黑龙江科技信息;2009年16期
2 孟勇,洪丹辉,毛丹;测度熵在图像纹理分析中的应用[J];计算机应用与软件;2000年08期
3 吴涛;秦昆;;图像纹理特征数据挖掘的理论与方法探讨[J];计算机时代;2006年08期
4 方玲玲;王相海;;图像挖掘研究[J];计算机科学;2009年08期
5 高振宇;杨晓梅;龚剑明;金海;;图像复杂度描述方法研究[J];中国图象图形学报;2010年01期
6 刘勇,施万昌,徐玉兰;图像差异的分析与识别[J];复旦学报(自然科学版);2000年05期
7 罗沄,章毓晋,高永英;基于分析的图像有意义区域提取[J];计算机学报;2000年12期
8 李向阳,庄越挺,潘云鹤;基于内容的图像检索技术与系统[J];计算机研究与发展;2001年03期
9 王伟凝,余英林;图像的情感语义研究进展[J];电路与系统学报;2003年05期
10 陈世文;高燕;;基于内容的图像检索[J];中小企业管理与科技(上旬刊);2008年11期
中国重要会议论文全文数据库 前10条
1 杨国华;周晨波;阮久忠;郭冰;王刚;;基于自相关函数的非平面表面粗糙度的图像纹理研究[A];第十二届全国光学测试学术讨论会论文(摘要集)[C];2008年
2 王亮申;欧宗瑛;;利用SVM进行图像数据库检索[A];全面建设小康社会:中国科技工作者的历史责任——中国科协2003年学术年会论文集(下)[C];2003年
3 王云;董增寿;卓东风;;基于图像纹理和结构特征的燃烧指数的高温低氧火焰燃烧稳定性识别[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
4 朱为总;文振焜;明仲;欧阳杰;;基于支持向量回归机的相关反馈图像检索算法[A];图像图形技术研究与应用2009——第四届图像图形技术与应用学术会议论文集[C];2009年
5 彭复员;余西;武林;徐国华;;基于分形特征的水下图像模糊分类[A];第三届全国信息获取与处理学术会议论文集[C];2005年
6 张磊;朱磊;;一种综合图像纹理和灰度特征的分割算法[A];通信理论与信号处理新进展——2005年通信理论与信号处理年会论文集[C];2005年
7 王鹏;吴春亚;刘德利;刘亦智;刘献礼;;基于LabVIEW的钢球表面缺陷图像纹理分析与检测[A];2007'中国仪器仪表与测控技术交流大会论文集(一)[C];2007年
8 樊亚春;周明全;;基于图像关键特征的内容检索技术分析[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
9 朱军民;黄磊;刘昌平;;一种分级的电路板图像中的文本定位方法[A];第八届全国汉字识别学术会议论文集[C];2002年
10 钱林晓;王一涛;;对应试教育条件下学生学习行为的模型分析[A];2005年中国教育经济学年会会议论文集[C];2005年
中国重要报纸全文数据库 前2条
1 华凌;世界最薄泡沫屏幕可改变图像纹理[N];科技日报;2012年
2 范超;浅谈如何备战统计建模大赛[N];中国信息报;2011年
中国博士学位论文全文数据库 前10条
1 姜文晖;物体检索与定位技术研究[D];北京邮电大学;2017年
2 郑希源;基于多标记学习的图像标注关键技术研究[D];山东师范大学;2016年
3 王曙燕;医学图像智能分类算法研究[D];西北大学;2006年
4 唐俊华;科学数据库中基于内容图像检索技术研究[D];中国科学院研究生院(计算技术研究所);2004年
5 贾冬焱;血管造影图像的量化分析和应用研究[D];南方医科大学;2008年
6 段立娟;基于内容的图像检索与过滤关键技术研究[D];中国科学院研究生院(计算技术研究所);2002年
7 叶志鹏;基于语义分析的场景分类方法研究[D];哈尔滨工业大学;2017年
8 周向东;图像数据库检索中的关键技术研究[D];复旦大学;2003年
9 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
10 杨朝辉;计算机舌诊中裂纹舌图像的诊断分类研究[D];哈尔滨工业大学;2010年
中国硕士学位论文全文数据库 前10条
1 卢曾新;基于多普勒波的图像置乱算法及评价方法研究[D];辽宁大学;2015年
2 朱华东;基于内容的图像检索研究[D];江南大学;2015年
3 田红梅;日冕图像中暗化现象的检测与提取技术研究[D];西南交通大学;2015年
4 王艳芳;基于改进RPCA的非局部图像去噪算法研究[D];江西理工大学;2015年
5 蔡茂佼;基于曲线特征的视觉形状伺服的研究[D];上海交通大学;2015年
6 王亚星;基于分数阶傅里叶变换的人脸识别[D];郑州大学;2015年
7 罗妙辉;基于图像内容检索技术的纺织品图像侵权检测[D];浙江大学;2015年
8 冯文;多转子轴承复杂路径下微弱故障特征提取方法研究[D];北京化工大学;2015年
9 张喆;融合CT特征与纹理特征的图像检索算法[D];曲阜师范大学;2015年
10 杨文杰;基于MV空间相关性的图像错误掩盖方法的研究[D];电子科技大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026