收藏本站
《中国科学技术大学》 2009年
收藏 | 手机打开
二维码
手机客户端打开本文

互联网环境下大规模图像的内容分析、检索和自动标注的研究

王长虎  
【摘要】: 随着互联网和数字摄影设备的普及和发展,互联网上的图像数量飞速增长。一方面,互联网上的海量图像吸引了越来越多的用户;另一方面,越来越丰富的图像资源使用户难以在浩如烟海的数据中找到其真正需要的信息。这使得快速、有效的图像检索技术成为商业界和学术界的一个重要研究方向。 当前,互联网图像检索主要分成两大类:基于文本的图像检索(text-basedimage retrieval,简称TBIR),和基于内容的图像检索(content-based imageretrieval,简称CBIR)。TBIR在商业图像搜索引擎中被广泛使用。在TBIR系统中,互联网图像的文本信息用来索引和搜索图像。因此,图像文本标注的质量成为TBIR中的一个重要的问题。CBIR是学术界中一个非常流行的方向。在CBIR系统中,图像的视觉内容被用来索引。它面临的最主要的困难是语义鸿沟问题,即图像的低层内容特征(如颜色),不能有效的描述高层语义(如“狗”)。 在本文中,我们尝试充分利用互联网图像丰富的文本信息和视觉信息,来解决上面提到的几个问题。我们对自动图像标注、图像标注改善、减小互联网图像检索中的语义鸿沟、基于对象的图像检索等问题进行了深入的研究。另外,为了更好地处理和利用互联网上的海量数据,更有效地帮助用户的在线检索,我们在设计相关算法和实现检索系统的时候,还特别地注意了其处理大规模图像的能力以及实时性。本文主要成果和创新之处包括以下几个方面: 1.讨论并分析了自动图像标注问题,提出了一个多标记稀疏编码的框架来进行特征提取和分类,并把它应用到自动图像标注中。我们认为具有部分重叠标记的两张图像之间的语义相似度应该以一种重构的方式而不是一对一的方式来度量。因此,在这个框架中,图像标记向量之间的语义相似度,以及图像特征向量之间的语义相似度,都基于一对多的l~1稀疏重构/编码来度量。 2.讨论并分析了大规模的自动图像标注问题,并提出了一个基于搜索的图像标注框架。在这个框架下,我们给用户提供了一个在线图像标注服务,可以对用户提交的任意图像进行实时的标注。我们从互联网上收集了一个大规模的图像库,并把它用做训练集来标注任意一张图像。快速检索技术的应用和大规模图像库的使用保证了我们提出的基于搜索的图像标注框架处理大规模图像的能力及实时性。 3.讨论并分析了图像标注改善问题。我们把图像标注改善问题表述成一个马尔可夫过程,并在这个框架下解释了已有的图像标注改善工作。针对已有工作的问题,我们提出了一个基于内容的图像标注改善算法。马尔可夫过程表示的有效性,以及待标注图像与训练集中图像的内容信息的充分利用,使得我们提出的算法很大程度上改善了已有算法中存在的若干问题。 4.讨论并分析了互联网上基于内容的图像检索中的语义鸿沟问题,并提出了一个基于排序的距离度量学习算法。通过互联网图像丰富的文本信息的引导,我们试图在视觉空间中学出一个新的距离度量,使得给定一张查询图像,基于这个新的距离度量,我们可以在图像库中检索到与查询图像语义上更相关的图像。基于这个新的距离度量学习算法,我们提出了一个大规模的基于内容的图像检索(CBIR)框架,并在2.4 million规模的互联网图像库上实现了一个实时的CBIR检索系统。 5.讨论并分析了用多实例半监督学习(MISSL)算法来解决基于对象的图像检索问题。我们针对MISSL问题提出了一个新的正则化框架。基于这个框架,我们提出了一个基于图的多实例学习(GMIL)算法来解决MISSL问题。同样,在这个框架下,GMIL可以分别退化成一个新的标准多实例算法(GMIL-M)和一个标准半监督学习算法(GMIL-S)。我们从理论上证明了GMIL-S算法具有闭式解,以及GMIL和GMIL-M的迭代解的收敛性。我们用GMIL算法来解决基于对象的图像检索问题,实验结果验证了GMIL算法的有效性。
【学位授予单位】:中国科学技术大学
【学位级别】:博士
【学位授予年份】:2009
【分类号】:TP391.41

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前3条
1 郑钰;基于多特征集成的图像自动标注方法研究[D];西北农林科技大学;2011年
2 宿洪禄;结构半监督学习算法及其应用研究[D];苏州大学;2010年
3 刘小红;图像检索的关键问题研究[D];中南大学;2011年
【共引文献】
中国期刊全文数据库 前10条
1 韩强;;基于广义Hough变换的手写文档整词定位[J];安徽电子信息职业技术学院学报;2011年05期
2 程刚;郑小华;阳锋;徐祖舰;;三维全景视觉技术在农业机器人中的应用[J];安徽农业科学;2010年34期
3 何海燕;施培蓓;;基于改进AdaBoost算法的行人检测方法[J];安庆师范学院学报(自然科学版);2009年03期
4 吴慧兰;刘国栋;刘炳国;胡涛;浦昭邦;;ICF实验靶定位技术研究[J];半导体光电;2008年05期
5 陈京;袁保宗;刘渭滨;;多视点标定图像的交替迭代度量重建方法[J];北京交通大学学报;2012年02期
6 周峰;刘辉;李超峰;;SIFT算法在图像配准中的应用[J];办公自动化;2009年22期
7 刘彬;叶丽娜;;一种基于SIFT特征的序列图像拼接算法[J];兵工自动化;2009年06期
8 刘焕敏;王华;段慧芬;;一种改进的SIFT双向匹配算法[J];兵工自动化;2009年06期
9 彭勃;周文晖;刘济林;;基于Harris角点检测的立体视觉里程计[J];兵工学报;2007年12期
10 陈冰;赵亦工;李欣;;基于高斯尺度空间的末制导目标跟踪方法[J];兵工学报;2009年05期
中国重要会议论文全文数据库 前10条
1 刘善磊;张亮;;基于相位相关和SURF算法的关键帧实时匹配研究[A];江苏省测绘学会2011年学术年会论文集[C];2011年
2 隋树林;孙立宏;姚文龙;袁健;;融合改进UKF/SIFT信息的自主光学导航方法[A];第二十六届中国控制会议论文集[C];2007年
3 汪力;叶桦;夏良正;;利用特征点定位嘴巴[A];第二十六届中国控制会议论文集[C];2007年
4 ;Loop-closing By Using SIFT Features for Mobile Robots[A];第二十六届中国控制会议论文集[C];2007年
5 周凯;范瑞霞;李位星;;一种基于SIFT的MeanShift-粒子滤波融合跟踪算法[A];第二十九届中国控制会议论文集[C];2010年
6 ;Rapid Target Recognition and Tracking under Large Scale Variation Using Semi-Naive Bayesian[A];第二十九届中国控制会议论文集[C];2010年
7 ;A High-level Image Sequence Fusion Algorithm for Human Detection[A];第二十九届中国控制会议论文集[C];2010年
8 邹丽晖;陈杰;张娟;窦丽华;;一种基于时空域流形的视频序列图像拼接算法[A];第二十九届中国控制会议论文集[C];2010年
9 ;Machine Vision Based Flotation Froth Mobility Analysis[A];第二十九届中国控制会议论文集[C];2010年
10 孙明竹;赵新;程小燕;孙程;卢桂章;;面向复杂作业的微操作机器人关键技术研究[A];第二十九届中国控制会议论文集[C];2010年
中国硕士学位论文全文数据库 前10条
1 宋抗;压缩机活塞圆度误差数字检测系统研究[D];河南理工大学;2010年
2 陈忠翔;基于立体视觉的三维重建方法研究[D];南昌航空大学;2010年
3 雒燕飞;地质灾害应急地理信息数据库设计及其应用[D];山东科技大学;2010年
4 唐红梅;基于辐射与空间信息的遥感图像检索[D];山东科技大学;2010年
5 倪希亮;基于尺度不变特征的多源遥感影像配准[D];山东科技大学;2010年
6 贾伟洁;SAR影像与光学影像配准研究[D];山东科技大学;2010年
7 任天宇;自稳定航拍系统算法与设计[D];长春理工大学;2010年
8 李跃;三维运动估计在织物动态仿真中的应用[D];浙江理工大学;2010年
9 娄铮铮;sIB算法在图像无监督分类中的应用研究[D];郑州大学;2010年
10 王博;全景视觉智能移动机器人固有环境定位[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 戴剑波;叙词在网络环境中的应用[J];国家图书馆学刊;2004年01期
2 陈天华;;图像检索技术研究与发展[J];北京工商大学学报(自然科学版);2008年06期
3 许亚茹;基于内容的图像检索与MPEG-7[J];电子科技;2004年10期
4 黄祥林,沈兰荪;基于内容的图像检索技术研究[J];电子学报;2002年07期
5 张菁;沈兰荪;David Dagan Feng;;基于视觉感知的图像检索的研究[J];电子学报;2008年03期
6 侯翠琴;焦李成;;基于图的Co-Training网页分类[J];电子学报;2009年10期
7 王斌;俞能海;;一种针对大规模网络图像的自动标注改善算法[J];电子与信息学报;2009年02期
8 洪沙;张建勋;;基于图像颜色特征检索技术的材料腐蚀监测系统[J];重庆大学学报(自然科学版);2006年10期
9 尚赵伟;唐远炎;刘正岐;姚同庆;;基于多小波统计特征的纹理图像检索[J];重庆大学学报(自然科学版);2007年09期
10 尚赵伟;唐远炎;房斌;郎方年;;基于相对熵和复小波变换的纹理图像检索[J];重庆大学学报;2008年05期
中国硕士学位论文全文数据库 前10条
1 安磊;一种基于遗传算法的数据挖掘技术的研究与应用[D];河海大学;2001年
2 李立红;基于内容的图像浏览和检索及实验系统的开发[D];西安科技大学;2005年
3 刘亘轶;基于内容的图像检索关键技术研究与系统设计[D];西安电子科技大学;2006年
4 刘建;高维数据的本征维数估计方法研究[D];国防科学技术大学;2005年
5 古毅;基于内容的图像检索中索引技术的研究及系统实现[D];重庆大学;2006年
6 任雪梅;图像颜色特征检索算法的研究及DSP实现[D];吉林大学;2007年
7 丁艳春;基于图像语义和内容的半自动标注系统[D];浙江大学;2008年
8 游前慧;基于核密度的半监督学习算法在视频语义标注中的应用[D];北京交通大学;2008年
9 向前;基于本体的图像检索系统[D];北京交通大学;2008年
10 赖欣;基于相关反馈和综合特征的图像内容检索系统研究和实现[D];电子科技大学;2008年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 黄勇辉;协同图像检索与标注[D];重庆大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 张菁;沈兰荪;David Dagan Feng;;基于视觉感知的图像检索的研究[J];电子学报;2008年03期
2 周海英;;图像的语义关联与图像索引[J];电脑开发与应用;2011年08期
3 于承敏;金磊;;基于支持向量机的相关反馈算法研究[J];聊城大学学报(自然科学版);2007年02期
4 张志强;;一种新的基于改进聚类检索算法的CBIR系统研究[J];计算机科学;2008年08期
5 贺广南;杨育彬;;基于流形学习的图像检索算法研究[J];山东大学学报(工学版);2010年05期
6 黄启宏;刘钊;;基于多超平面支持向量机的图像语义分类算法(英文)[J];光电工程;2007年08期
7 王小玲;谢康林;;基于虚拟关联反馈与聚类的图像检索技术研究[J];计算机工程与设计;2008年06期
8 段立娟,高文,林守勋,马继涌;图像检索中的动态相似性度量方法[J];计算机学报;2001年11期
9 沈玉利,王蕙;基于图像与视频数据检索的分布式多媒体数据库系统融合技术研究[J];现代计算机;2001年10期
10 王朝晖,龚声蓉,唐国维;基于内容的图像检索中的一种多粒度组合查询方法[J];微电子学与计算机;2002年09期
中国重要会议论文全文数据库 前10条
1 马帅;吴飞;杨易;邵健;;基于稀疏非负矩阵分解的图像检索[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
2 李凌伟;周荣贵;刘怡;;基于概念的图像检索方法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
3 卢清;赵治栋;;基于稀疏编码阈值的平移不变法心电信号去噪[A];浙江省信号处理学会2011学术年会论文集[C];2011年
4 牛晓晖;王妍;贾克斌;;基于信息突变的图像检索方法[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年
5 蔡念;张国宏;楼朋旭;戴青云;;基于形状和纹理的外观设计专利图像检索方法[A];第十五届全国图象图形学学术会议论文集[C];2010年
6 尚丽;;使用正态可逆高斯密度模型的非负稀疏编码收缩技术实现图像消噪[A];苏州市自然科学优秀学术论文汇编(2008-2009)[C];2010年
7 朱松豪;梁志伟;;用半监督学习方法实现图像检索[A];第二十九届中国控制会议论文集[C];2010年
8 朱岩;赵旭;刘允才;;基于稀疏编码和局部时空特征的人体动作识别[A];第十五届全国图象图形学学术会议论文集[C];2010年
9 王晗;滕鹏;梁玮;;使用稠密兴趣点包的非对称风景图像检索[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
10 吴成玉;邰晓英;赵杰煜;;基于颜色特征的图像检索方法与实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国重要报纸全文数据库 前10条
1 ;图像检索新技术[N];中国知识产权报;2000年
2 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年
3 刘阳子;中国外观设计专利智能检索系统开通[N];中国知识产权报;2008年
4 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年
5 本报通讯员 阳雄 周振彦;李建平:我要让世界颤动一下[N];科技日报;2002年
6 陈立娜;互联网上的图像搜索引擎[N];网络世界;2000年
7 《金周刊》记者 杨蔼新;世纪超星:抢占数字图书市场[N];中国经营报;2001年
8 李杰陈 晓勤 郑泽民 张云霞;中国电信“全球眼”力助汽车保险业务[N];人民邮电;2007年
9 田彩霞;世界经济不景气,微利图库却逢春[N];中国摄影报;2009年
10 电脑商报记者 冯华中;佳能:站在中国看未来[N];电脑商报;2011年
中国博士学位论文全文数据库 前10条
1 王长虎;互联网环境下大规模图像的内容分析、检索和自动标注的研究[D];中国科学技术大学;2009年
2 刘为;基于内容图像检索关键技术的研究[D];吉林大学;2010年
3 段曼妮;图像挖掘在图像检索中的应用[D];中国科学技术大学;2009年
4 邬俊;基于交互式语义推理的图像检索算法研究[D];大连海事大学;2010年
5 赵玉凤;图像检索中自动标注技术的研究[D];北京交通大学;2009年
6 邱兆文;面向用户的Web图像检索关键技术研究[D];哈尔滨工业大学;2009年
7 许相莉;基于智能计算的图像检索算法研究[D];吉林大学;2011年
8 陈永健;基于内容的大规模图像检索关键技术研究[D];华中科技大学;2011年
9 雷亮;互联网环境下图像检索若干问题研究[D];重庆大学;2011年
10 陆文婷;图像检索中的特征表示模型和多信息源融合方式的研究[D];北京邮电大学;2012年
中国硕士学位论文全文数据库 前10条
1 黄会;基于半监督和集成学习的交互式图像检索算法研究[D];大连海事大学;2010年
2 张永权;图像检索中多特征组合和相关反馈技术研究[D];兰州理工大学;2010年
3 刘娟妮;基于显著区域提取和pLSA的图像检索方法[D];西北大学;2010年
4 张彩华;基于颜色和纹理特征的图像检索[D];哈尔滨理工大学;2010年
5 程涛;基于颜色和形状特征的图像检索[D];西北大学;2010年
6 张松林;基于纹理特征的图像检索方法研究[D];重庆大学;2010年
7 郑爱彬;基于相关聚合直方图的图像检索研究[D];南京师范大学;2003年
8 聂加娜;融合颜色和形状特征的图像检索方法[D];曲阜师范大学;2010年
9 邓小飞;基于内容的实时图像检索系统[D];电子科技大学;2010年
10 冉令峰;基于图像检索的机动车安检机构监管系统关键技术的研究[D];哈尔滨工业大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026