收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

图像检索中的特征表示模型和多信息源融合方式的研究

陆文婷  
【摘要】:多媒体信息在人们的日常生活中起着越来越重要的作用。因而,如何在浩如烟海的多媒体数据库中快速、高效地检索到所需要的图像已成为一个非常有意义且具有挑战性的课题。本文着重研究了图像检索中的特征表示模型和多信息源融合的方式。 通常来讲,图像检索主要可以分为以下两类:基于文本的图像检索和基于内容的图像检索。早期的图像检索系统大部分以基于文本的图像检索为主,该方法主要通过简单地匹配用户输入的关键词和数据库中图像相应的文本描述的方式搜索相关的图像。这种方法需要事先以文字信息的方式标注数据库中的每一幅图像,这是一个目前还有待于进一步解决的难题,而且文本标注的质量将会直接影响到后续图像检索精度。随后基于内容的图像检索逐渐得到发展,该方法从图像本身出发,直接提取图像的底层视觉特征,并对基于这些视觉特征建立索引,从而实现检索。 本文首先重点研究了图像检索中图像的视觉特征表示方法。图像特征提取是图像检索中的关键步骤,如何从原始图像中提取具有较强表示能力的图像特征是图像检索技术的一个研究热点。目前用于表示图像的特征可以划分为底层视觉特征和高层语义特征。由于技术的限制,图像检索的特征一般是通过底层视觉特征来表达图像的高层语义。通常来讲,图像的底层视觉特征又可以分为全局特征和局部特征。与全局特征相比,大多数局部特征对图像的尺度缩放、旋转、仿射变换、光照变化等具有不变性,因此由局部特征来表示图像并建立相应的索引,可以取得比全局特征更准确的检索结果。其中SIFT特征因其卓越的性能和检测速度快的优点而被广泛使用,尤其是将SIFT特征与倒排文档技术(TF-IDF)相结合构成词袋模型(BoW)更是成为目前的主流方法。但原始BoW模型存在缺少空间信息和语义信息的不足的问题。为了缓解这一问题,本文深入探索BoW模型中视觉词汇之间的空间关系和语义关系,提出一个两级图像特征表示模型——短语袋模型,该模型不仅能够在BoW模型中增加空间信息,以及更好的表示图像所包含的语义信息,并且对于背景杂波也有一定的抑制作用。 本文的另一个重点研究内容是图像检索中多信息源的融合方式,即如何通过结合网络中与图像相关的其他多媒体信息、,如文本、语音、视频等信息源,从而提高图像检索的性能。在多信息源融合方式的探索方面,鉴于聚类和分类是图像检索的关键步骤,对后续图像检索的精度和性能有较大程度的影响,本文首先探索了近年来5类比较典型并且被广泛接受的图像聚类/分类算法,包括2类单一信息源的算法:基于文本的图像聚类/分类和基于图像内容的图像聚类/分类,以及融合多种信息源的3类多视角学习算法:特征级融合、语义级融合和内核级融合,并在此基础上比较各种分类算法的性能。通过比较,本文得到了以下初步结论:基于单一信息源的两种算法由于所含的信息量有限,往往无法达到较高的正确率;一旦融合了多种可用的信息源,其性能会有较大幅度的提高。然而,上述三类多视角学习算法都是首先独立地处理多个信息源的数据,然后在三个不同级别上对多个信息源进行融合,共同之处是忽略了多种信息源之间的交互。因此,在本课题的研究中,本文首先探索了不同信息源(如文本信息和图像信息)之间进行相互指导和帮助的可行性,然后基于此提出了两种多视角的学习方法:动态加权和基于图像区域的语义概念融合,从而有效地融合了来自多种信息源的数据,提高网络图像聚类/分类的性能,达到更好的检索效果。为了进一步提高上述两种多视角学习方法处理大规模数据的性能,本文又提出了一种多媒体信息融合的框架,该框架通过分析不同网络图像的特殊性质有效地融合了上述两种多视角学习算法,能够以相对较少的计算时间获得较高的分类性能,从而较好地处理大规模的网络多媒体数据,还可以解决实际应用中最常见的某些网络图像缺失相应的文本描述的问题。 除了研究上述问题,本文还进一步探索了网络图像与其相应的文本描述之间在语义层面上的“关联性”,并利用这种语义关联性增强图像分类的特征空间,本文将此过程称为迁移学习。该交叉域的迁移学习的方法可以通过未标注真实类别标签的网络多媒体数据完成有监督分类的学习任务。实验结果表明:通过迁移相关性知识,本文提出的基于交叉域相关性知识的分类方法不仅能够成功地将网络中多种相关的信息源有效地融合起来处理大规模的网络数据,而且可以较好地解决实际应用中部分多媒体目标对象存在的某种信息源缺失的问题。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 段立娟,高文,林守勋,马继涌;图像检索中的动态相似性度量方法[J];计算机学报;2001年11期
2 沈玉利,王蕙;基于图像与视频数据检索的分布式多媒体数据库系统融合技术研究[J];现代计算机;2001年10期
3 王朝晖,龚声蓉,唐国维;基于内容的图像检索中的一种多粒度组合查询方法[J];微电子学与计算机;2002年09期
4 王欣;基于WWW的图像检索技术[J];现代图书情报技术;2002年03期
5 陈清文;论基于内容的图像检索技术[J];中华医学图书情报杂志;2002年06期
6 陈晞,杨轶,董育宁;用于图像检索的MPEG-7形状描述子[J];电视技术;2003年04期
7 汪祖媛,庄镇泉,何劲松,王煦法;基于形状的小波变换系数广义高斯分布图像检索算法[J];电子学报;2003年05期
8 王真;图像搜索引擎特征及分类[J];内蒙古科技与经济;2005年17期
9 尚赵伟,张明新,沈钧毅,相明;基于双密度小波变换的纹理图像检索[J];西安交通大学学报;2005年10期
10 朱利华;冀小平;;小波模极大值法在图像检索中的应用[J];科技情报开发与经济;2007年03期
11 纪秀辉;周亮;;图像数据挖掘过程和方法的研究[J];硅谷;2009年03期
12 周船,朱枫,谈大龙;基于海底资源丰度的图像检索[J];信息与控制;2003年05期
13 王丽萍,邱飞岳;椭圆逼近形状轮廓的图像检索方法研究[J];浙江工业大学学报;2003年05期
14 牛蕾,倪林;基于内容的图像检索中的相关反馈算法[J];计算机工程与应用;2004年32期
15 陈少仿;颜色的空间分布密度与图像检索[J];现代计算机;2005年07期
16 周宁,杨传志,吴佳鑫;图像索引与检索的XML方法[J];现代图书情报技术;2005年09期
17 木拉提·哈米提;刘伟;童勤业;;纹理谱直方图与潜在语义标引在图像检索中的应用[J];科技通报;2006年03期
18 李丙春;;基于共生矩阵的图像纹理特征提取及应用[J];喀什师范学院学报;2006年06期
19 董文鸳;;国外图像搜索引擎比较分析及启示[J];图书馆杂志;2006年12期
20 巩艳华;朱爱红;代凌云;;基于颜色直方图的颜色特征提取[J];福建电脑;2007年05期
中国重要会议论文全文数据库 前10条
1 李凌伟;周荣贵;刘怡;;基于概念的图像检索方法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 牛晓晖;王妍;贾克斌;;基于信息突变的图像检索方法[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年
3 马帅;吴飞;杨易;邵健;;基于稀疏非负矩阵分解的图像检索[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
4 蔡念;张国宏;楼朋旭;戴青云;;基于形状和纹理的外观设计专利图像检索方法[A];第十五届全国图象图形学学术会议论文集[C];2010年
5 朱松豪;梁志伟;;用半监督学习方法实现图像检索[A];第二十九届中国控制会议论文集[C];2010年
6 王晗;滕鹏;梁玮;;使用稠密兴趣点包的非对称风景图像检索[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
7 吴成玉;邰晓英;赵杰煜;;基于颜色特征的图像检索方法与实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
8 王宇生;陈纯;;一种用于图像检索的纹理特征[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年
9 赵海英;彭宏;;基于最优近似反馈的图像检索[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
10 李太君;康耀红;温小斌;潘学松;;基于改进的颜色直方图模型的图像检索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
中国博士学位论文全文数据库 前10条
1 陆文婷;图像检索中的特征表示模型和多信息源融合方式的研究[D];北京邮电大学;2012年
2 张磊;基于机器学习的图像检索若干问题研究[D];山东大学;2011年
3 赵倩;基于内容的图像检索若干技术研究[D];上海大学;2012年
4 许相莉;基于智能计算的图像检索算法研究[D];吉林大学;2011年
5 赵玉凤;图像检索中自动标注技术的研究[D];北京交通大学;2009年
6 雷亮;互联网环境下图像检索若干问题研究[D];重庆大学;2011年
7 陈永健;基于内容的大规模图像检索关键技术研究[D];华中科技大学;2011年
8 吴伟文;基于计算机视觉的目标图像检索相关技术的研究[D];华南理工大学;2012年
9 段曼妮;图像挖掘在图像检索中的应用[D];中国科学技术大学;2009年
10 刘为;基于内容图像检索关键技术的研究[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 张彩华;基于颜色和纹理特征的图像检索[D];哈尔滨理工大学;2010年
2 张永权;图像检索中多特征组合和相关反馈技术研究[D];兰州理工大学;2010年
3 程涛;基于颜色和形状特征的图像检索[D];西北大学;2010年
4 黄会;基于半监督和集成学习的交互式图像检索算法研究[D];大连海事大学;2010年
5 张松林;基于纹理特征的图像检索方法研究[D];重庆大学;2010年
6 刘娟妮;基于显著区域提取和pLSA的图像检索方法[D];西北大学;2010年
7 郑爱彬;基于相关聚合直方图的图像检索研究[D];南京师范大学;2003年
8 聂加娜;融合颜色和形状特征的图像检索方法[D];曲阜师范大学;2010年
9 邓小飞;基于内容的实时图像检索系统[D];电子科技大学;2010年
10 冉令峰;基于图像检索的机动车安检机构监管系统关键技术的研究[D];哈尔滨工业大学;2010年
中国重要报纸全文数据库 前10条
1 ;图像检索新技术[N];中国知识产权报;2000年
2 砺岩;视觉形象识别系统正式投入使用[N];中国工商报;2010年
3 范宏国 程仕栋;神州视觉展峥嵘[N];人民日报海外版;2010年
4 上海纺织有限公司高级工程师 陈邦伟;橱窗陈列的视觉营销[N];中国纺织报;2011年
5 孙慨;2008中国摄影:在起伏中蓄聚力量[N];中国摄影报;2009年
6 李国敏;欧特克软件为《特种部队》装备震撼视觉武器[N];科技日报;2009年
7 本报记者 许泳;视觉标签:贴上就跑不掉![N];计算机世界;2010年
8 特约作者 红人氽氽;3D动作网游 激战2010[N];电脑报;2010年
9 通讯员 李慧 记者 王夏斐;2010杭州生活品质视觉点评摄影大赛揭晓[N];杭州日报;2010年
10 本报记者 丁磊;中科院启动产业造星计划[N];21世纪经济报道;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978