收藏本站
《山东大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

基于机器学习的图像检索若干问题研究

张磊  
【摘要】:近十年来,随着数码相机、拍照手机、带有摄像头的移动电脑的普及,数字图像得以大量涌现,而随着互联网技术的发展,特别是web 2.0技术的流行,图像的传播和扩散也变得越来越容易。如何快速、有效地组织和管理这些海量的图像信息,已经成为学术界和工业界共同关注的热点问题。近些年来,随着研究的深入,机器学习技术被广泛的应用于图像检索领域,例如图像标注、图像内容的分类、用户反馈的建模、图像搜索结果的排序、图像数据集的获取等等。 本文围绕机器学习框架下的图像检索这一研究主题,主要针对图像标注(image annotation)、图像重排序(image re-ranking)和物体检测(object detection)这三个问题展开研究。论文的主要工作与创新体现在以下几个方面: 1:图像标注的目的是根据图像的视觉内容来确定对应的文本语义描述。本文提出了一种把词汇间的语义关系嵌入到多类支持向量机中的图像标注方法。首先,每幅图像被分成5个固定大小的块(block),对于训练集中的图像,手工指定每个标注词对应于哪个块,词汇间的语义关系通过共现矩阵来计算。然后,利用MPEG-7视觉描述子表示每个块的视觉特征。为了减少特征维数,采用了一种名为mRMR(最小重复性最大相关性)的特征选择方法。同时针对Corel 5000数据集中的80个语义词,训练了一个多类支持向量机分类器。最后,把支持向量机分类器的后验概率输出和词汇间语义关系集成到一起,用于得到图像的标注词。在Corel 5000数据集中的实验表明此方法是有效的。 2:图像重排序是指在原始搜索结果排序的基础上,通过利用图像内容、挖掘数据关联、或者借鉴领域知识和人工交互,对原始搜索结果进行重排序提升用户满意度的过程。当前的商业搜索引擎尽管在语义相关性上取得很大进步,但由于较少利用图像内容本身,造成图像排序结果缺乏视觉多样性。而一些研究者提出的纯粹基于聚类的方法,在取得视觉多样性的同时,又有把不相关图像排在前面的风险。 本文提出了一种同时兼顾语义相关性和视觉多样性的图像重排序方法,本算法是一种混合方法,把Leuken等人提出的相互投票算法和Deselaers等人提出的贪心算法综合起来,以同时获得两种方法的优点。首先,每幅图像根据视觉相似度为其它图像投票,得票数最高的一些图像作为候选者。然后利用一个受限的轻量级贪心算法来找出最相关和最有新鲜感的图像作为聚类的中心。在计算视觉相似度时,混合了不同的视觉特征,包括颜色、纹理和主题特征。同时利用PLSA和LDA两种潜在主题模型作为降维手段,并在实验中比较了这两种主题模型,并讨论了综合主题特征的优点。首次引入了聚类查全率和NDCG的调和平均值作为衡量排序性能的标准。对Google和Bing的初始排序结果做了大量的重排序实验,与学术界领先的算法做了比较,通过计算聚类召回率、F1值、聚类召回率与NDCG的调和平均值表明,本文方法是可行的。 3:物体检测的目的在于不仅需要判断出某图像中有无该物体,还需要指出该物体在图像中的具体位置。当前领先的物体检测技术主要采用有监督的机器学习方法并组合多种特征,这些基于有监督学习的方法需要大量的训练数据,但标注用于物体检测的训练数据非常耗时,需要大量的人力。虽然一些研究者提出可以利用web图像或者半监督学习技术来获取物体的图像库,但这些图像库中由于没有物体的具体位置信息,一般情况下只能用于物体的分类。 本文首次提出可以利用Flickr中的notes数据来获取物体检测数据集,本方法的目的是希望能够以较少的人力提供用于物体检测的训练数据,并且保证训练数据的高质量,这些可以通过挖掘Flickr中的notes数据来实现。Notes数据是由用户在图像中添加的感兴趣的区域(矩形框)及其元数据,包括矩形框的位置、大小以及文本。本文的方法首先通过文本挖掘找到与物体有语义关联的初始图像集,然后从初始集中人工选择出高质量图像作为种子集,最后这个种子集通过增量式的主动学习算法来扩展。在PASCAL VOC2007和NUS-WIDE数据集中做了实验,结果表明本方法获取的数据集可以作为传统数据集的补充,甚至替代传统数据集。
【学位授予单位】:山东大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP391.41

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前2条
1 程姝;基于内容的图像检索算法研究[D];武汉理工大学;2012年
2 秦薇薇;基于红外视频的火灾探测算法研究[D];西安建筑科技大学;2012年
【参考文献】
中国博士学位论文全文数据库 前1条
1 段华;支持向量机的增量学习算法研究[D];上海交通大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 韩强;;基于广义Hough变换的手写文档整词定位[J];安徽电子信息职业技术学院学报;2011年05期
2 杨绪兵,韩自存;ε不敏感的核Adaline算法及其在图像去噪中的应用[J];安徽工程科技学院学报(自然科学版);2003年04期
3 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
4 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
5 郭立萍;唐家奎;米素娟;张成雯;赵理君;;基于支持向量机遥感图像融合分类方法研究进展[J];安徽农业科学;2010年17期
6 管翠萍;;药物靶标G蛋白偶联受体的识别预测[J];安徽农业科学;2010年24期
7 程刚;郑小华;阳锋;徐祖舰;;三维全景视觉技术在农业机器人中的应用[J];安徽农业科学;2010年34期
8 刘婷婷;;基于支持向量机的水稻纹枯病识别研究[J];安徽农业科学;2011年28期
9 顾红飞,孙光灵,屠菁;一种基于颜色布局的压缩图像检索方法[J];安庆师范学院学报(自然科学版);2005年02期
10 冯学军;;最小二乘支持向量机的研究与应用[J];安庆师范学院学报(自然科学版);2009年01期
中国重要会议论文全文数据库 前10条
1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 刘善磊;张亮;;基于相位相关和SURF算法的关键帧实时匹配研究[A];江苏省测绘学会2011年学术年会论文集[C];2011年
3 隋树林;孙立宏;姚文龙;袁健;;融合改进UKF/SIFT信息的自主光学导航方法[A];第二十六届中国控制会议论文集[C];2007年
4 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
5 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
6 汪力;叶桦;夏良正;;利用特征点定位嘴巴[A];第二十六届中国控制会议论文集[C];2007年
7 ;Loop-closing By Using SIFT Features for Mobile Robots[A];第二十六届中国控制会议论文集[C];2007年
8 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
9 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
10 蒋少华;桂卫华;阳春华;唐朝晖;蒋朝辉;;基于主元分析与支持向量机的方法及其在密闭鼓风炉过程监控诊断中的应用[A];第二十七届中国控制会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 赵莹;半监督支持向量机学习算法研究[D];哈尔滨工程大学;2010年
2 王玉全;基于全景视觉的移动机器人同时定位与地图创建方法研究[D];哈尔滨工程大学;2010年
3 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
4 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
5 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
6 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
7 王作为;具有认知能力的智能机器人行为学习方法研究[D];哈尔滨工程大学;2010年
8 邬俊;基于交互式语义推理的图像检索算法研究[D];大连海事大学;2010年
9 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
10 柏坚;非线性数学地质模型研究及在滇东南金矿成矿预测中的应用[D];中国地质大学(北京);2010年
中国硕士学位论文全文数据库 前10条
1 朱杰;一种基于聚类的支持向量机反问题求解算法[D];河北大学;2007年
2 宋抗;压缩机活塞圆度误差数字检测系统研究[D];河南理工大学;2010年
3 陈忠翔;基于立体视觉的三维重建方法研究[D];南昌航空大学;2010年
4 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
5 雒燕飞;地质灾害应急地理信息数据库设计及其应用[D];山东科技大学;2010年
6 唐红梅;基于辐射与空间信息的遥感图像检索[D];山东科技大学;2010年
7 倪希亮;基于尺度不变特征的多源遥感影像配准[D];山东科技大学;2010年
8 贾伟洁;SAR影像与光学影像配准研究[D];山东科技大学;2010年
9 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
10 任天宇;自稳定航拍系统算法与设计[D];长春理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 沈诗林;于春雨;袁非牛;陈志斌;张永明;;一种基于视频图像相关性的火灾火焰识别方法[J];安全与环境学报;2007年06期
2 何海涛;秦燕芬;曹凤翔;;分类算法中基于差别矩阵的属性约简方法[J];燕山大学学报;2011年04期
3 杨俊;王润生;;基于视频图像分析的火燃检测及其应用[J];电视技术;2006年08期
4 周杰,冯前进,林亚忠,陈武凡;CT图像特征的自动获取与检索新方法[J];第一军医大学学报;2004年05期
5 杨育彬,陈世福,林珲;一种基于颜色连通的图像纹理检索新方法[J];电子学报;2005年01期
6 范九伦;赵凤;;灰度图像的二维Otsu曲线阈值分割法[J];电子学报;2007年04期
7 汪华章;何小海;宰文姣;王炜;;基于色彩量化及索引的图像检索[J];光电子.激光;2008年02期
8 孟繁杰;郭宝龙;李新伟;郭磊;;基于兴趣点凸包的图像检索方法[J];光电子.激光;2010年06期
9 杜建华;张认成;;基于傅里叶变换红外光谱探测的火灾早期过程特征信息研究[J];光谱学与光谱分析;2008年03期
10 张慧;王宏琦;孙显;;结合颜色和纹理特征的树冠提取方法[J];光学技术;2008年04期
中国硕士学位论文全文数据库 前10条
1 李莹;基于图像特征的隧道运动火源视频火焰探测技术研究[D];中国科学技术大学;2011年
2 于兴网;粗糙集属性约简算法在数据挖掘中的研究[D];重庆大学;2004年
3 斯白露;基于感兴趣区域的图像检索方法[D];中国科学院研究生院(计算技术研究所);2002年
4 陈金男;基于水平集方法的图像分割研究[D];燕山大学;2007年
5 王志龙;基于粗糙集理论与支持向量机的数据挖掘方法算法研究[D];兰州大学;2007年
6 王升;主动轮廓模型的研究及其改进模型在目标检测中的应用[D];浙江大学;2008年
7 职占江;基于Chan-Vese模型的图像分割算法[D];河南大学;2008年
8 李洪玉;基于图像处理的大空间火灾监测技术的研究[D];重庆大学;2008年
9 蔡鑫;基于红外技术的野外火灾探测系统研究[D];南京航空航天大学;2008年
10 姚斌;动态轮廓线模型在图像分割中的应用与研究[D];西安电子科技大学;2008年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱国强,刘士荣,俞金寿;支持向量机及其在函数逼近中的应用[J];华东理工大学学报;2002年05期
2 孙德山,吴今培,侯振挺,肖健华;基于SVR的混沌时间序列预测[J];计算机工程与应用;2004年02期
3 安金龙,王正欧;一种适合于增量学习的支持向量机的快速循环算法[J];计算机应用;2003年10期
4 王定成,方廷健,高理富,马永军;支持向量机回归在线建模及应用[J];控制与决策;2003年01期
5 张学工;关于统计学习理论与支持向量机[J];自动化学报;2000年01期
6 萧嵘 ,王继成 ,孙正兴 ,张福炎;一种SVM增量学习算法α-ISVM[J];软件学报;2001年12期
7 全勇,杨杰,姚莉秀,叶晨洲;基于连续过松弛方法的支持向量回归算法(英文)[J];软件学报;2004年02期
8 叶美盈,汪晓东,张浩然;基于在线最小二乘支持向量机回归的混沌时间序列预测[J];物理学报;2005年06期
9 曾文华,马健;一种新的支持向量机增量学习算法[J];厦门大学学报(自然科学版);2002年06期
10 张浩然,韩正之,李昌刚;基于支持向量机的非线性系统辨识[J];系统仿真学报;2003年01期
【相似文献】
中国期刊全文数据库 前10条
1 张颖彬;孟嗣仪;刘云;;基于SVM的相关反馈图像分类和检索方案[J];铁路计算机应用;2011年08期
2 欧阳军林;刘建勋;曹步清;;基于LBSVM机器学习的相关反馈图像检索[J];计算机工程与应用;2009年02期
3 顾林;唐昭琳;;水稻指纹图谱的计算机检索方法[J];计算机工程与设计;2011年01期
4 段立娟,高文,林守勋,马继涌;图像检索中的动态相似性度量方法[J];计算机学报;2001年11期
5 沈玉利,王蕙;基于图像与视频数据检索的分布式多媒体数据库系统融合技术研究[J];现代计算机;2001年10期
6 王朝晖,龚声蓉,唐国维;基于内容的图像检索中的一种多粒度组合查询方法[J];微电子学与计算机;2002年09期
7 王欣;基于WWW的图像检索技术[J];现代图书情报技术;2002年03期
8 陈清文;论基于内容的图像检索技术[J];中华医学图书情报杂志;2002年06期
9 陈晞,杨轶,董育宁;用于图像检索的MPEG-7形状描述子[J];电视技术;2003年04期
10 汪祖媛,庄镇泉,何劲松,王煦法;基于形状的小波变换系数广义高斯分布图像检索算法[J];电子学报;2003年05期
中国重要会议论文全文数据库 前10条
1 李凌伟;周荣贵;刘怡;;基于概念的图像检索方法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 牛晓晖;王妍;贾克斌;;基于信息突变的图像检索方法[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年
3 马帅;吴飞;杨易;邵健;;基于稀疏非负矩阵分解的图像检索[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
4 蔡念;张国宏;楼朋旭;戴青云;;基于形状和纹理的外观设计专利图像检索方法[A];第十五届全国图象图形学学术会议论文集[C];2010年
5 朱松豪;梁志伟;;用半监督学习方法实现图像检索[A];第二十九届中国控制会议论文集[C];2010年
6 王晗;滕鹏;梁玮;;使用稠密兴趣点包的非对称风景图像检索[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
7 吴成玉;邰晓英;赵杰煜;;基于颜色特征的图像检索方法与实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
8 王宇生;陈纯;;一种用于图像检索的纹理特征[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年
9 赵海英;彭宏;;基于最优近似反馈的图像检索[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
10 李太君;康耀红;温小斌;潘学松;;基于改进的颜色直方图模型的图像检索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
中国重要报纸全文数据库 前10条
1 ;图像检索新技术[N];中国知识产权报;2000年
2 本报记者 余建斌;机器学习与互联网搜索[N];人民日报;2011年
3 黎骊/文 [美] Tom M.Mitchell 著;机器学习与智能化社会[N];中国邮政报;2003年
4 微软中国研究院 陈正 李明镜 马维英;互联网上图像信息检索[N];计算机世界;2001年
5 刘阳子;中国外观设计专利智能检索系统开通[N];中国知识产权报;2008年
6 记者 何边;网络化激活人工智能[N];计算机世界;2001年
7 本报记者 张晔通讯员 李玮;周志华:永不墨守成规[N];科技日报;2008年
8 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年
9 本报通讯员 阳雄 周振彦;李建平:我要让世界颤动一下[N];科技日报;2002年
10 何清 史忠植 王伟;搜索引擎的前沿技术[N];计算机世界;2006年
中国博士学位论文全文数据库 前10条
1 张磊;基于机器学习的图像检索若干问题研究[D];山东大学;2011年
2 许相莉;基于智能计算的图像检索算法研究[D];吉林大学;2011年
3 雷亮;互联网环境下图像检索若干问题研究[D];重庆大学;2011年
4 何宁;图像检索中跨模语义信息获取方法研究[D];武汉大学;2013年
5 陈永健;基于内容的大规模图像检索关键技术研究[D];华中科技大学;2011年
6 陆文婷;图像检索中的特征表示模型和多信息源融合方式的研究[D];北京邮电大学;2012年
7 吴伟文;基于计算机视觉的目标图像检索相关技术的研究[D];华南理工大学;2012年
8 段曼妮;图像挖掘在图像检索中的应用[D];中国科学技术大学;2009年
9 刘为;基于内容图像检索关键技术的研究[D];吉林大学;2010年
10 王上;基于内容的图像检索与分类若干技术的研究[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 张彩华;基于颜色和纹理特征的图像检索[D];哈尔滨理工大学;2010年
2 程涛;基于颜色和形状特征的图像检索[D];西北大学;2010年
3 黄会;基于半监督和集成学习的交互式图像检索算法研究[D];大连海事大学;2010年
4 张松林;基于纹理特征的图像检索方法研究[D];重庆大学;2010年
5 郑爱彬;基于相关聚合直方图的图像检索研究[D];南京师范大学;2003年
6 聂加娜;融合颜色和形状特征的图像检索方法[D];曲阜师范大学;2010年
7 张永权;图像检索中多特征组合和相关反馈技术研究[D];兰州理工大学;2010年
8 邓小飞;基于内容的实时图像检索系统[D];电子科技大学;2010年
9 冉令峰;基于图像检索的机动车安检机构监管系统关键技术的研究[D];哈尔滨工业大学;2010年
10 王冰梅;基于多特征融合的图像检索方法研究与实现[D];大庆石油学院;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026