收藏本站
收藏 | 论文排版

基于互联网数据集的图像标注技术研究

荚济民  
【摘要】: 随着数码设备的日益普及以及互联网技术的迅速发展,Web图像资源越来越丰富。但由于Web数据具有多样性、复杂性和无规则性等特点,如何快速、准确地从海量Web资源中查找用户感兴趣的图像成为一项非常具有挑战性的任务。解决这一问题的重要途径就是通过对互联网图像进行自动图像标注,建立图像底层视觉内容与高层语义之间的联系,并利用标注词对图像进行索引。近年来,以Flickr为代表的图片共享社区的兴起与繁荣也让图像标注在Web 2.0环境下被赋予了新的生命。此外,自动图像标注在家庭影集的管理、医学图像检索、商标检索和人脸识别等方面都有着广泛的应用。 由于图像数量的巨大,依靠手工对图像进行标注费用昂贵,已经不能满足实际的需要。从标注使用的训练集来看,自动图像标注技术经历了两个阶段:第一个阶段可以看成是在有限数据集上的图像标注,利用一些传统的机器学习、物体识别的方法建立图像底层特征和高层语义的联系,如基于分类器的方法、基于跨媒体相关的方法、基于翻译模型的方法以及基于隐变量的生成式模型方法等;第二个阶段是基于互联网数据集的图像标注方法,这种方法更多的是从标注的框架和效率入手,充分利用了互联网的丰富资源,大大拓展了训练集的范围,因而更符合互联网环境下图像标注的实际需要,也是近年来图像标注研究的热点。 本文主要对基于互联网数据集的图像标注中的一些关键问题进行研究,主要成果和创新之处包括以下几个方面: 讨论了构建互联网标注词词典的重要性,研究了如何从浩如烟海的互联网词汇中选择合适的标注词集合,并分析了词典中词语需要满足的条件。论文根据图片共享社区中词语的统计特性,提出了一种基于随机游走的标注词重要性建模方法,词语的重要性是根据用户的历史标注情况以及词语之间的相互关系衡量的,然后根据词语的重要性排序构建标注词词典。此外,还根据图片共享社区提供的标注词的丰富的语义资源,对带有初始关键词的互联网图像标注进行语义消歧,通过寻找待标注图像在图像共享社区中的合适的语义类,减少“语义鸿沟”的影响,使最后学习出的标注词语义更加一致。 提出利用多模态相互加强原理进行图像标注。首先给定单幅图像,利用基本图像标注模型得到初始标注词,然后在基于随机游走的图像标注优化框架的基础上,通过标注词相关图和图像内容相关图之间相互加强原理,利用稳定状态下的新的相关性进行优化,可以更好地保证图像内容和最终标注词之间的关联,同时也保持了标注词的语义一致性。由于互联网图像所在网页的文本提供了丰富的语义信息,我们提出利用网页文档之间相似性与正文中命名实体的相互加强原理,更好地表示了网页文档之间的相似性。 提出了一种基于互联网数据集的家庭影集联合标注框架。与单幅图像标注问题不同,我们考虑了利用影集内图像的相关性对多幅图像进行联合标注。首先对家庭影集中的图像进行聚类,然后从互联网数据中学习图像簇的初始标注词,再将初始标注结果输入半监督学习框架中进行后续处理,这里的半监督学习框架同时考虑了视觉内容相关性、标注词相关性以及时间相关性等。 提出了一种基于跨媒体相关的个性化图像标注词推荐模型P-DCMRM。该模型综合考虑了视觉内容空间、标注词空间以及用户空间。P-DCMRM模型克服了已有的标注词推荐系统中忽略图像视觉内容的问题,同时也在DCMRM的基础上考虑了用户空间。在模型估计中,综合考虑了训练集的全局统计特性和用户局部空间的统计特性。对于用户上传的图像,系统可以自动地根据不同用户的标注历史和兴趣向用户推荐不同的标注词。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 于林森;张田文;张开越;;图像检索中的相似性判别及索引方法综述[J];小型微型计算机系统;2007年02期
2 曾宪文;;基于小波变换的低频分量图像检索研究[J];计算机应用与软件;2007年01期
3 沈学东;;模板匹配技术在图像数据库检索中的应用[J];上海电机学院学报;2005年06期
4 石军,常义林;图像检索技术综述[J];西安电子科技大学学报;2003年04期
5 龚声蓉,王朝晖;SS~*:一种嵌入视觉特性的多维图像索引算法[J];微电子学与计算机;2004年09期
6 许天兵;基于Bayes算法实现图像语义分类[J];微型机与应用;2004年11期
7 吴涛;郭金玲;;图像数字化整合技术应用研究[J];高校图书馆工作;2008年02期
8 段立娟,高文,林守勋,马继涌;图像检索中的动态相似性度量方法[J];计算机学报;2001年11期
9 沈玉利,王蕙;基于图像与视频数据检索的分布式多媒体数据库系统融合技术研究[J];现代计算机;2001年10期
10 王朝晖,龚声蓉,唐国维;基于内容的图像检索中的一种多粒度组合查询方法[J];微电子学与计算机;2002年09期
11 王欣;基于WWW的图像检索技术[J];现代图书情报技术;2002年03期
12 陈清文;论基于内容的图像检索技术[J];中华医学图书情报杂志;2002年06期
13 陈晞,杨轶,董育宁;用于图像检索的MPEG-7形状描述子[J];电视技术;2003年04期
14 汪祖媛,庄镇泉,何劲松,王煦法;基于形状的小波变换系数广义高斯分布图像检索算法[J];电子学报;2003年05期
15 王真;图像搜索引擎特征及分类[J];内蒙古科技与经济;2005年17期
16 尚赵伟,张明新,沈钧毅,相明;基于双密度小波变换的纹理图像检索[J];西安交通大学学报;2005年10期
17 朱利华;冀小平;;小波模极大值法在图像检索中的应用[J];科技情报开发与经济;2007年03期
18 纪秀辉;周亮;;图像数据挖掘过程和方法的研究[J];硅谷;2009年03期
19 周船,朱枫,谈大龙;基于海底资源丰度的图像检索[J];信息与控制;2003年05期
20 王丽萍,邱飞岳;椭圆逼近形状轮廓的图像检索方法研究[J];浙江工业大学学报;2003年05期
中国重要会议论文全文数据库 前10条
1 李凌伟;周荣贵;刘怡;;基于概念的图像检索方法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
2 牛晓晖;王妍;贾克斌;;基于信息突变的图像检索方法[A];全国第三届信号和智能信息处理与应用学术交流会专刊[C];2009年
3 刘亚丽;;数据集中—我国银行业竞争的核心手段[A];管理科学与系统科学研究新进展——第7届全国青年管理科学与系统科学学术会议论文集[C];2003年
4 蔡念;张国宏;楼朋旭;戴青云;;基于形状和纹理的外观设计专利图像检索方法[A];第十五届全国图象图形学学术会议论文集[C];2010年
5 马帅;吴飞;杨易;邵健;;基于稀疏非负矩阵分解的图像检索[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【oral】[C];2011年
6 梁祥;;甘肃中国人寿数据集中面临的问题与对策[A];甘肃保险论文集[C];2004年
7 朱松豪;梁志伟;;用半监督学习方法实现图像检索[A];第二十九届中国控制会议论文集[C];2010年
8 王晗;滕鹏;梁玮;;使用稠密兴趣点包的非对称风景图像检索[A];第七届和谐人机环境联合学术会议(HHME2011)论文集【poster】[C];2011年
9 路晶;马少平;;基于多例学习的web图像聚类[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
10 吴成玉;邰晓英;赵杰煜;;基于颜色特征的图像检索方法与实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
中国博士学位论文全文数据库 前10条
1 荚济民;基于互联网数据集的图像标注技术研究[D];中国科学技术大学;2009年
2 邬俊;基于交互式语义推理的图像检索算法研究[D];大连海事大学;2010年
3 赵英海;基于内容的多媒体视觉信息搜索研究[D];中国科学技术大学;2010年
4 许相莉;基于智能计算的图像检索算法研究[D];吉林大学;2011年
5 雷亮;互联网环境下图像检索若干问题研究[D];重庆大学;2011年
6 孙国霞;基于无监督成分分析的图像检索方法研究[D];山东大学;2007年
7 段曼妮;图像挖掘在图像检索中的应用[D];中国科学技术大学;2009年
8 陈永健;基于内容的大规模图像检索关键技术研究[D];华中科技大学;2011年
9 刘为;基于内容图像检索关键技术的研究[D];吉林大学;2010年
10 王上;基于内容的图像检索与分类若干技术的研究[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨佳颖;基于内容的医学图像检索系统[D];吉林大学;2005年
2 程涛;基于颜色和形状特征的图像检索[D];西北大学;2010年
3 张彩华;基于颜色和纹理特征的图像检索[D];哈尔滨理工大学;2010年
4 黄会;基于半监督和集成学习的交互式图像检索算法研究[D];大连海事大学;2010年
5 张松林;基于纹理特征的图像检索方法研究[D];重庆大学;2010年
6 郑爱彬;基于相关聚合直方图的图像检索研究[D];南京师范大学;2003年
7 聂加娜;融合颜色和形状特征的图像检索方法[D];曲阜师范大学;2010年
8 张永权;图像检索中多特征组合和相关反馈技术研究[D];兰州理工大学;2010年
9 邓小飞;基于内容的实时图像检索系统[D];电子科技大学;2010年
10 孙宁;网络环境下基于内容图像检索工具的研究与实现[D];大庆石油学院;2003年
中国重要报纸全文数据库 前10条
1 海风;数据集中 为保险业防范风险提供有力保障[N];金融时报;2005年
2 河南省邓州市人行 宋玉长 张卫东;数据集中 安全任重[N];网络世界;2002年
3 陈卫东;银行数据集中后会计风险防范初探[N];中国城乡金融报;2007年
4 本报记者 吴晓伟;提升信息化从数据集中开始[N];计算机世界;2005年
5 中国人寿山东泰安分公司 高永文;保险业进入后数据集中时代[N];中国保险报;2010年
6 刘藉仁;宏观数据集中冲击 债市积极应对[N];证券日报;2005年
7 本报记者 刘学习;邮政电子支局加速数据集中[N];计算机世界;2005年
8 ;思科 数据集中方案[N];网络世界;2001年
9 汪治;轻松解密把乡还[N];中国城乡金融报;2007年
10 本报记者  江小山;四年一役 交行信息官详解跨境大集中[N];21世纪经济报道;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978