基于互联网数据集的图像标注技术研究
【摘要】:
随着数码设备的日益普及以及互联网技术的迅速发展,Web图像资源越来越丰富。但由于Web数据具有多样性、复杂性和无规则性等特点,如何快速、准确地从海量Web资源中查找用户感兴趣的图像成为一项非常具有挑战性的任务。解决这一问题的重要途径就是通过对互联网图像进行自动图像标注,建立图像底层视觉内容与高层语义之间的联系,并利用标注词对图像进行索引。近年来,以Flickr为代表的图片共享社区的兴起与繁荣也让图像标注在Web 2.0环境下被赋予了新的生命。此外,自动图像标注在家庭影集的管理、医学图像检索、商标检索和人脸识别等方面都有着广泛的应用。
由于图像数量的巨大,依靠手工对图像进行标注费用昂贵,已经不能满足实际的需要。从标注使用的训练集来看,自动图像标注技术经历了两个阶段:第一个阶段可以看成是在有限数据集上的图像标注,利用一些传统的机器学习、物体识别的方法建立图像底层特征和高层语义的联系,如基于分类器的方法、基于跨媒体相关的方法、基于翻译模型的方法以及基于隐变量的生成式模型方法等;第二个阶段是基于互联网数据集的图像标注方法,这种方法更多的是从标注的框架和效率入手,充分利用了互联网的丰富资源,大大拓展了训练集的范围,因而更符合互联网环境下图像标注的实际需要,也是近年来图像标注研究的热点。
本文主要对基于互联网数据集的图像标注中的一些关键问题进行研究,主要成果和创新之处包括以下几个方面:
讨论了构建互联网标注词词典的重要性,研究了如何从浩如烟海的互联网词汇中选择合适的标注词集合,并分析了词典中词语需要满足的条件。论文根据图片共享社区中词语的统计特性,提出了一种基于随机游走的标注词重要性建模方法,词语的重要性是根据用户的历史标注情况以及词语之间的相互关系衡量的,然后根据词语的重要性排序构建标注词词典。此外,还根据图片共享社区提供的标注词的丰富的语义资源,对带有初始关键词的互联网图像标注进行语义消歧,通过寻找待标注图像在图像共享社区中的合适的语义类,减少“语义鸿沟”的影响,使最后学习出的标注词语义更加一致。
提出利用多模态相互加强原理进行图像标注。首先给定单幅图像,利用基本图像标注模型得到初始标注词,然后在基于随机游走的图像标注优化框架的基础上,通过标注词相关图和图像内容相关图之间相互加强原理,利用稳定状态下的新的相关性进行优化,可以更好地保证图像内容和最终标注词之间的关联,同时也保持了标注词的语义一致性。由于互联网图像所在网页的文本提供了丰富的语义信息,我们提出利用网页文档之间相似性与正文中命名实体的相互加强原理,更好地表示了网页文档之间的相似性。
提出了一种基于互联网数据集的家庭影集联合标注框架。与单幅图像标注问题不同,我们考虑了利用影集内图像的相关性对多幅图像进行联合标注。首先对家庭影集中的图像进行聚类,然后从互联网数据中学习图像簇的初始标注词,再将初始标注结果输入半监督学习框架中进行后续处理,这里的半监督学习框架同时考虑了视觉内容相关性、标注词相关性以及时间相关性等。
提出了一种基于跨媒体相关的个性化图像标注词推荐模型P-DCMRM。该模型综合考虑了视觉内容空间、标注词空间以及用户空间。P-DCMRM模型克服了已有的标注词推荐系统中忽略图像视觉内容的问题,同时也在DCMRM的基础上考虑了用户空间。在模型估计中,综合考虑了训练集的全局统计特性和用户局部空间的统计特性。对于用户上传的图像,系统可以自动地根据不同用户的标注历史和兴趣向用户推荐不同的标注词。
|
|
|
|
1 |
于林森;张田文;张开越;;图像检索中的相似性判别及索引方法综述[J];小型微型计算机系统;2007年02期 |
2 |
曾宪文;;基于小波变换的低频分量图像检索研究[J];计算机应用与软件;2007年01期 |
3 |
沈学东;;模板匹配技术在图像数据库检索中的应用[J];上海电机学院学报;2005年06期 |
4 |
石军,常义林;图像检索技术综述[J];西安电子科技大学学报;2003年04期 |
5 |
龚声蓉,王朝晖;SS~*:一种嵌入视觉特性的多维图像索引算法[J];微电子学与计算机;2004年09期 |
6 |
许天兵;基于Bayes算法实现图像语义分类[J];微型机与应用;2004年11期 |
7 |
吴涛;郭金玲;;图像数字化整合技术应用研究[J];高校图书馆工作;2008年02期 |
8 |
段立娟,高文,林守勋,马继涌;图像检索中的动态相似性度量方法[J];计算机学报;2001年11期 |
9 |
沈玉利,王蕙;基于图像与视频数据检索的分布式多媒体数据库系统融合技术研究[J];现代计算机;2001年10期 |
10 |
王朝晖,龚声蓉,唐国维;基于内容的图像检索中的一种多粒度组合查询方法[J];微电子学与计算机;2002年09期 |
11 |
王欣;基于WWW的图像检索技术[J];现代图书情报技术;2002年03期 |
12 |
陈清文;论基于内容的图像检索技术[J];中华医学图书情报杂志;2002年06期 |
13 |
陈晞,杨轶,董育宁;用于图像检索的MPEG-7形状描述子[J];电视技术;2003年04期 |
14 |
汪祖媛,庄镇泉,何劲松,王煦法;基于形状的小波变换系数广义高斯分布图像检索算法[J];电子学报;2003年05期 |
15 |
王真;图像搜索引擎特征及分类[J];内蒙古科技与经济;2005年17期 |
16 |
尚赵伟,张明新,沈钧毅,相明;基于双密度小波变换的纹理图像检索[J];西安交通大学学报;2005年10期 |
17 |
朱利华;冀小平;;小波模极大值法在图像检索中的应用[J];科技情报开发与经济;2007年03期 |
18 |
纪秀辉;周亮;;图像数据挖掘过程和方法的研究[J];硅谷;2009年03期 |
19 |
周船,朱枫,谈大龙;基于海底资源丰度的图像检索[J];信息与控制;2003年05期 |
20 |
王丽萍,邱飞岳;椭圆逼近形状轮廓的图像检索方法研究[J];浙江工业大学学报;2003年05期 |
|