收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于内容的场景和物体类别识别研究

陆福相  
【摘要】:近年来,随着Internet的快速发展和普及,在网络上存储、传播着海量的信息和数据,尤其是图像和视频。因而,按照语义快速方便地分类和检索图像越来越重要。但是,由于光照、尺度、旋转、视角、姿态等变化,正确地识别场景和物体类别难度依然很大。此外,由于人们对图像的视觉感知不同所造成的视觉歧义,对识别算法提出了新的要求。本文主要研究如何快速准确地识别场景和物体类别。 首先,本文设计了一个实用场景和物体类别识别系统并提出了一种新的多重特征通道图像表示。为了胜任不同的场景和物体类别识别任务,本系统首先从给定图像中提取多个特征“通道”,每个特征通道利用词包模型计算图像或子图像的视觉单词直方图,并通过空间金字塔引入单词之间的位置信息。各个特征通道的主要区别在于词包模型中采用哪种特征检测器/特征描述符组合,因而具有不同水平的辨识能力和不变性。这种多重特征通道图像表示为有效地组织和利用各种稀疏或稠密特征检测器、局部特征描述符提供了一个统一的框架。对于每个特征通道,该系统然后使用基于直方图交叉核或χ~2核的支持向量机计算图像属于各个可能类别的得分。最后利用逻辑推理或统计推理的方法,综合所有特征通道的识别结果得到测试图像的识别结果。基于多重特征通道的实用场景和物体类别识别方法计算复杂性低、通用性强,而且对基准场景和物体图像库的平均识别率高于大多数流行方法,表明了该方法的有效性和合理性。 其次,本文研究了不同特征通道的组合问题,提出了四种规则(统称为x-max):max-max、sum-max、prod-max和classifier-max。x-max通过不同的方式组合各“单”特征通道的识别结果,进而得到图像的最终类别。其中,max-max、sum-max和prod-max分别由各单特征通道得分的极大值、算术平均值和几何平均值确定测试图像属于某个可能类别的得分;而classifier-max根据第一级分类器得到的各单特征通道的识别结果,由第二级分类器确定测试图像属于某个可能类别的得分。在x-max中,最后得分最高的类便是测试图像的识别结果。与场景和物体类别识别中两种最流行的特征组合规则(多核学习和线性规划提升)相比,x-max规则的优点有三:一是它基于分布式组合的思想,鲁棒性高,每个组合节点处理负担小,并便于并行处理;二是扩展性强,当加入新的特征通道时,只需学习与新特征通道有关的分类器,毋需重新从头开始学习所有分类器;三是计算复杂性低,适用于识别大型场景和物体图像库。对五个基准图像库的实验结果表明,与多核学习和线性规划提升相比,使用x-max组合多重特征通道,时间复杂度降低了1–2个数量级,平均识别准确率高于多核学习,并接近线性规划提升。 最后,本文提出了一种新的基于金字塔主题直方图(PHOTO)和AdaBoost分类器的场景和物体类别识别算法。概率隐语义分析(pLSA)在文本语义分析和处理中用来挖掘文本文档的主题。本文在pLSA模型的基础上,通过空间金字塔引入位置信息,利用EM算法计算图像金字塔中各个单元格的主题混合系数向量,并拼接形成一个“长”向量(称为金字塔主题直方图(PHOTO))用来表征图像。然后使用AdaBoost算法的一种变形识别场景和物体类别。实际上,PHOTO相当于使用pLSA对金字塔单词直方图进行非线性降维,从而得到图像的低维语义特征。实验结果表明,PHOTO特征在大多数基准场景和物体图像库上取得了较为满意的结果,它尤其适用于识别场景图像。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 蒋翔,钟国康,冯晓源;微机医学图像库[J];上海生物医学工程;1998年01期
2 王万森;在医学超声诊断专家系统中建立图像库的研究[J];微型机与应用;1996年07期
3 韩永奇;张芸;姚玉霞;;耕地管理信息系统图像库分析与建立[J];农业网络信息;2009年01期
4 钱思进;张恒;何德全;;基于图像视觉复杂度计算的分类信息隐藏图像库[J];解放军理工大学学报(自然科学版);2010年01期
5 张凯,曹加恒,叶可,刘茂福;一个高效的图像库检索模型[J];计算机工程与应用;2002年03期
6 曹奎;一种图文数据的管理策略及其实现技术[J];信阳师范学院学报(自然科学版);1994年01期
7 廉士国,孙金生,王执铨;基于图像库的图像和视频安全传输方案[J];控制与决策;2004年07期
8 许耀昌;可视化软件开发平台[J];软件世界;1996年05期
9 郭秀梅,顾轶先,苏月明;图像库智能化查询界面及运行日志的设计[J];微计算机应用;1996年03期
10 苏晓珂,虎晓红,兰洋;基于内容的图像检索技术综述[J];信阳师范学院学报(自然科学版);2005年04期
11 刘华明;唐仕喜;解辉;;基于样本块的唐卡图像修复技术研究[J];福建电脑;2007年10期
12 杨浩;安国成;陈向东;吴镇扬;;一种基于实例的文本图像超分辨率重建算法[J];东南大学学报(自然科学版);2008年02期
13 龙巧云;邓彬;曾敏;;图像数据库聚类索引方法研究[J];武汉理工大学学报(信息与管理工程版);2008年04期
14 焦丽莉;黄发军;刘小军;;一种新的基于形状特征的图像检索方法[J];徐州师范大学学报(自然科学版);2009年04期
15 杨明;一种基于Client/Server模式的网络多媒体DBMS的设计方法[J];计算机应用;1998年06期
16 戴青云,李海鹏;基于纹理和形状特征的外观设计专利图像的检索方法[J];计算机工程与应用;2002年03期
17 马继红;师军;;基于内容的图像检索技术研究[J];郑州轻工业学院学报(自然科学版);2009年04期
18 哈斯苏荣;永荣;金海;乌翠兰;海鹰;布音布和;;鄂尔多斯细毛羊7种常见消化道线虫卵原始图像库的初步建立[J];内蒙古农业大学学报(自然科学版);2011年01期
19 周雁,陶世荃,王大勇,江竹青;基于体全息图像库的模式识别算法[J];中国激光;2002年04期
20 陈安丽;孙丽红;;医学院校图书馆如何建立数字化图像资料库[J];卫生职业教育;2007年04期
中国重要会议论文全文数据库 前10条
1 吕枝;黄元元;;基于目标图像分析的色彩量化新算法及其应用[A];2010通信理论与技术新发展——第十五届全国青年通信学术会议论文集(上册)[C];2010年
2 袁立;付伟;穆志纯;;一种自动人耳识别方法研究[A];中国自动化学会控制理论专业委员会A卷[C];2011年
3 王建艳;李扬;赵秋兰;吕颂辉;;我国沿海常见赤潮生物图像库及人工互动检索系统的建立[A];庆祝中国藻类学会成立30周年暨第十五次学术讨论会摘要集[C];2009年
4 张艳秋;李建中;;基于三级存储器的多媒体服务请求调度算法[A];第十九届全国数据库学术会议论文集(技术报告篇)[C];2002年
5 吴成玉;邰晓英;赵杰煜;;颜色、纹理及相关反馈技术在图像检索中的综合应用[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
6 吴成玉;邰晓英;赵杰煜;;基于颜色特征的图像检索方法与实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
7 陈世亮;李战怀;闫剑锋;;一种基于本体描述的空间语义图像检索方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
8 李太君;康耀红;温小斌;潘学松;;基于改进的颜色直方图模型的图像检索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
9 陈思坤;吴洪;;基于图分块并利用空间金字塔的医学图像分类[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
10 洪清启;王备战;董槐林;张磊;陈兵;;一种改进的基于广义直方图的图像检索方法[A];第四届中国软件工程大会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 叶航军;面向大规模图像库的索引和检索机制研究[D];清华大学;2003年
2 田莹;人耳识别若干关键问题研究[D];沈阳工业大学;2008年
3 王长虎;互联网环境下大规模图像的内容分析、检索和自动标注的研究[D];中国科学技术大学;2009年
4 贺玲;面向大规模图像库的层次化索引机制研究[D];国防科学技术大学;2006年
5 张恒博;基于内容的图像数据库检索的技术研究[D];大连理工大学;2008年
6 冯松鹤;面向感知的图像检索及自动标注算法研究[D];北京交通大学;2009年
7 江悦;场景图像内容表述和分类研究[D];国防科学技术大学;2010年
8 袁威;光折变晶体体全息识别系统相关峰均匀性及小型化的研究[D];哈尔滨工业大学;2009年
9 周琳娜;数字图像盲取证技术研究[D];北京邮电大学;2007年
10 刘伟;图像检索中若干问题的研究[D];浙江大学;2007年
中国硕士学位论文全文数据库 前10条
1 周雁;采用体全息图像库的模式识别[D];北京工业大学;2000年
2 谢维;基于多线索融合的互联网图像搜索引擎关键技术研究[D];浙江大学;2006年
3 苗静;基于形状特征的图像检索技术研究[D];长春理工大学;2009年
4 李立红;基于内容的图像浏览和检索及实验系统的开发[D];西安科技大学;2005年
5 杨毅;基于超曲面的图像自动分类[D];华中科技大学;2008年
6 孟丽娜;基于区域的图像检索技术研究[D];西安电子科技大学;2005年
7 李科;自动识别遥感光学图像中飞机目标的研究[D];国防科学技术大学;2005年
8 郭朋杰;基于体全息图像库的模式识别系统研究[D];哈尔滨工业大学;2006年
9 张瑜慧;基于SVM的语义图像检索技术的研究与实现[D];扬州大学;2007年
10 孟丹;基于人耳生物特征的身份识别[D];辽宁科技大学;2007年
中国重要报纸全文数据库 前10条
1 刘林 周福龄;利用图像库添加主持人[N];中国气象报;2000年
2 王志军;ICQ 4.0再 战江湖[N];中国电脑教育报;2004年
3 本报记者 程鸿;把医生还给病人[N];计算机世界;2000年
4 张东风;“透视”中药[N];中国中医药报;2004年
5 宋英华;黑龙江省局发文加强科普[N];中国气象报;2004年
6 YuLai;追求最简单的电影制作[N];电脑报;2003年
7 中国龙;升级新干线[N];中国电脑教育报;2004年
8 特约记者 金江水;珲春海关筑“廉关”[N];图们江报;2010年
9 罗峻;打造你的影像“梦工厂”[N];中国计算机报;2003年
10 ;美国政府创建动态图像图书馆[N];计算机世界;2003年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978