收藏本站
《北京交通大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于语义主题模型的图像场景分类研究

唐颖军  
【摘要】: 摘要:图像场景分类(Scene Classification)是根据给定的一组语义类别对图像数据库进行自动标注,它为指导目标识别等更高层次的图像理解提供了有效的上下文语义信息。本文从认知心理学的角度出发,以“视觉词包建模—语义主题建模—场景语义分类”为路线展开研究。研究的难点在于如何使计算机能够从人的认知角度理解图像的语义信息,有效辨别图像场景类自身变化及各场景类之间的相似。 围绕场景主题建模,最大程度地弥合图像低层特征和高层语义之间的语义鸿沟,本文取得以下研究成果: 提出了一种基于类别约束的主题模型。该模型针对同类场景图像中层语义内容具有视觉相似的特点,建立类别约束学习机制捕获场景类的特定语义。依据该模型中场景类主题空间构建方法的不同,提出了场景类建模的两种方案。其中,CTS-LDA(基于类主题空间的潜在狄里克雷分布)采用等维主题集构建各类主题空间,便于扩展应用;ATS-LDA(自适应主题数的潜在狄里克雷分布)采用不等维主题集构建各场景类的主题空间,体现各类场景语义内容繁简变化程度。该模型通过比较各类模型下图像边缘分布,采用最大似然选择实现场景类判别,摆脱了现有方法必须使用分类器进行场景分类的限制。 提出了一种学习和识别场景类别的主题模型。针对EM算法推导过程中可能存在的局部极值问题,根据狄雷克里参数的伪计数作用,采用两次变分推导估计模型参数。首先,推导出符合训练样本的通用主题先验分布,作为模型参数初值;然后对模型进行再次变分推导,估计各场景类主题先验分布。该模型的推导方式有利于实现增量学习。对于新增场景类,在原训练样本的通用主题先验参数基础上,该模型能够以增量方式学习新增类的类主题先验分布,呈现出较高的泛化能力。 提出了一种具备空间语义的主题模型,从中间语义描述的共性和个性角度捕获视觉词语的共现信息。首先在原有视觉词包的基础上,该模型通过建立空间金字塔来保留与特征点相关的空间信息,实现了图像局部特征与全局特征的有效融合。然后从中间语义层次上联合考查通用主题的一般性和类主题的特殊性,该模型建立具备空间信息的语义主题空间,使图像语义主题表示具备更强的判别力。
【学位授予单位】:北京交通大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:TP391.41

【相似文献】
中国期刊全文数据库 前10条
1 潘春华;;基于RIA技术的三维场景图书馆服务系统设计与实现[J];图书情报工作;2010年13期
2 鲍彦如;Java 3D创建虚拟现实世界探析[J];微计算机应用;2003年06期
3 聂俊岚;赵丽嫚;赵宗见;;基于改进场景图的空天信息场景管理研究[J];微计算机信息;2010年34期
4 刘选荣;数字视听新纪元(续一)[J];家庭电子;1998年06期
5 ;Sony数码相机 以独到争市[J];每周电脑报;1999年46期
6 郑晓曦,孙国正;虚拟样机系统[J];计算机工程与应用;2005年01期
7 刘哲;;织物图像增强矩阵特征模型的建立[J];纺织学报;2011年08期
8 李翔,李成名,王继周;基于Java3D的地形3维可视化技术[J];测绘通报;2003年10期
9 宋其华;郭根生;;解析计算机图像分辨率[J];中国电化教育;2003年11期
10 郑晓曦;虚拟样机系统结构及相关技术的研究[J];五邑大学学报(自然科学版);2005年01期
中国重要会议论文全文数据库 前10条
1 曹群;;关于档案仿真复制的设备配置问题[A];回顾与展望:2010年全国档案工作者年会论文集(上)[C];2010年
2 毛凯;温永宁;龙毅;闾国年;;面向虚拟地理环境的地理场景三维引擎研究[A];中国地理学会2004年学术年会暨海峡两岸地理学术研讨会论文摘要集[C];2004年
3 徐亮;毕传兴;陈心昭;陈剑;;一种基于正交球面波插值的近场声全息分辨率增强方法[A];第九届全国振动理论及应用学术会议论文集[C];2007年
4 梁艳梅;毛幼馨;贾亚青;赵友博;朱晓农;母国光;;光学相干层析系统的研究[A];大珩先生九十华诞文集暨中国光学学会2004年学术大会论文集[C];2004年
5 高立丹;刘赵淼;;基于CT图像的冠状动脉三维建模[A];北京力学会第17届学术年会论文集[C];2011年
6 武学颖;刘鹏;岳俊华;郭永飞;;红外目标模拟靶设计中的关键技术研究[A];第二届红外成像系统仿真测试与评价技术研讨会论文集[C];2008年
7 张阳子;慕晓冬;王楠;王宁燕;刘索漫;;一种策略类军事训练游戏场景设计[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
8 周滨;刘亚滨;;基于Vtree的某型反坦克导弹训练模拟器三维图形生成方法的研究[A];系统仿真技术及其应用(第7卷)——'2005系统仿真技术及其应用学术交流会论文选编[C];2005年
9 于峻伟;;机载SAR图像快速仿真方法研究[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
10 徐亮;毕传兴;陈心昭;陈剑;;一种基于正交球面波插值的近场声全息分辨率增强方法[A];第九届全国振动理论及应用学术会议论文摘要集[C];2007年
中国重要报纸全文数据库 前10条
1 鸣涧;打造3D虚拟世界[N];中国电脑教育报;2002年
2 刘筱霞;陈永常;PHOTOSHOP中图像分辨率的设置[N];中国包装报;2002年
3 张利;创维:开创液晶屏变新时代[N];经济视点报;2006年
4 记者 王春;我自主研发新型磁共振成像技术[N];科技日报;2009年
5 新文;DVD、彩电如何搭配?[N];中国文化报;2001年
6 山东 realrocking;《特工神童3D》三维CG特技探密[N];电脑报;2003年
7 记者 杨旭;市区数字化网络监控系统投入使用[N];铁岭日报;2007年
8 钱林;轻松玩转扫描仪4[N];中国电脑教育报;2003年
9 北京航空航天大学虚拟现实新技术教育部重点实验室 田雪松 崔鹏 郝爱民;“真实”的“虚幻”[N];计算机世界;2004年
10 风动;数码拍照有技巧[N];天津日报;2004年
中国博士学位论文全文数据库 前10条
1 解文杰;基于中层语义表示的图像场景分类研究[D];北京交通大学;2011年
2 唐颖军;基于语义主题模型的图像场景分类研究[D];北京交通大学;2010年
3 姚拓中;结合主动学习的视觉场景理解[D];浙江大学;2011年
4 姚旭峰;神经导航中磁共振弥散张量图像处理技术的研究[D];复旦大学;2011年
5 靳永亮;高帧频闭环特殊场景仿真关键技术研究[D];中国科学院研究生院(长春光学精密机械与物理研究所);2012年
6 刘景正;无人飞行器影像场景配准与目标监视技术研究[D];解放军信息工程大学;2011年
7 唐振;图像与视频特效编辑关键技术研究[D];北京交通大学;2012年
8 江悦;场景图像内容表述和分类研究[D];国防科学技术大学;2010年
9 刘露;基于CT图像肺癌定性诊断若干关键问题研究[D];哈尔滨工业大学;2009年
10 葛鹏;基于联合变换光学相关器的图像位移矢量探测技术[D];浙江大学;2012年
中国硕士学位论文全文数据库 前10条
1 杨鹏;全孔壁图像采集和处理技术研究与应用[D];重庆大学;2010年
2 苏慧君;SAR图像分辨率增强方法研究[D];电子科技大学;2011年
3 陈松;PET图像勾画肿瘤靶区边界的水模研究[D];中国医科大学;2010年
4 王翀;LAMOST光纤光谱图像中宇宙射线的检测和修复[D];中国科学技术大学;2010年
5 沈武魁;基于SFM的大幅面壁画图像高保真拼接技术[D];浙江大学;2011年
6 王茜;像素域图像超分辨重建快速算法研究[D];西安电子科技大学;2011年
7 卢斌;基于视觉的圆筒内壁均匀度在线检测系统[D];沈阳工业大学;2010年
8 谢欣荣;分子可视化建模及其软件实现[D];华中科技大学;2004年
9 张小辉;虚拟交通场景中的雨雪仿真[D];西南交通大学;2010年
10 李敏学;基于注意力机制的图像显著区域提取算法分析与比较[D];北京交通大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026