收藏本站
《北京邮电大学》 2012年
收藏 | 手机打开
二维码
手机客户端打开本文

基于概率主题模型的图像分类和标注的研究

李晓旭  
【摘要】:图像分类和标注是计算机视觉、机器学习领域的重要研究内容。它们是自动获取图像语义信息的重要手段,具有广泛的应用,然而也面临着一定的挑战。概率图模型和变分推理是一个新型的机器学习框架,是处理不确定性和复杂性问题的有力工具,被广泛应用于计算机视觉和自然语言处理等领域。主题模型源于文本处理,主题模型的优势在于:一、可对数据降维,二、可使用学习到的主题特征(中层特征)代替原始的底层特征来分类,从而缩小高层类别概念与底层图像特征的距离。本文注意到现有很多图像分类和标注方法应用到真实图像中存在一定的局限性,因而提出了一系列新颖的、用于图像分类和标注的概率主题模型,期望有效提高图像分类和标注的性能。具体创新工作如下: 1.提出了一个集成的、有监督的概率主题模型。很多真实的图像数据在形式上或底层特征上表现为类内相似度很小,而类问相似度却很大。一般来说,对于这样复杂的图像,一个规则很难拟合数据和类标之间的关系。我们认为这样的数据应该存在多个分类规则,这就涉及到了集成学习问题,集成学习的优势是组合多个弱分类器构成一个强分类器。目前,基于主题模型的图像分类工作已有很多,它们大都为所有数据构建一个分类规则。因此,本文在主题模型中引入了集成学习的思想,构建了一个可以兼顾两个方法优点的分类模型,并在两个真实数据集上证明了提出模型的合理性。 2.提出了一个多视图的、有监督的概率主题模型。在计算机视觉中多视图特征是很容易获得的。对于复杂图像,一般来说一个特征是很难具有足够辨识度的。显然,多种特征可以提供较高的辨识度,辨识度越高,分类也就越容易。现存的主题模型大都关注单视图特征,若想使用多特征信息,只能使用多个特征的联合特征。由于特征所在不同的尺度空间,简单拼接常常是不合理的。为此,本文构建了一个多视图的有监督的概率主题模型,并在两个真实数据集上证明了提出模型的有效性。 3.提出了一个用类别信息促进图像标注的概率主题模型。考虑到类标信息对图像标注来说是很有价值的,一旦我们确定了图像类别,标准词汇的范围将会缩小,标注的误差就会减少。并且,在计算机视觉的很多任务中,相比图像的标注信息,类标常常是很容易获得的。因此本文构建了一个用类别信息标注图像的概率主题模型。最后在两个真实数据集上证明了该模型的有效性。 4.提出了同时做图像分类和标注的概率主题模型。考虑到不同的类别常常联系着不同的标注词汇,一旦确定了图像的类别,标注词汇的范围将会缩小,标注的误差就会减少。反之亦然,一旦知道了标注信息,类标词的范围也会缩小,即类标和标注之问可相互提供有价值的信息。可见,图像分类和标注是有关联的,不仅可以同时做,而且可以互相促进。受此启发,本文构建了一个新颖的同时做图像分类和标注的概率主题模型。两个真实数据集上的实验结果表明了我们方法的分类性能与相比较方法中的最好性能相差不多,而标注性能有了很大提高,也表明了提出模型的合理性。
【学位授予单位】:北京邮电大学
【学位级别】:博士
【学位授予年份】:2012
【分类号】:TP391.41

【共引文献】
中国期刊全文数据库 前10条
1 董春雨,姜璐;从不变量看信息概念的定义[J];北京师范大学学报(社会科学版);2004年04期
2 钟义信;自然语言理解的全信息方法论[J];北京邮电大学学报;2004年04期
3 李蕾;周延泉;王菁华;;基于全信息的中文信息抽取系统及应用[J];北京邮电大学学报;2005年06期
4 钟义信;;人工智能理论:从分立到统一的奥秘[J];北京邮电大学学报;2006年03期
5 李祺;论信息化教育[J];电化教育研究;2003年10期
6 李祺,李春鹏;论教育信息化[J];电化教育研究;2004年11期
7 陈玮,罗毅,涂光瑜,盛戈皞;动态监视下电力系统状态的可视化[J];电力系统自动化;2004年08期
8 钟义信;关于“信息-知识-智能转换规律”的研究[J];电子学报;2004年04期
9 钟义信;;机制主义:人工智能的统一理论[J];电子学报;2006年02期
10 钟义信;知行学引论——信息 知识 智能的统一理论[J];中国工程科学;2004年06期
中国重要会议论文全文数据库 前3条
1 李卫;王枞;李蕾;郭燕慧;钟义信;;全信息知识制导的科技期刊初审辅助系统[A];2006年首届ICT大会信息、知识、智能及其转换理论第一次高峰论坛会议论文集[C];2006年
2 邢修三;;浅论信息理论及其与生命科学的结合[A];全国复杂系统研究论坛论文集(一)[C];2005年
3 龚媛;李蕾;;语音识别后文本纠错处理[A];第三届学生计算语言学研讨会论文集[C];2006年
中国博士学位论文全文数据库 前10条
1 郑华利;彩色地形图的自动识别与矢量化研究[D];南京理工大学;2004年
2 芮夕捷;信息处理及相关问题研究[D];吉林大学;2005年
3 牟军敏;长江通航安全的若干问题研究[D];武汉理工大学;2005年
4 王智强;汉语指代消解及相关技术研究[D];北京邮电大学;2006年
5 汪传雷;基于生命周期的企业危机信息管理研究[D];天津大学;2006年
6 葛哲学;滤波方法及其在非线性系统故障诊断中的应用研究[D];国防科学技术大学;2006年
7 杨从科;中国农业科学数据资源建设研究[D];中国农业科学院;2007年
8 王艳霞;网络环境下中国农业信息服务系统研究[D];河北农业大学;2007年
9 张鹏飞;Agent通信的全信息形式语用方法[D];北京邮电大学;2007年
10 张素香;信息抽取中关键技术的研究[D];北京邮电大学;2007年
中国硕士学位论文全文数据库 前10条
1 贾留全;英汉互译中的信息转换[D];东南大学;2004年
2 吴宝亮;对消费者购买决策过程中信息量的分析与表达[D];重庆大学;2005年
3 皮春梅;认知过程信息流量的初步分析与教学信息优化[D];华中师范大学;2006年
4 郑芳芳;公众出行交通信息服务系统及关键问题研究[D];西南交通大学;2005年
5 左爱琴;以人为本的信息环境管理[D];成都理工大学;2006年
6 滕兆平;基于不确定性的和谐固化管理思路研究[D];西南石油大学;2006年
7 范朝晖;社会基础信息及其应用研究[D];西南石油大学;2006年
8 杨涛;论我国会计软件产业化的社会形成[D];东南大学;2006年
9 宋菲;基于工程项目文档的文本挖掘系统的研究与实现[D];北京化工大学;2007年
10 许晶;基于智能手机平台的语音识别后文本处理的应用[D];北京邮电大学;2007年
【二级参考文献】
中国期刊全文数据库 前1条
1 李洁;高新波;焦李成;;基于特征加权的模糊聚类新算法[J];电子学报;2006年01期
中国博士学位论文全文数据库 前1条
1 王斌;图像检索中自动标注与快速相似搜索技术研究[D];中国科学技术大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 潘建刚,赵文吉,宫辉力;遥感图像分类方法的研究[J];首都师范大学学报(自然科学版);2004年03期
2 冯霞,黄亚楼;基于压缩直方图的图像分类[J];南京航空航天大学学报;2005年03期
3 孟祥增,杨晓娟;结合主题与内容的Web图象分类[J];山东师范大学学报(自然科学版);2005年04期
4 王一达;沈熙玲;谢炯;;遥感图像分类方法综述[J];遥感信息;2006年05期
5 赵凯;李春平;;一种基于粗糙集的图像分类方法[J];微计算机应用;2007年05期
6 李海峰;杜军平;;颜色特征的图像分类技术研究[J];智能系统学报;2008年02期
7 李含光;吴小季;;基于脊波变换和SVM的MSTAR图像分类[J];武汉理工大学学报;2010年16期
8 刘斌;陆华;刘国涛;;遥感数据的粗糙集表示及分类[J];四川理工学院学报(自然科学版);2011年01期
9 朱义明;;基于Hadoop平台的图像分类[J];西南科技大学学报;2011年02期
10 谭衢霖,邵芸;雷达遥感图像分类新技术发展研究[J];国土资源遥感;2001年03期
中国重要会议论文全文数据库 前10条
1 吴霜;张一飞;修非;王大玲;鲍玉斌;于戈;;基于兴趣点特征提取的医学图像分类[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
2 陈思坤;吴洪;;基于图分块并利用空间金字塔的医学图像分类[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
3 万余庆;;高光谱遥感图像分类识别精度比较[A];第十四届全国遥感技术学术交流会论文摘要集[C];2003年
4 李杰;付萍;刘金国;;基于维数分类的分形图像编码方法[A];中国图象图形学会第十届全国图像图形学术会议(CIG’2001)和第一届全国虚拟现实技术研讨会(CVR’2001)论文集[C];2001年
5 王海峰;管亮;;基于颜色特征的图像分类技术在油品分析中的应用[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
6 潘海为;李建中;张炜;;基于像素聚类的脑部医学图像分类[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
7 吴楠;李晓曦;宋方敏;;图像挖掘及其在医学图像分类中的应用[A];2006年全国理论计算机科学学术年会论文集[C];2006年
8 耿迅;龚志辉;张春美;;基于第二代小波变换的遥感图像数字水印算法[A];第十三届全国图象图形学学术会议论文集[C];2006年
9 张淑雅;赵晓宇;赵一鸣;李均利;;基于SVM的图像分类[A];第十三届全国图象图形学学术会议论文集[C];2006年
10 李玉峰;郑德权;赵铁军;;基于SVM和多特征融合的图像分类[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
中国重要报纸全文数据库 前10条
1 刘杰;民众网络晒照片,博物馆兴趣浓烈[N];中国摄影报;2009年
2 ;尽享极速冲浪快感的 Longator 2004横空出世[N];中国电脑教育报;2004年
3 陶海青;口碑网牵手用户造“地图”[N];中国现代企业报;2007年
4 季文;固体饮料 看清成分十分重要[N];中国质量报;2007年
5 徐世文蒋子月;墨西哥发布玩具标签要求[N];中国国门时报;2008年
6 方正;开启用户体验新时代[N];网络世界;2007年
7 蒋雪;让高手颜面尽失的小故障[N];中国电脑教育报;2003年
8 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年
9 一波;400型打包机难解棉企之困[N];中华合作时报;2007年
10 记者 王岚 通讯员 吕卫民;商场超市热销服装问题不少[N];宁波日报;2007年
中国博士学位论文全文数据库 前10条
1 李晓旭;基于概率主题模型的图像分类和标注的研究[D];北京邮电大学;2012年
2 员永生;基于支持向量机分类的面向对象土地覆被图像分类方法研究[D];西北农林科技大学;2010年
3 曾璞;面向语义提取的图像分类关键技术研究[D];国防科学技术大学;2009年
4 任桢;图像分类任务的关键技术研究[D];哈尔滨工程大学;2010年
5 朱蓉;基于语义的Web图像分类研究[D];浙江大学;2011年
6 蔡红苹;基于局部特征的图像分类识别关键技术研究[D];国防科学技术大学;2010年
7 凌飞龙;面向植被识别的SAR图像分类方法研究[D];中国林业科学研究院;2010年
8 张旗;基于属性的图像分类研究[D];大连海事大学;2005年
9 宋余庆;医学图像数据挖掘若干技术研究[D];东南大学;2005年
10 王宇旸;基于可重构计算技术的图像识别与分类系统研究[D];中国科学技术大学;2009年
中国硕士学位论文全文数据库 前10条
1 刘彤彦;WWW图像分类方法研究[D];山东师范大学;2004年
2 武京相;融合全局和局部特征的医学图像分类[D];电子科技大学;2010年
3 臧伟;Boosting算法在远程教育分析和图像分类中的应用研究[D];清华大学;2004年
4 贾宁;基于粗糙集的图像分类和检索研究[D];南华大学;2010年
5 高锦;基于SVM的图像分类[D];西北大学;2010年
6 蔡俊杰;结合用户标注信息的图像分类研究[D];中国科学技术大学;2011年
7 龚建军;无线网络图像检测系统[D];浙江大学;2004年
8 薛长花;基于半监督学习的静态极光图像分类[D];西安电子科技大学;2010年
9 李慧君;基于量子克隆进化算法的BP神经网络POLSAR图像分类[D];哈尔滨工业大学;2010年
10 柳一鸣;自适应量子行为粒子群算法及其在图像分类中的应用研究[D];浙江大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026