收藏本站
《西南大学》 2015年
收藏 | 手机打开
二维码
手机客户端打开本文

融合主动学习的半监督技术在图像分类中的应用研究

李函怡  
【摘要】:随着多媒体技术的迅速发展和因特网的快速普及,数字图像呈爆炸式增长,如何有效地检索、分类、挖掘、利用这些数据成为当今研究的重点,特别是云的出现对从大量图片快速检索带来了非常大的挑战。但是单靠人力进行的数据分析往往要花费非常多的时间,满足不了数据产生速度的要求。因此在这样的背景下,机器学习(Machine Learning)应运产生,机器学习是一种自动化的数据分析方法,不再需要人工过多进行干预。机器学习顾名思义就是利用机器进行学习,主要是利用计算机来模拟人类的学习过程,机器学习是让计算机在现有知识的基础上学习一定的模型,进而进行新知识的延伸。按照学习形式,机器学习可以分为监督学习(Supervised Learning)和无监督学习(Unsupervised Learning),半监督学习是介于监督学习与无监督学习的一种学习形式。机器学习中的无监督学习的分类精度不高,监督学习则需要足够的训练样本,然而标记样本的过程是非常费时费力。半监督学习与主动学习都是利用有标记数据和无标记数据进行学习的学习方法,将主动学习与半监督学习相结合应用到图像分类上,在只给定少量有标记数据的情形下能够最大程度提高分类器的性能。本文主要是在半监督学习的基础上融合主动学习的学习理念,把两种学习方法的优势融合起来。在整个学习过程中既选出置信度最高的样例加入到训练集中,又选出学习器争议最大的样例交给专家系统进行标注,然后加入到训练集中,主要工作如下:1)经典的半监督算法co-training算法要求样本集具有充分冗余视图,即样本集要具备两个不同的视图,这两个视图能够分别训练出一个强分类器。但是这一要求在实际情况中很难得到满足,本文采用集成学习中的Bagging算法和RSM算法将初始已标记数据集分成两个视图,即完成了数据集从单一视图转化成多视图,不再要求已标记数据集具有充分冗余视图。2) 整个学习过程中采用两个分类器,一个分类器的训练集由已标记样例组成,另一个分类器的训练集由已标记样例和部分置信度高的未标记样例及其预测标签组成。在本文中,两个分类器的训练集不同,一个是采用已标记样例组成样本集,另一个采用已标记样例和部分置信度高的未标记样例及其预测标签组成样本集,这样可以从多方面对未标记数据进行描述。3) 本文将半监督学习和主动学习的优点相结合,既自行利用大量未标记样例中存在的相关性,又将两个分类器分歧最大的样例交予专家系统进行标注,这样既可以增大训练集,又可以减少将标记错误的样例加入到训练集中的可能。文中通过实验表明了该模型分类的优越性,也证明了该方法的合理性,具有较强的应用价值。
【学位授予单位】:西南大学
【学位级别】:硕士
【学位授予年份】:2015
【分类号】:TP391.41;TP181

手机知网App
【参考文献】
中国期刊全文数据库 前10条
1 郝泽东;余淞淞;关佶红;;基于主动学习的高光谱图像分类方法[J];计算机应用;2013年12期
2 刘康;钱旭;王自强;;基于流形主动学习的遥感图像分类算法[J];计算机应用;2013年02期
3 梁鹏;黎绍发;覃姜维;罗剑高;;基于半监督学习的增量图像分类方法[J];模式识别与人工智能;2012年01期
4 陈荣;曹永锋;孙洪;;基于主动学习和半监督学习的多类图像分类[J];自动化学报;2011年08期
5 任广波;张杰;马毅;郑荣儿;;生成模型学习的遥感影像半监督分类[J];遥感学报;2010年06期
6 杨伟;方涛;许刚;;基于朴素贝叶斯的半监督学习遥感影像分类[J];计算机工程;2010年20期
7 韦东兴;陈晓云;徐荣聪;;一种基于形状特征的图像分类方法[J];微计算机信息;2010年21期
8 陈建杰;叶智宣;;多分类SVM主动学习及其在遥感图像分类中的应用[J];测绘科学;2009年04期
9 龙军;殷建平;祝恩;赵文涛;;主动学习研究综述[J];计算机研究与发展;2008年S1期
10 苏金树;张博锋;徐昕;;基于机器学习的文本分类技术研究进展[J];软件学报;2006年09期
中国博士学位论文全文数据库 前1条
1 杨同峰;基于空间关系的图像检索与分类研究[D];山东大学;2013年
中国硕士学位论文全文数据库 前1条
1 唐寿成;图像分类方法的比较及应用[D];北京邮电大学;2011年
【共引文献】
中国期刊全文数据库 前10条
1 万会芳;杜彦璞;;K近邻和Logistic回归分类算法比较研究[J];洛阳理工学院学报(自然科学版);2016年03期
2 吴冰冰;哈力旦·阿布都热依木;阿丽亚·艾尔肯;何燕;;人工鱼群优化的维吾尔文文本特征选择方法[J];河南科技大学学报(自然科学版);2016年06期
3 邹云峰;何维民;赵洪莹;程雅梦;杨红;;文本挖掘技术在电力工单数据分析中的应用[J];现代电子技术;2016年17期
4 吴德;刘三阳;梁锦锦;;多类文本分类算法GS-SVDD[J];计算机科学;2016年08期
5 卜华龙;夏静;郑尚志;;一种基于ECVM的Tri-training半监督垃圾邮件检测算法[J];宿州学院学报;2016年08期
6 赵新苗;冯向萍;李永可;;改进的中心向量算法在农业信息分类中的研究[J];计算机技术与发展;2016年08期
7 王岩;张波;薛博;;基于FOA-SVM的中文文本分类方法研究[J];四川大学学报(自然科学版);2016年04期
8 韦文娟;韩家新;夏海洋;;基于Python自然语言处理的文本分类研究[J];福建电脑;2016年07期
9 黄海新;张路;邓丽;;基于数据挖掘的恶意代码检测综述[J];计算机科学;2016年07期
10 任红格;李冬梅;李福进;;动态神经网络分类器主动学习算法及其智能控制应用[J];计算机应用与软件;2016年07期
中国博士学位论文全文数据库 前1条
1 张旭;网络图像检索关键技术研究[D];西安电子科技大学;2014年
中国硕士学位论文全文数据库 前7条
1 李函怡;融合主动学习的半监督技术在图像分类中的应用研究[D];西南大学;2015年
2 岳路路;基于机器学习的真菌孢子显微图像的特征提取与识别[D];西南大学;2015年
3 胡自强;基于张量分解的脑部图像病变识别算法研究[D];曲阜师范大学;2015年
4 叶鹏;基于扩展词袋模型的空间场景分类方法研究[D];南京师范大学;2014年
5 康南南;基于主题模型和图核模型的图像分类算法的研究与应用[D];西南大学;2014年
6 丁锐;铁路图像分类和轨顶边缘定位算法研究[D];西南交通大学;2013年
7 高双林;网络图像信息资源组织模式研究[D];华中师范大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 石陆魁;张军;宫晓腾;;基于邻域保持的流形学习算法评价模型[J];计算机应用;2012年09期
2 张伟;柳先辉;丁毅;史德明;;基于支持向量回归的多时间序列自回归方法[J];计算机应用;2012年09期
3 张瑞丽;张继福;;基于w-距离均值的模糊聚类算法[J];计算机应用;2012年07期
4 邵超;张慧娟;;应用于不完整流形的ISOMAP算法[J];计算机应用;2012年07期
5 蒋华;戚玉顺;;基于球结构支持向量机的多标签分类的主动学习[J];计算机应用;2012年05期
6 易淼;刘小兰;;基于相对变换的半监督分类算法[J];计算机应用;2011年10期
7 裘镇宇;危辉;;基于Freeman链码的边缘跟踪算法及直线段检测[J];微型电脑应用;2008年01期
8 陆薛妹;胡轶;方建安;;基于分段极值DTW距离的时间序列相似性度量[J];微计算机信息;2007年27期
9 廖克;成夕芳;吴健生;陈文惠;;高分辨率卫星遥感影像在土地利用变化动态监测中的应用[J];测绘科学;2006年06期
10 李荣陆,王建会,陈晓云,陶晓鹏,胡运发;使用最大熵模型进行中文文本分类[J];计算机研究与发展;2005年01期
【相似文献】
中国期刊全文数据库 前10条
1 陈戏墨,徐红兵,李志铭,谢铉洋,李曦,李扬彬;数据挖掘在医学图像分类中的应用[J];现代计算机(专业版);2005年01期
2 冀翠萍;孟祥增;;基于内容的图像分类体系[J];电脑知识与技术(学术交流);2007年07期
3 杨杰;陈晓云;;图像分类方法比较研究[J];微计算机应用;2007年06期
4 杨文潮;姜志坚;;图像分类技术研究[J];福建电脑;2008年08期
5 葛寒娟;邱桃荣;王剑;卢强;李北;刘韬;聂斌;;一种基于相容信息粒原理的图像分类方法[J];广西师范大学学报(自然科学版);2008年03期
6 王军;王员云;;粒计算及其在图像分类中的应用研究[J];计算机工程与科学;2009年03期
7 吴军;王士同;;基于正负模糊规则的相结合的图像分类[J];计算机应用;2011年01期
8 吴军;王士同;赵鑫;;正负模糊规则系统、极限学习机与图像分类[J];中国图象图形学报;2011年08期
9 郝永宽;王威;聂维同;王德强;;图像分类与聚类分析[J];数字技术与应用;2011年12期
10 蒋玲芳;张伟;司梦;;基于词袋模型的电子报图像分类方法研究[J];信阳师范学院学报(自然科学版);2013年01期
中国重要会议论文全文数据库 前10条
1 郑海红;曾平;;一种基于图像分类的逆半调算法[A];’2004计算机应用技术交流会议论文集[C];2004年
2 文振焜;欧阳杰;朱为总;;基于语义特征与支持向量机的图像分类[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
3 王海峰;管亮;;基于颜色特征的图像分类技术在油品分析中的应用[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
4 陈思坤;吴洪;;基于图分块并利用空间金字塔的医学图像分类[A];第六届和谐人机环境联合学术会议(HHME2010)、第19届全国多媒体学术会议(NCMT2010)、第6届全国人机交互学术会议(CHCI2010)、第5届全国普适计算学术会议(PCC2010)论文集[C];2010年
5 张淑雅;赵晓宇;赵一鸣;李均利;;基于SVM的图像分类[A];第十三届全国图象图形学学术会议论文集[C];2006年
6 李博;韩萍;;基于压缩感知和SVM的极化SAR图像分类[A];第二十七届中国(天津)2013IT、网络、信息技术、电子、仪器仪表创新学术会议论文集[C];2013年
7 朱松豪;胡娟娟;孙伟;;基于非欧空间高阶统计的图像分类方法[A];第25届中国控制与决策会议论文集[C];2013年
8 潘海为;李建中;张炜;;基于像素聚类的脑部医学图像分类[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
9 吴霜;张一飞;修非;王大玲;鲍玉斌;于戈;;基于兴趣点特征提取的医学图像分类[A];第二十四届中国数据库学术会议论文集(研究报告篇)[C];2007年
10 武进;尹恺;王长明;张家才;;SVDM在蔬菜病害图像分类中的应用[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 胡尧;基于低秩矩阵估计的机器学习算法分析[D];浙江大学;2015年
2 李昌英(Ri ChangYong);基于上下文信息的语义图像分类研究[D];浙江大学;2014年
3 陈博;基于集成学习和特征选择的极化SAR地物分类[D];西安电子科技大学;2015年
4 王晓东;基于稀疏特征学习的复杂图像分类[D];西安电子科技大学;2014年
5 顾迎节;面向图像分类的主动学习算法研究[D];南京理工大学;2015年
6 赵鑫;图像分类中的判别性增强研究[D];中国科学技术大学;2013年
7 杨冰;基于艺术风格的绘画图像分类研究[D];浙江大学;2013年
8 丁建睿;基于多示例学习的浅表器官超声图像分类方法研究[D];哈尔滨工业大学;2012年
9 贾世杰;基于内容的商品图像分类方法研究[D];大连理工大学;2013年
10 李晓旭;基于概率主题模型的图像分类和标注的研究[D];北京邮电大学;2012年
中国硕士学位论文全文数据库 前10条
1 张明静;基于改进遗传算法的分块综合特征加权图像分类研究[D];华南理工大学;2015年
2 李函怡;融合主动学习的半监督技术在图像分类中的应用研究[D];西南大学;2015年
3 王亚凤;基于多特征的主动学习方法在图像分类中的应用研究[D];河北工程大学;2015年
4 陈荣安;基于改进的Bag-of-Features模型的图像分类研究[D];兰州大学;2015年
5 钟畏丹;基于HSV和纹理特征的图像分类[D];华中师范大学;2015年
6 焦阳;基于主动学习的多标签图像分类方法研究[D];苏州大学;2015年
7 王腾川;基于主动学习的SAR图像分类方法研究[D];上海交通大学;2015年
8 NGUYEN QUANG KHANH;基于极化SAR目标信息提取与SVM分类[D];哈尔滨工业大学;2015年
9 王朔琛;基于半监督支持向量机的图像分类方法研究[D];陕西师范大学;2015年
10 杨东坡;基于深度学习的商品图像分类[D];大连交通大学;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026