收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于局部学习的半监督分类问题研究

吕佳  
【摘要】:传统的机器学习技术需要使用大量有标记样本进行训练,但是在很多实际应用中,获取大量的有标记样本相当困难,因为标记样本往往需要耗费大量的人力物力以及时间,甚至必须依赖于少数领域专家和知识工程师来完成,而获取大量未标记样本则相对容易得多.所以只需标注少量样本的半监督学习方法在模式识别和机器学习领域引起了极大的关注,并在文本分类、图像识别、生物信息学等诸多领域取得了良好的应用效果. 半监督多类分类问题和半监督多标记分类问题是半监督二类分类问题的实质性推广,由于它们更贴近实际问题,成为当前机器学习领域的一个研究热点.解决这两类问题的方法常常是将它们分解成一组半监督二类分类问题,而这会产生许多新问题,如半监督多类分类问题中会出现数据的不平衡问题,半监督多标记分类问题中未考虑类别之间的相关性,并且随着标记数目的增加分解出来的子问题的数目呈指数增长难以处理等.本文针对半监督多类分类问题和半监督多标记分类问题,采用基于图的半监督学习算法,从最优化的角度出发,根据“整体法”的研究思路,利用局部学习的优良特性对上述两类问题做了系统深入的研究.具体地说,本文的主要工作包括如下几个方面: 1.第一章首先简要地介绍了机器学习的研究意义、发展概况及其理论基础——统计学习理论的基本知识;其次对本文所要研究的机器学习问题中的半监督学习和局部学习的发展历史和研究现状进行了综述;最后介绍了论文的选题动机和组织结构. 2.第二章研究了基于局部学习的半监督多类分类算法.局部学习的内涵就是一个样本的类别应能很好地由其邻域内的样本估计,即每一个样本的类别实值与建立在其邻域样本集上的局部学习模型的输出值相同或相近.首先,基于局部学习在半监督二类分类问题中表现出的良好特性,分析和推导了半监督二类分类问题中的局部学习正则项;其次,提出了一种新的单位圆标记表示方法;最后,将局部学习从半监督二类分类问题推广到了半监督多类分类问题中,并用数值实验检验了基于局部学习的半监督多类分类算法的有效性和高效性. 3.第三章研究了结合全局学习和局部学习的半监督多类分类算法.首先,针对多类分类问题中的标记本质上属于标称型变量的特性,提出了一种弹性的可学习可调节的标记表示方法;其次,提出了半监督多类分类问题的正则化方法,包括全局正则化和局部正则化,并完整地给出了局部正则项在半监督多类分类问题中的表达形式,并提出了两个算法:(1)基于局部学习和可调节标记表示方法的半监督多类分类算法;(2)结合全局和局部正则化的半监督多类分类算法;最后,通过在标准的二类数据集和多类数据集上进行数值实验,实验结果证明了两个算法的有效性和可行性. 4.第四章研究了基于局部学习的半监督多标记分类算法.首先,通过分析发现,半监督多标记分类问题中每一个样本输入χi对应的输出yi的表示形式,与半监督多类分类问题中二进制序列标记表示方法本质上是一致的,因此可将局部学习正则项引入到半监督多标记分类问题中;其次,半监督多标记分类问题中有关类与类之间相关性的研究,正适合用“整体法”的研究方法来解决,这样,分别从样本和类别两个方面构建了两个加权无向图,分析得到针对样本的局部学习正则项和针对类别的全局正则项,从而得到基于局部学习的半监督多标记分类算法;最后,通过求解一个Sylvester方程得到类别的实值矩阵解,实验验证了基于局部学习的半监督多标记分类算法是可行的. 5.第五章利用前面研究的基于局部学习思想的半监督多类分类算法解决电力变压器故障诊断问题,建立了电力变压器故障诊断的层次模型实现故障的定性和定位,为半监督多类分类算法在新领域的应用做了有意义的尝试. 6.第六章对论文所作的工作做了总结,并提出了下一步工作的建议.


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王晓锋;秦玉平;;基于二叉树的SVM多类分类算法研究[J];湖南工程学院学报(自然科学版);2008年03期
2 黄树成;曲亚辉;;数据流分类技术研究综述[J];计算机应用研究;2009年10期
3 唐发明,王仲东,陈绵云;支持向量机多类分类算法研究[J];控制与决策;2005年07期
4 牛兴霞;杨奎河;;基于支持向量机的多类分类研究[J];信息技术;2006年11期
5 刘晟;朱玉全;孙金津;;基于核空间相对密度的SVDD多类分类算法[J];计算机应用研究;2010年05期
6 杨克领;姜慧霖;;基于SVM的新多类分类算法[J];电脑知识与技术(学术交流);2007年13期
7 余辉;赵晖;;支持向量机多类分类算法新研究[J];计算机工程与应用;2008年07期
8 秦玉平;陈一荻;王春立;王秀坤;;基于超椭球的多类文本分类算法研究[J];计算机科学;2011年08期
9 厉剑;杨玮龙;李攀;;基于DSP并行结构的二叉树SVM多分类器[J];舰船电子工程;2007年01期
10 郭亚琴;王正群;;一种改进的支持向量机多类分类方法[J];现代电子技术;2009年20期
11 孙德山;吴今培;肖健华;;一种新的多类分类算法[J];模式识别与人工智能;2004年03期
12 张晓丹;邵帅;刘钦圣;;最小二乘支持向量机在睡眠打鼾诊断中的应用[J];计算机工程与应用;2008年05期
13 吕晓丽;李雷;曹未丰;;基于二叉树的SVM多类分类算法[J];信息技术;2008年04期
14 耿姝;秦玉平;;结合SVM与Bayesian为不带类别标记的兼类文本分类[J];科技信息(科学教研);2008年21期
15 赵有星;李琳;;基于支持向量机的多类分类算法研究[J];科技信息(科学教研);2007年29期
16 曹巍;赵英凯;高世伟;;基于模糊核聚类的多类支持向量机[J];化工学报;2010年02期
17 王冬丽;郑建国;周彦;;基于后验概率SVM决策树多类的分类算法[J];微型电脑应用;2011年02期
18 孔锐,张冰;基于核Fisher判决分析的高性能多类分类算法[J];计算机应用;2005年06期
19 孙德山;吴今培;;基于线性规划的多类支持向量机算法[J];计算机科学;2005年10期
20 王晓锋;温学兵;滕明岩;;一种新的DAGSVMs多类分类方法[J];铁路计算机应用;2009年05期
中国重要会议论文全文数据库 前10条
1 谢永芳;蒋有为;唐明珠;;一种基于数据剪辑的半监督最邻近分类算法[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
2 曹巍;赵英凯;高世伟;;基于模糊核聚类的多类支持向量机[A];2009中国过程系统工程年会暨中国mes年会论文集[C];2009年
3 肖健华;孙德山;吴今培;;基于支持向量数据描述的多类分类算法及其在人脸识别中的应用[A];2005年中国智能自动化会议论文集[C];2005年
4 刁智华;母媛媛;;一种基于马氏距离的SVM决策树多类分类算法[A];中国自动化学会控制理论专业委员会B卷[C];2011年
5 孙云山;张立毅;李艳琴;;基于模糊分类器的PAM盲均衡算法[A];四川省通信学会2005年学术年会论文集[C];2005年
6 刘艳民;;中文网页分类方法的研究[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
7 谷方明;刘大有;王新颖;;基于半监督学习的加权支持向量域数据描述方法[A];NDBC2010第27届中国数据库学术会议论文集(B辑)[C];2010年
8 李晓波;;集成分类对比:Bagging NB & Boosting NB[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
9 王毅军;张志广;李勇;高小榕;高上凯;杨福生;;2003年脑机接口数据竞赛论文之一——基于CSSD和FDA的单次手指运动诱发脑电分类算法[A];首届全国功能神经影像学和神经信息学研讨会论文汇编[C];2003年
10 傅言;郭振华;李乃民;;基于图像分析的中医色诊及在肝病上的研究[A];第一届全国中西医结合诊断学术会议论文选集[C];2006年
中国博士学位论文全文数据库 前10条
1 吕佳;基于局部学习的半监督分类问题研究[D];内蒙古大学;2012年
2 王娇;多视图的半监督学习研究[D];北京交通大学;2010年
3 朱岩;面向文本数据的半监督学习研究[D];北京交通大学;2012年
4 潘俊;基于图的半监督学习及其应用研究[D];浙江大学;2011年
5 孔怡青;半监督学习及其应用研究[D];江南大学;2009年
6 周琰;大学生认识信念研究[D];南京师范大学;2011年
7 兰远东;基于图的半监督学习理论、算法及应用研究[D];华南理工大学;2012年
8 李军;不平衡数据学习的研究[D];吉林大学;2011年
9 徐雪;样本的几何信息在半监督学习中的应用研究[D];中国科学技术大学;2010年
10 薛贞霞;支持向量机及半监督学习中若干问题的研究[D];西安电子科技大学;2009年
中国硕士学位论文全文数据库 前10条
1 秦飞;基于半监督学习的文本分类研究[D];西南交通大学;2010年
2 余养强;半监督学习若干问题的研究[D];福建师范大学;2010年
3 杨伟;半监督学习方法研究[D];国防科学技术大学;2011年
4 魏征丽;基于图半监督学习算法的研究及应用[D];西安电子科技大学;2012年
5 葛荐;基于集成算法的半监督学习研究[D];南京信息工程大学;2012年
6 徐庆伶;基于半监督学习的遥感图像分类研究[D];陕西师范大学;2010年
7 晋小玲;图转导理论的研究与应用[D];华北电力大学(北京);2011年
8 卢加磊;半监督学习中协同训练与多视图方法的比较及改进[D];中国海洋大学;2010年
9 许震;基于KL距离的半监督分类算法[D];复旦大学;2010年
10 卫力;基于图的半监督中文句子主客观分类算法研究[D];北京邮电大学;2011年
中国重要报纸全文数据库 前10条
1 通讯员 黄慧文;吉隆全体党员开展“比学促学”活动[N];日喀则报;2008年
2 冀灵渊 朔城区四中;为学生创设快乐的学习情境[N];朔州日报;2010年
3 民乐县逸夫小学 宋晓华;用爱心培养学生主动学习的兴趣[N];张掖日报;2005年
4 姜堰市东桥中心小学 杨爱军;在课文课堂中渗透心理教育[N];成才导报.教育周刊;2005年
5 师炜;西安学习经验可全省推广[N];西安日报;2003年
6 山东省临沭县白旄中学 张秀伟;如何培养中学生学习历史的习惯[N];学知报;2011年
7 本报记者 靳晓燕;哦,学习是能倒着来的[N];光明日报;2011年
8 郭佳 编译;21世纪的学习什么样[N];中国教师报;2011年
9 李林 余承武;努力把基层学习抓实抓深[N];战士报;2011年
10 剑河民族中学 刘明;刍议性格与学习的关系[N];贵州民族报;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978