收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

集成学习中有关算法的研究

张春霞  
【摘要】:集成学习是一种新的机器学习范式,它使用多个学习机来解决同一个问题。由于它能显著提高一个学习系统的泛化能力,从20世纪90年代开始,对集成学习理论和算法的研究一直是机器学习领域中的热点问题之一。目前,集成学习已经被成功应用于解决语音识别、基因数据分析、遥感数据处理、图像处理、文本分类等众多实际问题。 然而,集成学习的技术还不够成熟,在集成学习的研究中还存在大量尚未解决的问题。本文对集成学习进行了较为深入的研究,在简要介绍了集成学习的概念、构成、作用及其最新研究成果,分析了集成学习中两大算法族Bagging和Boosting的工作机制之后,本文主要做了以下几个方面的研究工作: (1)基于AdaBoost分类算法,设计了一个新的局部Boosting分类算法,新算法比AdaBoost更精确,对噪声也更稳健。同时,采用Kappa-Error图对集成分类器的准确性和多样性作了进一步的分析。 (2)将Bagging算法、主成分分析及Random Subspace方法相结合,提出了一个新的集成分类算法。利用一些实际数据集对新算法的性能进行考查的结果表明新算法的预测精度显著优于Bagging和Random Forest,尽管AdaBoost与新算法的预测精度相当,但在计算复杂性方面新算法更具优势。 (3)结合Bagging和Rotation Forest这两个算法的优点,设计了一个预测精度更高、对噪声更稳健的集成分类算法,利用误差的偏差-方差分解对几种构建集成分类器的算法作了更深入的分析。 (4)将Rotation Forest集成分类算法进行推广,用于解决回归问题,并利用模拟数据和实际数据研究了该算法中的参数选择对算法性能的影响。 (5)采用Boosting算法的主要思想来确定Double-Bagging集成学习技术所生成的基学习机的合并顺序,提出了一种新的选择性集成学习算法,提高了原有集成学习机的预测精度和速度。 (6)利用学习曲线对多响应线性回归(Multi-response Linear Regression,MLR)合并基分类器方法的性能在多种情况下(训练样本的不同容量、对给定数据集使用不同划分方法(Reusing, Validation, Stacked generalization)用于训练基分类器和合并准则)进行了较全面的研究,并与其他一些合并方法进行了比较,试验表明多响应线性回归合并准则在小样本容量下效果较好。 本文利用模拟数据和实际数据做了大量的数值试验,其结果表明,文中所提出的新算法具有令人满意的预测效果,从而为我们解决实际问题提供了一些可行途径。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 王昕昕;;基于遗传算法的分类方法讨论[J];电脑知识与技术;2009年33期
2 张新东;亢俊健;陈嶷瑛;李文斌;;选择分类器进行入侵检测[J];微计算机信息;2010年06期
3 吴科主;江雨燕;周传华;;一种多层次选择性集成学习算法[J];计算机应用与软件;2011年01期
4 凌霄汉;吉根林;;一种基于聚类集成的无监督特征选择方法[J];南京师范大学学报(工程技术版);2007年03期
5 陈全;赵文辉;李洁;江雨燕;;选择性集成学习算法的研究[J];计算机技术与发展;2010年02期
6 李烨,蔡云泽,许晓鸣;基于支持向量机集成的故障诊断[J];控制工程;2005年S2期
7 张燕平;窦蓉蓉;赵姝;曹振田;;基于集成学习的规范化LDA人脸识别[J];计算机工程;2010年14期
8 徐冲;王汝传;任勋益;;基于集成学习的入侵检测方法[J];计算机科学;2010年07期
9 贾瑞玉;冯伦阔;李永顺;张新建;;基于集成学习的覆盖算法[J];计算机技术与发展;2009年07期
10 张振宇;;稳健的多支持向量机自适应提升算法[J];大连交通大学学报;2010年02期
11 潘志松;燕继坤;;少数类的集成学习[J];南京航空航天大学学报;2009年04期
12 吴焕政;吴渝;肖开州;;基于粗糙集和集成学习的BBS网络舆情分类[J];广西大学学报(自然科学版);2009年05期
13 孙建文;杨宗凯;刘三(女牙);王佩;;基于集成学习与遗传算法的网络书写纹识别研究[J];计算机科学;2011年06期
14 唐伟,周志华;基于Bagging的选择性聚类集成[J];软件学报;2005年04期
15 向坚;叶绿;朱红丽;;基于子空间集成学习的3维人体运动识别[J];中国图象图形学报;2008年10期
16 丁爽;白晨希;申石磊;;一种基于小波变换特征提取的集成学习算法[J];鲁东大学学报(自然科学版);2010年02期
17 陈华;魏连;郑志娴;许榕生;;基于集成学习的网络取证模型[J];福建电脑;2007年10期
18 张永;张卫国;徐维军;;基于数据分割和集成学习的大规模SVM分类算法[J];系统工程;2009年03期
19 胡莹岑;王友仁;崔江;罗慧;;模拟电路故障的支持向量机集成诊断新方法[J];佳木斯大学学报(自然科学版);2011年02期
20 梁竞敏;;基于集成学习支持向量机的步态识别[J];计算机应用与软件;2010年07期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 付焕焕;李俊;张洁;;入侵检测中机器学习算法的集成[A];中国电子学会第十七届信息论学术年会论文集[C];2010年
3 章成志;;基于集成学习的自动标引方法研究[A];中国索引学会第三次全国会员代表大会暨学术论坛论文集[C];2008年
4 李烨;蔡云泽;许晓鸣;;基于支持向量机集成的故障诊断[A];第16届中国过程控制学术年会暨第4届全国故障诊断与安全性学术会议论文集[C];2005年
5 张红梅;高海华;王行愚;;抑制样本噪声的AdaBoost算法及其在入侵检测中的应用[A];2007年中国智能自动化会议论文集[C];2007年
6 张红梅;;基于粗糙集特征约简的SVM集成入侵检测模型[A];2009中国控制与决策会议论文集(3)[C];2009年
7 赵玲玲;周水生;王雪岩;;基于集成算法的半监督学习[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
8 刘伍颖;王挺;;一种多过滤器集成学习垃圾邮件过滤方法[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
9 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
10 王中卿;李寿山;朱巧明;李培峰;周国栋;;基于不平衡数据的中文情感分类[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国博士学位论文全文数据库 前10条
1 张春霞;集成学习中有关算法的研究[D];西安交通大学;2010年
2 王清;集成学习中若干关键问题的研究[D];复旦大学;2011年
3 方育柯;集成学习理论研究及其在个性化推荐中的应用[D];电子科技大学;2011年
4 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
5 宋相法;基于稀疏表示和集成学习的若干分类问题研究[D];西安电子科技大学;2013年
6 陆瑾;若干有机小分子生物活性和毒性的识别及预测[D];上海大学;2012年
7 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
8 谢元澄;分类器集成研究[D];南京理工大学;2009年
9 沈道义;基于最小化训练误差的子空间分类算法研究[D];中国科学技术大学;2008年
10 关菁华;基于贝叶斯网数据挖掘若干问题研究[D];吉林大学;2009年
中国硕士学位论文全文数据库 前10条
1 张家红;集成分类学习算法研究[D];山东师范大学;2011年
2 刘晓坤;基于遗传算法的混合学习和集成学习研究[D];天津大学;2003年
3 刘立元;基于集成学习的蛋白质亚细胞定位预测[D];济南大学;2011年
4 李洪伟;基于模式识别和集成学习的电力系统暂态稳定评估[D];华北电力大学(河北);2010年
5 贺梁;基于支持向量机的集成学习算法研究[D];华南理工大学;2010年
6 王晓芹;类别不平衡数据的集成学习研究[D];山东师范大学;2010年
7 曹振田;基于Q统计量的选择性集成学习研究[D];安徽大学;2010年
8 李杉;选择性聚类集成算法研究[D];山东师范大学;2010年
9 张新东;集成学习及其应用研究[D];石家庄经济学院;2010年
10 吴科主;基于多任务的多层次选择性集成学习的研究[D];安徽工业大学;2010年
中国重要报纸全文数据库 前10条
1 黄明;精子分类器决定生男生女[N];广东科技报;2000年
2 记者 姜晓凌 见习记者 王毅俊;原来,科技也能如此美丽[N];上海科技报;2007年
3 中国科学院东北地理与农业生态研究所 李建平;保护地球之肾 遥感体检湿地健康[N];中国水利报;2008年
4 CPW 张戈;Aperto PacketMAX系列可同时服务2000个用户[N];电脑商报;2005年
5 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年
6 中科院院士 戴汝为;开辟人机结合的新天地[N];计算机世界;2004年
7 本版编辑 中国科学院计算技术研究所数字媒体研究中心 山世光 陈熙霖 高文 徐昕 刘洪宇;你的脸,你的身份证明[N];中国计算机报;2006年
8 清华大学 朱健翔;人脸表情估计与表情合成[N];计算机世界;2006年
9 刘光强;LSI新一代多业务企业网关[N];中国计算机报;2007年
10 清华大学玉泉医院神外 刘伟国;意识如何进行客观评价[N];健康报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978