收藏本站
《郑州大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

关于组合分类器修剪方法的研究

王亚松  
【摘要】:提高分类的准确率是数据挖掘和机器学习等领域一直关注的重要研究课题。组合方法是目前比较流行的机器学习算法之一。但是大部分组合方法都存在一个共同的问题:倾向于构建大量的基分类器。这样势必会加大内存需求和延长响应时间。组合修剪是处理该问题的一种有效方法,即选择全部基分类器的一个子集作为组合分类器来对未知样例进行预测。目前比较成熟的组合修剪方法有向前选择、向后选择和向前向后选择。这三种方法都是以贪心搜索的方式增加或删除一个基分类器,收敛过快,很容易达到局部最优,严重影响了修剪后所得组合分类器的性能。 针对以上组合分类器修剪方法容易达到局部最优,本文从增大搜索空间的角度出发,提出了一种基于束状搜索的组合分类器修剪方法(EPBBS)。该方法使用束状搜索策略对基分类器进行选择,在每一步增加或删除一个基分类器时都保存最优的前k个组合。既保持了原有组合修剪方法中贪心搜索算法的高效剪枝特性,又有效减小了贪心搜索过快收敛到局部最优解的可能性,使修剪得到的组合分类器更接近于全局最优。除了算法的理论分析外,本文还设计了三个实验,分别从分类性能和组合规模的角度与原有的组合修剪方法向前选择、向后选择和向前向后选择进行对比。实验结果与分析表明,EPBBS算法在大部分数据集上都具有更高的分类性能,而且组合规模也有所降低。
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP181

手机知网App
【参考文献】
中国期刊全文数据库 前2条
1 韩宏;杨静宇;;多分类器组合及其应用[J];计算机科学;2000年01期
2 杨利英,覃征,王卫红;多分类器融合系统设计与应用[J];计算机工程;2005年05期
【共引文献】
中国期刊全文数据库 前10条
1 王东霞;张楠;路晓丽;;基于育种算法的SVM参数优化[J];安徽大学学报(自然科学版);2009年04期
2 周锐;朱祖林;;基于成绩库的远程学习者流失预测决策树的应用研究[J];安庆师范学院学报(自然科学版);2009年02期
3 林正奎;唐焕玲;鲁明羽;王敬东;;基于特征多视图提升Naive Bayesian的Boosting改进算法[J];北京交通大学学报;2009年06期
4 季越江;吕佳;;基于聚类分析的客户细分研究[J];办公自动化;2009年08期
5 许子君;杜秋;栾超;;Apriori改进算法在军队院校干部考核中的应用[J];兵工自动化;2012年03期
6 马猛;钮俊清;宁岩;郑浩然;王煦法;;聚类和关联规则挖掘在基因表达数据分析中的应用研究[J];北京生物医学工程;2008年04期
7 张英锋;马彪;房京;张海岭;范昱珩;;Fault diagnosis of power-shift steering transmission based on multiple outputs least squares support vector regression[J];Journal of Beijing Institute of Technology;2011年02期
8 郑继刚;杨玲;杨春华;曾庆红;赵若男;;网络入侵分析关联规则挖掘系统设计[J];保山学院学报;2011年05期
9 于洪;谌强;;一种结合K-Means的层次化的搜索结果聚类方法[J];重庆邮电大学学报(自然科学版);2010年03期
10 陈可华;;文本自动分类新探究[J];赤峰学院学报(自然科学版);2011年04期
中国重要会议论文全文数据库 前5条
1 夏俊士;杜培军;张伟;;遥感影像多分类器集成系统的设计与实现[A];中国测绘学会2010年学术年会论文集[C];2010年
2 张乃岳;张力;张学燕;;基于字段匹配的CRM数据挖掘算法与应用[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
3 曹晖;司刚全;张彦斌;贾立新;;基于聚类分析的模糊控制算法在制粉系统中的应用[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
4 曹晖;司刚全;张彦斌;贾立新;;基于模糊时序数据挖掘的火电厂制粉系统优化算法[A];2007'仪表,自动化及先进集成技术大会论文集(一)[C];2007年
5 潘国林;杨帆;;数据挖掘算法在保险客户分析中的应用[A];全国第20届计算机技术与应用学术会议(CACIS·2009)暨全国第1届安全关键技术与应用学术会议论文集(上册)[C];2009年
中国博士学位论文全文数据库 前10条
1 邬俊;基于交互式语义推理的图像检索算法研究[D];大连海事大学;2010年
2 韩道;基于人体和小动物数据库的生理组M3L平台构建[D];华中科技大学;2010年
3 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
4 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
5 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
6 齐峰;人工神经树网络模型的优化研究与应用[D];山东师范大学;2011年
7 王中锋;树型贝叶斯网络分类器鉴别式训练研究[D];北京交通大学;2011年
8 韩燕清;中药治疗多囊卵巢综合征文献数据库的建立及中药疗效的数据分析[D];北京中医药大学;2011年
9 胡毅;关节式坐标测量机热变形误差建模及修正研究[D];合肥工业大学;2011年
10 于宏波;阳痿肾阳虚证症状规律及其转录组特征研究[D];成都中医药大学;2011年
中国硕士学位论文全文数据库 前10条
1 刘建东;基于Web访问信息挖掘的数字图书馆个性化服务研究[D];浙江理工大学;2010年
2 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
3 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年
4 吴正娟;特征变换在组合分类中的应用研究[D];郑州大学;2010年
5 琚长涛;一种带有聚类功能的边界检测算法的研究[D];郑州大学;2010年
6 王勇;一种面向隐私保护的分布式数据流挖掘算法[D];哈尔滨工程大学;2010年
7 徐艳红;基于倾斜时间窗口的频繁项集挖掘算法研究[D];哈尔滨工程大学;2010年
8 侯宗仁;TD-SCDMA网络性能分析系统的设计与实现[D];大连理工大学;2010年
9 刘晨;XML文档聚类的研究[D];大连理工大学;2010年
10 李艳萍;基于自主学习的移动机器人质心偏移控制策略[D];大连理工大学;2010年
【二级参考文献】
中国期刊全文数据库 前1条
1 张晓刚,张纳温,贺正洪;基于BP网络的一种机型识别方法[J];空军工程大学学报(自然科学版);2001年05期
【相似文献】
中国期刊全文数据库 前10条
1 钟以维;徐应涛;张莹;;用填充函数法改进的人脸比对算法[J];计算机技术与发展;2009年08期
2 徐昉,邱道尹,沈宪章;粮仓害虫的特征提取与分类的研究[J];郑州工业大学学报;2000年04期
3 徐科,徐金梧,班晓娟;冷轧带钢表面质量自动监测系统的模式识别方法研究[J];钢铁;2002年06期
4 王勇;李战怀;张阳;;未知真实类标记条件下数据流中的变化发现方法[J];西北工业大学学报;2006年02期
5 张若琳;万力;张发旺;石迎春;;土地利用遥感分类方法研究进展[J];南水北调与水利科技;2006年02期
6 毕晓冬;;基于流分类技术的MPLS协议数据转发研究[J];山东师范大学学报(自然科学版);2006年02期
7 高志森;张铮;李俊;;入侵检测中贝叶斯分类器改进的研究[J];计算机技术与发展;2006年11期
8 王晓东;丁冬花;;实时车辆检测和跟踪系统设计[J];微计算机信息;2006年32期
9 董立岩;刘光远;苑森淼;李永丽;孙铭会;;混合式朴素贝叶斯分类模型[J];吉林大学学报(信息科学版);2007年01期
10 刘慧婷;倪志伟;李建洋;刘政怡;;基于交叉覆盖算法的时间序列模式匹配[J];计算机应用;2007年02期
中国重要会议论文全文数据库 前10条
1 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
2 朱思俞;石锋;;不定人连续汉语音的四声识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
3 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
4 徐蔚然;于武贵;郭军;;基于统计方法的混排文字切分与分类[A];第八届全国汉字识别学术会议论文集[C];2002年
5 雷蕾;吴乃君;刘鹏;刘兰娟;;灵敏度分析:分类器中的缺失数据[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
6 陈颖颖;张雁军;贾鑫;;通信信号调制识别方法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
7 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
8 肖惠玲;曾翎;黄海莹;张琳;王昱清;杨勤;陈华富;;支持向量机探测脑功能活动[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
9 沈钱波;何加铭;;连笔手写识别搜索算法研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
10 薛忠;李艳;谢维信;;一种改进的模糊联想分类器[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
中国重要报纸全文数据库 前10条
1 黄明;精子分类器决定生男生女[N];广东科技报;2000年
2 CPW 张戈;Aperto PacketMAX系列可同时服务2000个用户[N];电脑商报;2005年
3 记者 姜晓凌 见习记者 王毅俊;原来,科技也能如此美丽[N];上海科技报;2007年
4 中国科学院东北地理与农业生态研究所 李建平;保护地球之肾 遥感体检湿地健康[N];中国水利报;2008年
5 本版编辑 中国科学院计算技术研究所数字媒体研究中心 山世光 陈熙霖 高文 徐昕 刘洪宇;你的脸,你的身份证明[N];中国计算机报;2006年
6 中科院院士 戴汝为;开辟人机结合的新天地[N];计算机世界;2004年
7 武德锋 李国辉 林洪文 姚作梁;图像世界任我行[N];计算机世界;2002年
8 刘光强;LSI新一代多业务企业网关[N];中国计算机报;2007年
9 清华大学玉泉医院神外 刘伟国;意识如何进行客观评价[N];健康报;2008年
10 清华大学 朱健翔;人脸表情估计与表情合成[N];计算机世界;2006年
中国博士学位论文全文数据库 前10条
1 王喆;面向模式表示与模式源的分类器设计方法研究[D];南京航空航天大学;2008年
2 谢元澄;分类器集成研究[D];南京理工大学;2009年
3 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
4 杨显飞;数据流集成分类器算法研究[D];哈尔滨工程大学;2011年
5 冯爱民;结构驱动的单类分类器设计及拓展研究[D];南京航空航天大学;2011年
6 宁博;面向行人检测的动态视觉词提取与集成分类方法研究[D];中国科学技术大学;2012年
7 汪中;面向变化场景的行人分类检测方法研究[D];中国科学技术大学;2011年
8 薛晖;分类器设计中的正则化技术研究[D];南京航空航天大学;2008年
9 王彦;基于PDE的模式识别方法[D];吉林大学;2006年
10 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
中国硕士学位论文全文数据库 前10条
1 王亚松;关于组合分类器修剪方法的研究[D];郑州大学;2011年
2 武婷婷;分类器性能评价研究[D];北京交通大学;2010年
3 潘世瑞;基于分类器集成技术的数据流分类研究[D];西北农林科技大学;2011年
4 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
5 于柏森;发动机机械故障诊断系统分类器设计[D];长春工业大学;2010年
6 王秀霞;分类器的选择性集成及其差异性研究[D];兰州理工大学;2011年
7 邱立;支持向量机和神经网络在手写数字识别算法中的应用研究[D];华南理工大学;2010年
8 蔡晰;半监督联合训练分类方法研究及其应用[D];福建师范大学;2010年
9 史亚;雷达辐射源个体识别中的分类器设计与子空间学习[D];西安电子科技大学;2011年
10 苏攀;不平衡分类器博弈模型及其在中国象棋中的应用[D];河北大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026