收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

关于组合分类器修剪方法的研究

王亚松  
【摘要】:提高分类的准确率是数据挖掘和机器学习等领域一直关注的重要研究课题。组合方法是目前比较流行的机器学习算法之一。但是大部分组合方法都存在一个共同的问题:倾向于构建大量的基分类器。这样势必会加大内存需求和延长响应时间。组合修剪是处理该问题的一种有效方法,即选择全部基分类器的一个子集作为组合分类器来对未知样例进行预测。目前比较成熟的组合修剪方法有向前选择、向后选择和向前向后选择。这三种方法都是以贪心搜索的方式增加或删除一个基分类器,收敛过快,很容易达到局部最优,严重影响了修剪后所得组合分类器的性能。 针对以上组合分类器修剪方法容易达到局部最优,本文从增大搜索空间的角度出发,提出了一种基于束状搜索的组合分类器修剪方法(EPBBS)。该方法使用束状搜索策略对基分类器进行选择,在每一步增加或删除一个基分类器时都保存最优的前k个组合。既保持了原有组合修剪方法中贪心搜索算法的高效剪枝特性,又有效减小了贪心搜索过快收敛到局部最优解的可能性,使修剪得到的组合分类器更接近于全局最优。除了算法的理论分析外,本文还设计了三个实验,分别从分类性能和组合规模的角度与原有的组合修剪方法向前选择、向后选择和向前向后选择进行对比。实验结果与分析表明,EPBBS算法在大部分数据集上都具有更高的分类性能,而且组合规模也有所降低。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 傅德胜,谢忠红,苏坚;基于组合分类器的自由手写体数字识别方法[J];计算机工程与设计;2004年10期
2 张国柱,周一宇,姜文利;基于贝叶斯理论的辐射源分类识别方法研究[J];信号处理;2004年04期
3 刘新华;旷海兰;眭仁武;;一种基于粗糙集理论的组合分类器构造方法(英文)[J];衡阳师范学院学报;2006年06期
4 付彬;王志海;王中锋;;Boosting算法中基分类器权重的动态赋值[J];广西师范大学学报(自然科学版);2009年03期
5 殷镇良,韩学东,舒鑫,陈坚;一种特定条件下的人脸识别系统[J];哈尔滨工程大学学报;1999年02期
6 夏春;范明;;集成异种分类器用于入侵检测[J];微计算机信息;2008年33期
7 胡乃全;朱巧明;周国栋;;混合的汉语基本名词短语识别方法[J];计算机工程;2009年20期
8 周红英;蔺启忠;吴昀昭;王钦军;;基于AdaBoost的组合分类器在遥感影像分类中的应用[J];计算机应用研究;2007年10期
9 石国强;牛常勇;范明;;使用PCA建立基于规则的组合分类器[J];计算机科学与探索;2010年05期
10 职为梅;范明;叶阳东;;样本大小对非平衡数据分类的影响[J];微型机与应用;2010年19期
11 殷天石;孙济庆;;基于树型结构的SVM多类组合分类器在文本分类中的应用[J];情报杂志;2006年02期
12 钟淑瑛;李陶深;;基于MATLAB的BP-LVQ神经网络组合分类模型[J];计算机技术与发展;2006年02期
13 康凯;张化祥;赵斌;;一种基于核函数分割数据集的分类器组合算法[J];计算机工程与应用;2008年24期
14 闫瑞;曹先彬;李凯;;面向短文本的动态组合分类算法[J];电子学报;2009年05期
15 陈松峰;范明;;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[J];计算机科学;2010年08期
16 郑忠;曾永年;刘慧敏;徐艳艳;于菲菲;;并联结构组合分类器的误差分析[J];遥感技术与应用;2011年03期
17 旷海兰;罗可;刘新华;徐雨明;王樱;;一种基于粗糙集理论的组合分类器构造方法[J];计算机工程与应用;2006年16期
18 李亚军;刘晓霞;陈平;;改进的AdaBoost算法与SVM的组合分类器[J];计算机工程与应用;2008年32期
19 陆晓艳;周良;丁秋林;;基于组合分类器的相关反馈算法研究[J];计算机科学;2010年05期
20 何丽,韩文秀;用元决策树组合多个分类器的方法[J];计算机工程;2005年12期
中国重要会议论文全文数据库 前2条
1 徐昉;宗成庆;;汉语base NP识别:错误驱动的组合分类器方法[A];第三届学生计算语言学研讨会论文集[C];2006年
2 王占一;徐蔚然;刘东鑫;郭军;;一种基于两级分类器的垃圾短信过滤方法[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 杨水山;冷轧带钢表面缺陷机器视觉自动检测技术研究[D];哈尔滨工业大学;2009年
2 王勇;WEB数据挖掘研究[D];西北工业大学;2006年
3 许言午;面向行人检测的组合分类计算模型与应用研究[D];中国科学技术大学;2009年
4 杨哲海;高光谱影像分类若干关键技术的研究[D];解放军信息工程大学;2006年
5 张国柱;雷达辐射源识别技术研究[D];国防科学技术大学;2005年
6 毛勇;基于支持向量机的特征选择方法的研究与应用[D];浙江大学;2006年
7 贾富仓;生物医学图像组织统计分类研究[D];中国科学院研究生院(计算技术研究所);2004年
8 吕铁军;通信信号调制识别研究[D];电子科技大学;2000年
9 郭双冰;混沌时间序列预测及其混沌理论在通信信号调制识别中的应用[D];电子科技大学;2003年
10 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
中国硕士学位论文全文数据库 前10条
1 谢忠红;基于组合分类器的自由手写体数字识别方法[D];南京气象学院;2003年
2 肖伟;数据挖掘在网络故障诊断中的应用[D];南京理工大学;2004年
3 李国安;基于数据挖掘的垃圾邮件过滤技术研究[D];内蒙古大学;2008年
4 任惠;基于Stacking框架的命名实体识别[D];大连理工大学;2008年
5 闫瑞;博客数据特征提取与基于分类的垃圾博客过滤[D];中国科学技术大学;2009年
6 刘依璐;基于机器学习的中文文本分类方法研究[D];西安电子科技大学;2009年
7 伍飞;基于CT影像的肺部肿瘤计算机自动检测方法研究[D];电子科技大学;2005年
8 庄玮;基于数据挖掘的信用卡欺诈行为识别模型的研究[D];南京航空航天大学;2008年
9 吴婷;数据挖掘在信用卡欺诈识别上的应用研究[D];东南大学;2006年
10 张颜锋;基于判别式学习和组合分类器的Web文本分类技术[D];北京交通大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978