收藏本站
《郑州大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

基于规则的组合分类器的研究

石国强  
【摘要】: 分类是数据挖掘的重要研究课题之一。它广泛地应用于科学实验和商业预测等领域。如何提高分类模型的准确率是分类的核心问题,组合分类模型在理论和实验中比单个分类模型有着明显的优势。本文以规则分类为基础,深入探讨了基于规则的组合分类器。 常见的Bagging和Boosting主要是基于有放回抽样。在小样本数据集上该抽样可能引起信息丢失,造成基分类器准确率下降,从而影响整体分类性能。因此,本文使用全部的数据集建立基分类器,保证了信息的完整性,从而使基分类器有着较高的准确率。 基于上述思想,本文提出了一种使用基于规则的基分类器建立组合分类器的新方法PCARules。尽管本文的方法也采用基分类器预测的加权投票来决定待分类样本的类,但是本文为基分类器创建训练数据集的方法与Bagging和Boosting完全不同。本文的方法不是通过抽样为基分类器创建数据集,而是随机地将特征划分成k个子集,使用PCA得到每个子集的主成分,形成新的特征空间,并将所有训练数据映射到新的特征空间作为基分类器的训练集。在UCI机器学习库的30个随机选取的数据集上的实验表明:本文的算法不仅能够显著提高基于规则的分类方法的分类性能,而且与Bagging和Boosting等传统组合方法相比,本文的算法在大部分数据集上都具有更高的分类准确率。 本文研究了基分类器之间的差异性及其准确率对PCARules模型性能的影响。观察3个随机选取的数据集上的实验结果,我们发现:基分类器间的高差异性并不能保证组合分类器的高准确性(AdaBoost),相比之下,适度的差异性和较强的互补性往往能产生更好的组合分类器(PCARules);同时,基分类器本身的准确率对组合分类器的性能也可能有很大的影响,比如,在PCARules中,基分类器准确率明显高于Bagging、AdaBoost方法中的基分类器。
【学位授予单位】:

知网文化
【相似文献】
中国期刊全文数据库 前20条
1 董立岩;刘光远;苑森淼;李永丽;孙铭会;;混合式朴素贝叶斯分类模型[J];吉林大学学报(信息科学版);2007年01期
2 张震,胡捍英;基于属性Bagging kNN性能的增强[J];计算机工程;2005年15期
3 高志森;张铮;李俊;;入侵检测中贝叶斯分类器改进的研究[J];计算机技术与发展;2006年11期
4 钟萍;岑涌;席斌;;最小二乘支持向量机在医疗数据分析中的应用[J];计算机与数字工程;2007年09期
5 孙岳;毛国君;刘旭;;数据流中概念漂移检测的集成分类器设计[J];计算机应用研究;2008年01期
6 李雪婵;;基于数据库抽样的海量数据分类算法研究[J];计算机科学;2008年06期
7 刘叶青;刘三阳;谷明涛;;自训练多项式光滑的半监督支持向量机[J];系统仿真学报;2009年18期
8 程有龙;李斌;张文聪;庄镇泉;;融合先验知识的自适应行人跟踪算法[J];模式识别与人工智能;2009年05期
9 陈念;王汝传;;改进的AdaBoost算法在IDS入侵检测中的应用[J];计算机工程与应用;2010年21期
10 石洪波;吕亚丽;;因子分析降维对分类性能的影响研究[J];中北大学学报(自然科学版);2007年06期
11 王禾军;邓飞其;陈治明;;基于混沌遗传算法的模糊LS-SVM分类器及其应用[J];华南理工大学学报(自然科学版);2011年05期
12 刘鹏;姚正;尹俊杰;;一种有效的C4.5改进模型[J];清华大学学报(自然科学版);2006年S1期
13 荣秋生;谭勇;;网格平台下模糊积分分类挖掘算法的实现[J];湖北民族学院学报(自然科学版);2006年04期
14 刘殊;;面向多类别模式分类问题的新型阴性选择算法[J];计算机应用;2009年06期
15 王磊;;基于约束投影的支持向量机选择性集成[J];计算机科学;2009年10期
16 杨杨;刘会东;;一种基于成对约束的特征选择改进算法[J];南京师范大学学报(工程技术版);2011年01期
17 刘鹏;一种健壮有效的决策树改进模型[J];计算机工程与应用;2005年33期
18 蒋望东;林士敏;鲁明羽;;基于选择性集成遗传算法的BNC结构学习[J];计算机辅助工程;2006年03期
19 李广群;王志海;田凤占;;一种基于AdaBoost方法的树形HNB组合分类器[J];广西师范大学学报(自然科学版);2007年04期
20 亢俊健;杜在林;张新东;朱群英;;使用信息增益方法选择分类器[J];计算机工程与应用;2009年14期
中国重要会议论文全文数据库 前10条
1 邵小健;段华;贺国平;;一种改进的最少核分类器[A];中国运筹学会第七届学术交流会论文集(上卷)[C];2004年
2 穆明生;;基于特征集的多种分类器模型的在线笔迹认证[A];第十届全国信号处理学术年会(CCSP-2001)论文集[C];2001年
3 朱思俞;石锋;;不定人连续汉语音的四声识别[A];第二届全国人机语音通讯学术会议论文集[C];1992年
4 徐蔚然;于武贵;郭军;;基于统计方法的混排文字切分与分类[A];第八届全国汉字识别学术会议论文集[C];2002年
5 雷蕾;吴乃君;刘鹏;刘兰娟;;灵敏度分析:分类器中的缺失数据[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
6 陈颖颖;张雁军;贾鑫;;通信信号调制识别方法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
7 李烨;蔡云泽;李远贵;张强;;基于属性约简与依赖度分析改进支持向量机性能[A];第二十三届中国控制会议论文集(下册)[C];2004年
8 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
9 肖惠玲;曾翎;黄海莹;张琳;王昱清;杨勤;陈华富;;支持向量机探测脑功能活动[A];中国生物医学工程进展——2007中国生物医学工程联合学术年会论文集(下册)[C];2007年
10 沈钱波;何加铭;;连笔手写识别搜索算法研究[A];浙江省电子学会2008年学术年会论文集[C];2008年
中国重要报纸全文数据库 前10条
1 黄明;精子分类器决定生男生女[N];广东科技报;2000年
2 CPW 张戈;Aperto PacketMAX系列可同时服务2000个用户[N];电脑商报;2005年
3 记者 姜晓凌 见习记者 王毅俊;原来,科技也能如此美丽[N];上海科技报;2007年
4 中国科学院东北地理与农业生态研究所 李建平;保护地球之肾 遥感体检湿地健康[N];中国水利报;2008年
5 山水;艾斯本与NIST集合数据集[N];中国石化报;2007年
6 李宇;上市预披露将成市场常规[N];中国证券报;2008年
7 郭立;荣昌猪实现数字化[N];中国畜牧兽医报;2005年
8 记者 刘浪 通讯员 廖雅琴;中国首套数字化“可视人”数据集在渝通过成果鉴定[N];重庆日报;2003年
9 上海 陈纯;初识T-SQL,恋情的开始[N];电脑报;2004年
10 秦笃烈;解读 中国造女性数字人[N];健康报;2006年
中国博士学位论文全文数据库 前10条
1 谢元澄;分类器集成研究[D];南京理工大学;2009年
2 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
3 王喆;面向模式表示与模式源的分类器设计方法研究[D];南京航空航天大学;2008年
4 冯爱民;结构驱动的单类分类器设计及拓展研究[D];南京航空航天大学;2011年
5 宁博;面向行人检测的动态视觉词提取与集成分类方法研究[D];中国科学技术大学;2012年
6 薛晖;分类器设计中的正则化技术研究[D];南京航空航天大学;2008年
7 杨显飞;数据流集成分类器算法研究[D];哈尔滨工程大学;2011年
8 汪中;面向变化场景的行人分类检测方法研究[D];中国科学技术大学;2011年
9 王彦;基于PDE的模式识别方法[D];吉林大学;2006年
10 杨春宇;数据流上的聚类与分类算法[D];清华大学;2009年
中国硕士学位论文全文数据库 前10条
1 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
2 曹仪;组合分类器及其在公司财务困境预测中的应用[D];湖南师范大学;2013年
3 王亚松;关于组合分类器修剪方法的研究[D];郑州大学;2011年
4 潘世瑞;基于分类器集成技术的数据流分类研究[D];西北农林科技大学;2011年
5 王秀霞;分类器的选择性集成及其差异性研究[D];兰州理工大学;2011年
6 陈晓平;基于分类器选择集成的入侵检测方法研究[D];河南理工大学;2012年
7 武婷婷;分类器性能评价研究[D];北京交通大学;2010年
8 于柏森;发动机机械故障诊断系统分类器设计[D];长春工业大学;2010年
9 史亚;雷达辐射源个体识别中的分类器设计与子空间学习[D];西安电子科技大学;2011年
10 苏攀;不平衡分类器博弈模型及其在中国象棋中的应用[D];河北大学;2011年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978