收藏本站
《郑州大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

特征变换在组合分类中的应用研究

吴正娟  
【摘要】: 组合分类方法是机器学习领域逐渐发展起来的用于提高弱分类器准确性的有效方法,被认为是十几年来研究的最好的学习算法之一。大量的理论和实验研究表明:与单个分类模型相比,组合分类模型具有明显的优势。 在组合分类中,影响组合分类器性能的一个重要因素是各个基分类器间的差异性。不同的组合算法通常采用不同的方法来保证这种的差异。经典组合分类算法如Bagging、Boosting,都是从训练样本的角度出发采用随机抽样的方法来生成不同的基分类器。随机抽样能够保证基分类器的差异,但它也有缺陷——存在丢失信息的风险,特别是在训练样本集很小的情况下,这个问题就更突出了。 我们从RotationForest算法中得到启发,通过对训练数据集进行特征变换来保证基分类器的差异度。由此我们提出了一种新的组合分类算法——ICATrees。与传统的建立组合分类器方法不同是,此算法在建立组合分类器时是从数据集的特征属性出发,通过随机划分、特征变换ICA,将训练数据集映射到不同的特征空间后,再使用决策树分类算法J48对其进行学习,生成基分类器。该算法是基于完整训练数据集进行学习的,从而能够有效地避免抽样所带来信息丢失的问题。通过随机划分和特征变换,该算法不但能够保证各个基分类器的差异,并且在随机选取的30个UCI数据集上的实验表明,与Boosting相比,在分类准确率上也有了一定的提高。
【学位授予单位】:郑州大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:TP181

【参考文献】
中国博士学位论文全文数据库 前3条
1 韩斌;基于数据挖掘的信息融合理论和应用[D];浙江大学;2002年
2 刘直芳;人脸检测和识别的研究[D];四川大学;2004年
3 刘昆宏;多分类器集成系统在基因微阵列数据分析中的应用[D];中国科学技术大学;2008年
中国硕士学位论文全文数据库 前2条
1 张脂平;因子分析算法的研究及其在Web文本特征提取中的应用[D];福州大学;2005年
2 王振华;基于决策树的分布式分类算法研究[D];郑州大学;2005年
【共引文献】
中国期刊全文数据库 前10条
1 王东霞;张楠;路晓丽;;基于育种算法的SVM参数优化[J];安徽大学学报(自然科学版);2009年04期
2 潘希姣;;多子群粒子群集成神经网络[J];安徽建筑工业学院学报(自然科学版);2007年02期
3 李亭;杨敬锋;彭晓琴;陈志民;;基于最大似然法集成的黄曲条跳甲预警模型[J];安徽农业科学;2008年25期
4 时雷;虎晓红;席磊;段其国;;集成学习技术在农业中的应用[J];安徽农业科学;2008年26期
5 周锐;朱祖林;;基于成绩库的远程学习者流失预测决策树的应用研究[J];安庆师范学院学报(自然科学版);2009年02期
6 季越江;吕佳;;基于聚类分析的客户细分研究[J];办公自动化;2009年08期
7 许子君;杜秋;栾超;;Apriori改进算法在军队院校干部考核中的应用[J];兵工自动化;2012年03期
8 李文斌;刘椿年;钟宁;;基于两阶段集成学习的分类器集成[J];北京工业大学学报;2010年03期
9 蒋宗礼;徐学可;;一种基于集成学习与类指示器的文本分类方法[J];北京工业大学学报;2010年04期
10 李飞;高小榕;高上凯;;基于随机森林算法的高维脑电特征优选[J];北京生物医学工程;2007年04期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 杜方键;杨宏晖;;K均值聚类优化集成学习[A];2011'中国西部声学学术交流会论文集[C];2011年
3 王伟珍;刘春红;张漫;李民赞;刘刚;;基于BP神经网络的温室番茄光合作用速率预测模型研究[A];中国农业工程学会2011年学术年会论文集[C];2011年
4 杜晓凤;丁友东;;FloatBag选择性神经网络集成及其在人脸检测中的应用[A];第十二届全国信号处理学术年会(CCSP-2005)论文集[C];2005年
5 张乃岳;张力;张学燕;;基于字段匹配的CRM数据挖掘算法与应用[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年
6 陈华杰;韦巍;;一种基于元泛化的Bagged Boosting算法[A];2005中国控制与决策学术年会论文集(上)[C];2005年
7 ;Adaptive multi-LSSVR based soft sensing for cobalt oxalate synthesis process[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
8 ;Multiple ANNs Combined Scheme for Fault Diagnosis of Power Transformers[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
9 师凯;蔡延光;邹谷山;王涛;;蚁群算法及粒子群算法对比及在VRP中的应用[A];第二十四届中国控制会议论文集(下册)[C];2005年
10 刘峰;瞿俊;;基于聚类分析和神经网络的时间序列预测方法[A];2006年全国开放式分布与并行计算学术会议论文集(一)[C];2006年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 韩道;基于人体和小动物数据库的生理组M3L平台构建[D];华中科技大学;2010年
3 吴学雁;金融时间序列模式挖掘方法的研究[D];华南理工大学;2010年
4 邓斌;B2C在线评论中的客户知识管理研究[D];电子科技大学;2010年
5 苏煜;基于SCF范式的在线P300脑机接口研究[D];浙江大学;2010年
6 杜方;复杂网络系统间相似性识别及其应用[D];浙江大学;2010年
7 甘良志;核学习算法与集成方法研究[D];浙江大学;2010年
8 闫中敏;Deep Web数据获取问题研究[D];山东大学;2010年
9 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
10 陈进;高光谱图像分类方法研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 马冉冉;集成学习算法研究[D];山东科技大学;2010年
2 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
3 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
4 刘建东;基于Web访问信息挖掘的数字图书馆个性化服务研究[D];浙江理工大学;2010年
5 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
6 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年
7 曹彦;基于支持向量机的特征选择及其集成方法的研究[D];郑州大学;2010年
8 周驰;数据流上概念漂移的检测和分类[D];郑州大学;2010年
9 琚长涛;一种带有聚类功能的边界检测算法的研究[D];郑州大学;2010年
10 王勇;一种面向隐私保护的分布式数据流挖掘算法[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前10条
1 王伟,马建光;人脸识别常用方法及其发展现状[J];兵工自动化;2002年01期
2 林鸿飞,战学刚,姚天顺;中文文本挖掘的特征导航机制[J];东北大学学报;2000年03期
3 袁超,张长水;基于多模板匹配的自动人脸检测[J];电子学报;2000年03期
4 周杰,卢春雨,张长水,李衍达;人脸自动识别方法综述[J];电子学报;2000年04期
5 邢昕,汪孔桥,沈兰荪;基于器官跟踪的人脸实时跟踪方法[J];电子学报;2000年06期
6 凌旭峰,杨杰,朱一坦;彩色序列图像的人脸检测[J];红外与激光工程;2001年05期
7 李振星,徐泽平,唐卫清,唐荣锡;全二分最大匹配快速分词算法[J];计算机工程与应用;2002年11期
8 刘贵龙,王慧玲,宋柔;矩阵的奇异值分解在文本分类研究中的应用[J];计算机工程;2002年12期
9 周激流,张晔;人脸识别理论研究进展[J];计算机辅助设计与图形学学报;1999年02期
10 杨竹青,毛锦,胡德文;独立成分分析方法在图象处理中的应用[J];计算机工程与科学;2002年05期
中国博士学位论文全文数据库 前1条
1 郑春厚;独立分量分析算法及其应用研究[D];中国科学技术大学;2006年
【相似文献】
中国期刊全文数据库 前10条
1 傅德胜,谢忠红,苏坚;基于组合分类器的自由手写体数字识别方法[J];计算机工程与设计;2004年10期
2 张国柱,周一宇,姜文利;基于贝叶斯理论的辐射源分类识别方法研究[J];信号处理;2004年04期
3 刘新华;旷海兰;眭仁武;;一种基于粗糙集理论的组合分类器构造方法(英文)[J];衡阳师范学院学报;2006年06期
4 付彬;王志海;王中锋;;Boosting算法中基分类器权重的动态赋值[J];广西师范大学学报(自然科学版);2009年03期
5 殷镇良,韩学东,舒鑫,陈坚;一种特定条件下的人脸识别系统[J];哈尔滨工程大学学报;1999年02期
6 夏春;范明;;集成异种分类器用于入侵检测[J];微计算机信息;2008年33期
7 胡乃全;朱巧明;周国栋;;混合的汉语基本名词短语识别方法[J];计算机工程;2009年20期
8 周红英;蔺启忠;吴昀昭;王钦军;;基于AdaBoost的组合分类器在遥感影像分类中的应用[J];计算机应用研究;2007年10期
9 石国强;牛常勇;范明;;使用PCA建立基于规则的组合分类器[J];计算机科学与探索;2010年05期
10 职为梅;范明;叶阳东;;样本大小对非平衡数据分类的影响[J];微型机与应用;2010年19期
中国重要会议论文全文数据库 前2条
1 徐昉;宗成庆;;汉语base NP识别:错误驱动的组合分类器方法[A];第三届学生计算语言学研讨会论文集[C];2006年
2 王占一;徐蔚然;刘东鑫;郭军;;一种基于两级分类器的垃圾短信过滤方法[A];第五届全国信息检索学术会议论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 杨水山;冷轧带钢表面缺陷机器视觉自动检测技术研究[D];哈尔滨工业大学;2009年
2 王勇;WEB数据挖掘研究[D];西北工业大学;2006年
3 许言午;面向行人检测的组合分类计算模型与应用研究[D];中国科学技术大学;2009年
4 杨哲海;高光谱影像分类若干关键技术的研究[D];解放军信息工程大学;2006年
5 张国柱;雷达辐射源识别技术研究[D];国防科学技术大学;2005年
6 毛勇;基于支持向量机的特征选择方法的研究与应用[D];浙江大学;2006年
7 贾富仓;生物医学图像组织统计分类研究[D];中国科学院研究生院(计算技术研究所);2004年
8 吕铁军;通信信号调制识别研究[D];电子科技大学;2000年
9 郭双冰;混沌时间序列预测及其混沌理论在通信信号调制识别中的应用[D];电子科技大学;2003年
10 严志永;在划分数据空间的视角下基于决策边界的分类器研究[D];浙江大学;2011年
中国硕士学位论文全文数据库 前10条
1 李俊磊;多组合分类器在局部区域气温预测中的研究与应用[D];广东工业大学;2014年
2 谢忠红;基于组合分类器的自由手写体数字识别方法[D];南京气象学院;2003年
3 肖伟;数据挖掘在网络故障诊断中的应用[D];南京理工大学;2004年
4 李国安;基于数据挖掘的垃圾邮件过滤技术研究[D];内蒙古大学;2008年
5 任惠;基于Stacking框架的命名实体识别[D];大连理工大学;2008年
6 闫瑞;博客数据特征提取与基于分类的垃圾博客过滤[D];中国科学技术大学;2009年
7 刘依璐;基于机器学习的中文文本分类方法研究[D];西安电子科技大学;2009年
8 伍飞;基于CT影像的肺部肿瘤计算机自动检测方法研究[D];电子科技大学;2005年
9 庄玮;基于数据挖掘的信用卡欺诈行为识别模型的研究[D];南京航空航天大学;2008年
10 吴婷;数据挖掘在信用卡欺诈识别上的应用研究[D];东南大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026