收藏本站
《中南大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于WEKA平台的决策树算法设计与实现

赵蕊  
【摘要】: 决策树方法在数据挖掘技术中具有很重要的作用,随着数据挖掘分类技术的广泛应用,决策树算法取得了众多研究成果,本文在深入研究和分析了主流决策树算法的基础上,基于WEKA数据挖掘平台进行了决策树算法的设计与实现,不仅有效的利用了已有数据挖掘工具,而且就已有决策树算法较少涉及的领域进行了大胆的研究和创新,提出了一种新的多值属性多类标数据决策树算法,并进行了新算法的设计与实现工作。 首先,详细介绍了开放性数据挖掘平台WEKA的功能及结构,在对决策树算法性能评价标准进行研究的基础上,本文基于WEKA平台进行了经典决策树算法性能分析的实验,并就算法的评价指标对不同算法的性能进行了比较与分析。 其次,本文对经典决策树算法的实现原理进行了深入研究,在认真学习了WEKA系统结构的基础上,将SPRINT算法在WEKA平台上实现了封装和应用,并对封装后的算法性能进行了测试,有效的利用已有数据挖掘工具实现了个性化算法的设计及应用。 为了提高对多值属性多类标数据的处理能力,本文在已有决策树算法的基础上,结合应用统计学、概率论等数学原理,提出了一种新的多值属性多类标数据决策树算法SSC。SSC算法在属性分类效果的评定机制中综合考虑了集合的同一性和一致性特征,对已有算法中基于一致性的相似度计算方法提出了改进方案,还提出在评定算法预测准确率时应采用相同的相似度评定方法的思想。最后,通过在WEKA平台中的设计和封装,进行了算法性能测试,实验结果表明SSC算法能更有效的解决多值属性多类标数据的分类问题。
【学位授予单位】:中南大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP18;TP311.52

【引证文献】
中国期刊全文数据库 前3条
1 邱云飞;李雪;王建坤;邵良杉;;面向属性值遗漏数据决策树分类算法研究[J];计算机科学;2011年10期
2 段薇;马丽;路向阳;;基于信息增益和最小距离分类的决策树改进算法[J];科学技术与工程;2013年06期
3 李治;李国琳;;AECOPD中医辨证分型决策树模型[J];长春工业大学学报(自然科学版);2013年03期
中国硕士学位论文全文数据库 前10条
1 刘靖媛;个性搜索引擎中用户兴趣模型研究[D];哈尔滨工程大学;2010年
2 王宏磊;SNMP安全态势信息获取及分析技术[D];哈尔滨工程大学;2010年
3 毕野;博客自动发现方法[D];哈尔滨工业大学;2010年
4 葛科宇;发动机磨损故障知识获取方法研究及应用平台开发[D];南京航空航天大学;2011年
5 乔保栋;转子—滚动轴承耦合系统的滚动轴承故障分析与智能诊断[D];南京航空航天大学;2011年
6 刘宇阳;一种改进的ID3决策树算法研究[D];哈尔滨工程大学;2009年
7 刘香美;基于粗糙集和灰色理论的决策树算法研究[D];西南交通大学;2010年
8 张晓航;高速公路联网收费稽查管理应用研究[D];长安大学;2010年
9 王凯;社保医疗消费中的异常信息检测研究[D];中南林业科技大学;2012年
10 张步良;基于贝叶斯的神经元分类[D];重庆交通大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 郑允弢;基于数据仓库的国内商业银行个人客户信用风险管理[J];河北工业大学学报;2005年01期
2 谭勇;一个基于SPRINT的分类算法的实现[J];湖北民族学院学报(自然科学版);2004年02期
3 曲开社,成文丽,王俊红;ID3算法的一种改进算法[J];计算机工程与应用;2003年25期
4 朱绍文,胡宏银,王泉德,张大斌,黄浩,陆玉昌;决策树采掘技术及发展趋势[J];计算机工程;2000年10期
5 郭景峰,米浦波,刘国华;决策树算法的并行性研究[J];计算机工程;2002年08期
6 李道国,苗夺谦,俞冰;决策树剪枝算法的研究与改进[J];计算机工程;2005年08期
7 魏红宁;基于SPRINT方法的并行决策树分类研究[J];计算机应用;2005年01期
8 张德丰;基于SLIQ的数据挖掘分类算法[J];计算机与现代化;2005年07期
9 滕皓,赵国毅,韩保胜;改进决策树的研究[J];济南大学学报(自然科学版);2002年03期
10 毕方明,张永平;数据挖掘技术研究[J];计算机工程与设计;2004年12期
中国硕士学位论文全文数据库 前1条
1 成文丽;基于决策树的数据挖掘算法的技术研究[D];太原理工大学;2003年
【共引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
3 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
4 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
5 袁华;章皖秋;郭洪江;;面向对象方法在Quick Bird影像分类中的应用研究[J];安徽农业科学;2011年10期
6 赵静娴;;基于决策树的食品安全评估研究[J];安徽农业科学;2011年32期
7 王斌;;基于聚类的决策树在玉米种质筛选中的应用[J];安徽农业科学;2011年33期
8 陈文;基于决策树的入侵检测的实现[J];安徽技术师范学院学报;2005年05期
9 覃爱明,胡昌振,谭惠民;网络攻击检测中的机器学习方法综述[J];安全与环境学报;2001年01期
10 彭莉芬;陈俊生;胡学钢;;基于粗糙集决策树算法的研究[J];安庆师范学院学报(自然科学版);2012年01期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 张滇豫;;学生成绩管理系统设计与实现[A];河南省冶金行业低碳冶金与节能减排学术研讨会论文集[C];2011年
3 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
4 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
5 应江勇;周宇;;决策树在我国通信行业用户预警模型中的研究应用[A];第十三届中国管理科学学术年会论文集[C];2011年
6 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
7 刘海霞;钟晓妮;周燕荣;田考聪;;决策树在居民就诊卫生服务利用影响因素研究中的应用[A];重庆市预防医学会2010年论文集[C];2011年
8 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
9 滕明鑫;高占国;杨秀清;;数据挖掘中决策树算法优化研究[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
10 郝海蓉;申永军;周亚建;;基于JNI的信息安全实验系统研究与实现[A];2007北京地区高校研究生学术交流会通信与信息技术会议论文集(上册)[C];2008年
中国博士学位论文全文数据库 前10条
1 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
2 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
3 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
4 高山;蛋白质点突变效果预测与突变数据库研究[D];南开大学;2010年
5 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
6 曹葵康;支持向量机加速方法及应用研究[D];浙江大学;2010年
7 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
8 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年
9 林龙信;仿生水下机器人的增强学习控制方法研究[D];国防科学技术大学;2010年
10 陈进;高光谱图像分类方法研究[D];国防科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
3 齐静;数据挖掘在煤炭企业人力资源管理系统中的应用[D];山东科技大学;2010年
4 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年
5 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
6 杨勇;基于SOA的浙江永康某小家电企业应用系统集成平台开发与应用[D];浙江理工大学;2010年
7 王利明;一种基于PMIPv6的智能辅助高效切换方案[D];郑州大学;2010年
8 郭慧;数据挖掘技术对放射工作人员知觉压力因素分析[D];郑州大学;2010年
9 左维松;规则和统计相结合的篇章情感倾向性分析研究[D];郑州大学;2010年
10 吴珺;数据挖掘技术在彩票销售数据分析中的应用研究[D];郑州大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 陈文;基于决策树的入侵检测的实现[J];安徽技术师范学院学报;2005年05期
2 杨基栋;;EM算法理论及其应用[J];安庆师范学院学报(自然科学版);2009年04期
3 李忠,曾昭翔,陈大融;基于 BP 神经网络的磨损微粒智能识别[J];北方交通大学学报;1998年01期
4 陈克龙;樊永平;;数据挖掘中的分类算法及其在中医证候学中的应用[J];中华中医药杂志;2011年03期
5 秦永波;陈杨林;;基于云平台的物联网数据挖掘算法的能量分析[J];成都信息工程学院学报;2010年06期
6 鲁光男;;KDD在高校教育中的应用[J];长春大学学报;2008年12期
7 王国才;张聪;;一种基于粗糙集的特征加权朴素贝叶斯分类器[J];重庆理工大学学报(自然科学版);2010年07期
8 陈向东,赵登峰,王国强,许纯新;基于神经网络的滚动轴承故障监测[J];轴承;2003年02期
9 余志红;王朝晖;陈志刚;;基于数据挖掘的轴承故障特征模式提取[J];轴承;2006年07期
10 左红;顾家铭;于锦禄;;基于支持向量机的滚动轴承故障诊断研究[J];轴承;2008年08期
中国重要会议论文全文数据库 前3条
1 刘深泉;姚良瑾;覃秋菊;吕凡;杨志华;;神经元的形态识别和电位发放特性[A];第十二届全国非线性振动暨第九届全国非线性动力学和运动稳定性学术会议论文集[C];2009年
2 姚天昉;彭思崴;;汉语主客观文本分类方法的研究[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
3 刘深泉;王期千;;神经元树突3维电缆模型的建立和计算[A];中国力学学会学术大会'2009论文摘要集[C];2009年
中国博士学位论文全文数据库 前5条
1 毛国君;数据挖掘技术与关联规则挖掘算法研究[D];北京工业大学;2003年
2 赵恒;数据挖掘中聚类若干问题研究[D];西安电子科技大学;2005年
3 管天云;多传感器信息融合研究[D];浙江大学;1998年
4 刘炜;智能元搜索引擎中个性化模式库的研究[D];太原理工大学;2007年
5 李方涛;基于产品评论的情感分析研究[D];清华大学;2011年
中国硕士学位论文全文数据库 前10条
1 纪雅楠;数据挖掘技术在高校成人教育学生成绩分析中的应用研究[D];中国海洋大学;2010年
2 万思海;基于动态频率调整的动态电源管理方案[D];合肥工业大学;2011年
3 杨国华;浅谈我国全民医疗保险制度的发展和完善[D];云南财经大学;2011年
4 米帅军;数据挖掘技术在保险行业中的应用研究[D];华东交通大学;2010年
5 陈俊杰;嵌入式系统电源管理的研究与实现[D];南京理工大学;2012年
6 郑洪英;数据挖掘聚类算法的分析和应用研究[D];重庆大学;2002年
7 胡小刚;数据挖掘中决策树分类算法的研究[D];华中师范大学;2002年
8 成文丽;基于决策树的数据挖掘算法的技术研究[D];太原理工大学;2003年
9 温丽华;灰色系统理论及其应用[D];哈尔滨工程大学;2003年
10 黄小兰;基于决策树的分类算法及实现[D];西南石油学院;2003年
【二级引证文献】
中国期刊全文数据库 前4条
1 尹婷;覃锡忠;贾振红;马军;;基于WEKA的客户流失预测研究[J];激光杂志;2013年05期
2 丁康健;刘立栋;;改进的ID3算法与原算法的比较研究[J];数字技术与应用;2013年02期
3 张阳;洪卫军;;基于用户安全模型的SNMPv3优化研究[J];信息网络安全;2012年02期
4 张爱华;;高速公路收费稽查工作探析[J];科技创新导报;2012年06期
中国博士学位论文全文数据库 前1条
1 李海峰;多源遥感数据支持的中等城市热环境研究[D];成都理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 王静;地铁分时定价对乘客出行选择影响研究[D];西南交通大学;2011年
2 韩丙卫;虚拟角色智能决策系统研究[D];上海交通大学;2011年
3 刘永翔;基于支持向量机的瓦斯突出预测研究[D];太原理工大学;2012年
4 杨斐斐;基于群组的个性化检索技术研究及应用[D];西北大学;2012年
5 赵勇;基于NetFlow和SNMP的网络流态势融合分析方法研究[D];哈尔滨工程大学;2012年
6 王淑君;商品住宅项目的定价分析[D];西南石油大学;2012年
7 尹婷;贝叶斯决策树在电信企业客户流失预测中的应用[D];新疆大学;2013年
8 白聃;医疗费用挖掘系统的设计与实现[D];黑龙江大学;2012年
9 叶文新;航空发动机机械磨损的故障诊断与风险评估[D];武汉理工大学;2013年
10 刘静;数据挖掘技术在高校CET-4成绩分析中的应用研究[D];安徽大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 朱扬勇,周欣,施伯乐;规则型数据采掘工具集AMINER[J];高技术通讯;2000年03期
2 毕建东,杨挂芳;基于熵的决策树分枝合并算法[J];哈尔滨工业大学学报;1997年02期
3 史东辉,蔡庆生,倪志伟,张春阳;基于规则的分类数据离群挖掘方法研究[J];计算机研究与发展;2000年09期
4 尹旭日,陈世福;一种基于Rough集的缺省规则挖掘算法[J];计算机研究与发展;2000年12期
5 李德毅,孟海军,史雪梅;隶属云和隶属云发生器[J];计算机研究与发展;1995年06期
6 杨阳,范志新,张天戈;关系表中数量联系规则的挖掘技术[J];计算机工程;1998年04期
7 齐琳,于玉;关于采掘广义关联规则的两个算法及其比较[J];计算机工程;2000年04期
8 刘明吉,王秀峰,王治宝,黄亚楼;一种基于遗传算法的知识挖掘算法[J];计算机工程;2000年08期
9 朱绍文,胡宏银,王泉德,张大斌,黄浩,陆玉昌;决策树采掘技术及发展趋势[J];计算机工程;2000年10期
10 郭景峰,米浦波,刘国华;决策树算法的并行性研究[J];计算机工程;2002年08期
中国硕士学位论文全文数据库 前5条
1 邓英;数据仓库与数据挖掘技术理论及应用的研究[D];甘肃工业大学;2001年
2 苏毅娟;数据挖掘中若干问题的研究[D];广西师范大学;2001年
3 张红梅;数据挖掘中快速关联规则发现算法研究及应用[D];河北工业大学;2002年
4 吴志华;基于知识发现的时序数据挖掘算法研究[D];华北工学院;2002年
5 孙孝萍;基于聚类分析的数据挖掘算法研究[D];西南石油学院;2002年
【相似文献】
中国期刊全文数据库 前10条
1 梁竹;谢长勇;罗刚;严中;;基于WEKA的高校学生综合测评数据挖掘[J];电脑知识与技术;2011年16期
2 马林;丁勇;;基于WEKA软件的图书馆数据挖掘研究[J];电脑知识与技术;2009年24期
3 董晓娜;段会川;张文娟;;基于Weka的地震数据挖掘系统的设计与实现[J];山东国土资源;2009年08期
4 王敏;刘希玉;;Apriori算法在税务系统中的应用[J];计算机技术与发展;2009年11期
5 王永娟;;Apriori算法在高校学业管理中的应用[J];铜陵学院学报;2011年02期
6 苏亚丁;;数据挖掘技术在口腔诊疗中的应用[J];信息与电脑(理论版);2011年02期
7 刘秀峰 ,詹秀菊;面向电子商务的数据挖掘技术[J];现代通信;2003年06期
8 孙京兰;;OLAP技术及数据挖掘 技术[J];中文信息;2003年04期
9 冯进;利用数据挖掘技术 深入挖掘图书馆工作[J];现代情报;2005年03期
10 王小燕;数据挖掘技术在超市中的应用研究[J];商场现代化;2005年05期
中国重要会议论文全文数据库 前10条
1 马洪杰;曲晓飞;;数据挖掘技术和过程的特点[A];面向21世纪的科技进步与社会经济发展(上册)[C];1999年
2 戈欣;吴晓芬;许建荣;;数据挖掘技术在放射科医疗管理中的潜在作用[A];2009中华医学会影像技术分会第十七次全国学术大会论文集[C];2009年
3 魏元珍;杨沂凤;;数据挖掘技术及其在数字图书馆中的应用[A];网络信息资源的搜集与应用——全国高校社科信息资料研究会第十次年会论文集[C];2004年
4 肖健;沈彩霞;;浅谈数据挖掘技术现状[A];广西计算机学会2008年年会论文集[C];2008年
5 巩耀亮;邱晓东;孙丽君;李树强;;数据挖掘技术在企业竞争情报系统中的应用研究[A];信息时代——科技情报研究学术论文集(第三辑)[C];2008年
6 王洪锋;;数据挖掘在客户关系管理中的应用研究[A];河南省通信学会2005年学术年会论文集[C];2005年
7 姚小磊;彭清华;;数据挖掘技术在中医眼科应用的设想[A];中华中医药学会第七次眼科学术交流会论文汇编[C];2008年
8 张婧;;数据挖掘技术在进销存系统中的应用[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(下)[C];2006年
9 杨利军;勾学荣;;数据挖掘在移动客户流失预测中的研究和应用[A];2008年中国高校通信类院系学术研讨会论文集(上册)[C];2009年
10 孙义明;曾继东;;数据挖掘技术及其应用[A];全国计算机安全学术交流会论文集(第二十二卷)[C];2007年
中国重要报纸全文数据库 前10条
1 陈晓 山西财经大学教师;数据挖掘技术在高校教学管理中的应用[N];山西经济日报;2010年
2 记者 吕贤如;大力加强数据挖掘技术研究应用[N];光明日报;2006年
3 主持人 李禾;数据挖掘技术如何驱动经济车轮[N];科技日报;2007年
4 首之;数据挖掘并不神秘[N];金融时报;2006年
5 ;IBM公司推出新型数据挖掘技术[N];中国高新技术产业导报;2001年
6 刘红岩、何军;利用数据挖掘技术获得商业智能[N];中国计算机报;2003年
7 山西银行学校 王林芳;数据挖掘在银行业务中的应用[N];山西科技报;2005年
8 任中华;财务数据挖掘六步走[N];中国计算机报;2007年
9 诺达咨询高级咨询顾问 周连升;数据挖掘拓展3G增值空间[N];通信产业报;2007年
10 徐扬;如何从数据中“挤出”效益[N];中国计算机报;2002年
中国博士学位论文全文数据库 前10条
1 许增福;DL环境下的信息资源管理及知识发现研究[D];哈尔滨工程大学;2005年
2 庞淑英;三江并流带旅游地质景观数据挖掘及旅游价值评价研究[D];昆明理工大学;2008年
3 赵晨;过程控制中的数据挖掘技术研究及其智能控制策略探讨[D];浙江大学;2005年
4 高清东;复杂供矿条件矿山技术指标整体动态优化系统及应用[D];北京科技大学;2005年
5 李兴;高光谱数据库及数据挖掘研究[D];中国科学院研究生院(遥感应用研究所);2006年
6 王玉峰;变电站瞬态电磁环境及微机保护系统EMC研究[D];大连理工大学;2007年
7 潘海天;数据挖掘技术在聚合过程建模与控制的应用研究[D];浙江大学;2003年
8 程其云;基于数据挖掘的电力短期负荷预测模型及方法的研究[D];重庆大学;2004年
9 束志恒;化学化工数据挖掘技术的研究[D];浙江大学;2005年
10 孙蕾;医学图像智能挖掘关键技术研究[D];西北大学;2005年
中国硕士学位论文全文数据库 前10条
1 赵蕊;基于WEKA平台的决策树算法设计与实现[D];中南大学;2007年
2 何昌霖;基于WEKA平台的数据挖掘技术在教学质量分析中的应用[D];广西民族大学;2013年
3 潘振宇;数据挖掘技术与Weka工具在河道洪水预报中的应用[D];电子科技大学;2012年
4 李亚哲;基于数据挖掘技术的求职招聘系统设计与实现[D];河北科技大学;2012年
5 赵林明;基于数据仓库的信用卡数据挖掘研究[D];山东科技大学;2005年
6 陈骏武;基于数据挖掘技术的电信客户关系管理研究[D];湖南大学;2005年
7 房静;面向CRM的数据挖掘在电力市场营销中的应用[D];天津大学;2004年
8 罗国甫;数据挖掘在银行客户经理考核系统中的应用[D];同济大学;2006年
9 王鑫;数据挖掘中聚类分析算法的研究[D];山东师范大学;2006年
10 袁明;基于网格的数据挖掘应用研究[D];西安电子科技大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026