收藏本站
《太原理工大学》 2003年
收藏 | 手机打开
二维码
手机客户端打开本文

基于决策树的数据挖掘算法的技术研究

成文丽  
【摘要】: 决策树学习算法在数据挖掘技术中具有很重要的作用,本文研究了决策树学习算法中最为重要的一种ID3(Information Definition)算法,并引入用户兴趣度的概念定义了ID3的改进算法,在一定程度上解决了决策支持过程中大数据掩盖小数据的问题。 首先,本文提出了在传统ID3算法的基础上,引入用户兴趣度的概念来改进ID3算法,在ID3算法信息熵计算公式中,对信息量加权和增加用户兴趣度,使得算法不仅仅是依赖实例进行分类,而是在实例的基础上对具体属性加入先验知识调节其对分类的信息量,提高分类的准确性,并用实例验证了改进算法的有效性。 其次,提出了利用属性对正例的影响度来比较属性对分类提供的信息量,进而选择分类属性构造决策树的条件概率决策树算法,同时实例计算说明该算法有效地简化了决策树的生成过程。 为了对算法进行评价,论文还设计了一个用不同算法对罗斯文商贸数据库进行规则提取的试验系统,利用该系统提取了非常实用的商业规则。
【学位授予单位】:太原理工大学
【学位级别】:硕士
【学位授予年份】:2003
【分类号】:TP311.131

【引证文献】
中国硕士学位论文全文数据库 前10条
1 王宏磊;SNMP安全态势信息获取及分析技术[D];哈尔滨工程大学;2010年
2 刘燕燕;基于数据挖掘技术的管道腐蚀检测系统的研究与开发[D];沈阳理工大学;2010年
3 胡泊;部队政治干部考评信息系统的开发与实现[D];电子科技大学;2012年
4 万永锋;决策树学习算法在金融自助设备监控系统中的应用[D];郑州大学;2007年
5 赵蕊;基于WEKA平台的决策树算法设计与实现[D];中南大学;2007年
6 赵旺明;数据挖掘在军队干部能力素质培训系统中的应用研究[D];昆明理工大学;2008年
7 谢政;基于贝叶斯方法的分类问题研究[D];中南大学;2008年
8 王琴;决策树算法在高校研究生就业信息库中的应用研究[D];武汉理工大学;2010年
9 邝继红;数据挖掘在教务系统成绩分析中的应用研究[D];吉林大学;2012年
10 王迎云;基于决策树算法的学生成绩挖掘与分析[D];安徽大学;2012年
【参考文献】
中国期刊全文数据库 前5条
1 朱绍文,胡宏银,王泉德,张大斌,黄浩,陆玉昌;决策树采掘技术及发展趋势[J];计算机工程;2000年10期
2 郭景峰,米浦波,刘国华;决策树算法的并行性研究[J];计算机工程;2002年08期
3 滕皓,赵国毅,韩保胜;改进决策树的研究[J];济南大学学报(自然科学版);2002年03期
4 杨明,张载鸿;决策树学习算法ID3的研究[J];微机发展;2002年05期
5 杨清,杨岳湘;基于决策树的学习算法[J];湘潭师范学院学报(社会科学版);1999年03期
【共引文献】
中国期刊全文数据库 前10条
1 张世海,刘晓燕,欧进萍;高层结构智能选型知识发现及方法比较[J];四川建筑科学研究;2005年05期
2 潘洁珠;半结构化数据及其数据模型[J];安徽教育学院学报;2003年06期
3 赵鹏,倪志伟,贾瑞玉;基于数据挖掘技术的范例库维护[J];安徽大学学报(自然科学版);2003年02期
4 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
5 梁佩佩,杨丽萍;基于模糊关系数据库的聚类算法研究[J];安徽职业技术学院学报;2004年01期
6 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
7 章曙光;耿焕同;;一种改进的基于聚类的范例添加删除维护模型[J];安徽建筑工业学院学报(自然科学版);2006年01期
8 李永森;潘若愚;李传军;;公共设施选址优化研究[J];安徽建筑工业学院学报(自然科学版);2009年06期
9 李红梅;贺小扬;王雪冬;;粗糙集理论在农业知识发现中的应用研究[J];安徽农业科学;2008年06期
10 唐超礼;魏圆圆;;基于数据挖掘的植保预测系统[J];安徽农业科学;2008年12期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 章曙光;;基于CBR的电力负荷预测系统的研究与实现[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
4 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
5 查星云;;一种钢铁企业金属损耗平衡分析方法[A];全国冶金自动化信息网2012年年会论文集[C];2012年
6 应江勇;周宇;;决策树在我国通信行业用户预警模型中的研究应用[A];第十三届中国管理科学学术年会论文集[C];2011年
7 鲁松;;英文介词短语归并歧义的RMBL分类器消解[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
8 汤广富;马春实;刘欢;付强;;模糊聚类快速实用方法[A];第十四届全国信号处理学术年会(CCSP-2009)论文集[C];2009年
9 刘海霞;钟晓妮;周燕荣;田考聪;;决策树在居民就诊卫生服务利用影响因素研究中的应用[A];重庆市预防医学会2010年论文集[C];2011年
10 汪云亮;吕久明;刘孝刚;;基于信息熵的辐射源属性分类方法[A];2006北京地区高校研究生学术交流会——通信与信息技术会议论文集(上)[C];2006年
中国博士学位论文全文数据库 前10条
1 王杰;基于人工智能的乒乓球比赛技战术诊断与评估研究[D];上海体育学院;2010年
2 牟向伟;模糊语义个性化推荐系统在电子政务中的应用研究[D];大连海事大学;2010年
3 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
4 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
5 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
6 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
7 戴小鹏;知识网格及其在农业生物灾害预警中关键技术研究[D];湖南农业大学;2010年
8 朱佳俊;不确定可拓群决策优化方法及应用[D];东华大学;2010年
9 陈进;高光谱图像分类方法研究[D];国防科学技术大学;2010年
10 管红波;食品连锁经营中的有效客户反应研究[D];东华大学;2010年
中国硕士学位论文全文数据库 前10条
1 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
2 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
3 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
4 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年
5 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
6 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
7 孙原;基于酉变换的权威页面挖掘算法研究[D];哈尔滨工程大学;2010年
8 刘洁;基于关联挖掘的深层网络接口模式匹配方法的研究[D];哈尔滨工程大学;2010年
9 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
10 秦园;基于SPOT5的土地信息提取技术研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 曹丹阳;李晋宏;魏金强;张艳芳;;基于决策树的英语四级成绩分析[J];北方工业大学学报;2007年01期
2 刘雨露;;数据挖掘在高校学生管理决策中的应用模式分析[J];成都信息工程学院学报;2006年03期
3 朱小琴,邱友申,曾凡仔,李国华;大型煤矿机械电子监控与故障诊断系统的研制[J];长沙大学学报;2001年04期
4 孟祥萍,鞠传香,王贤勇,任纪川;粗糙集理论中基于属性重要性的离散化方法[J];东北电力学院学报;2005年01期
5 黄进,尹治本;关联规则挖掘的Apriori算法的改进[J];电子科技大学学报;2003年01期
6 张德新,崔巍,章平;数据仓库与人才素质评价[J];电脑与信息技术;2002年01期
7 李凡生,陈庆吉;决策树分类算法在发电设备状态检修中的应用研究[J];电网技术;2003年12期
8 谷琼;朱莉;蔡之华;袁红星;;基于决策树技术的高校研究生信息库数据挖掘研究[J];电子技术应用;2006年01期
9 姜园,张朝阳,仇佩亮,周东方;用于数据挖掘的聚类算法[J];电子与信息学报;2005年04期
10 王莉;;ID3算法的研究与应用[J];福建电脑;2010年01期
中国博士学位论文全文数据库 前2条
1 管天云;多传感器信息融合研究[D];浙江大学;1998年
2 董永权;Deep Web数据集成关键问题研究[D];山东大学;2010年
中国硕士学位论文全文数据库 前10条
1 戴南;基于决策树的分类方法研究[D];南京师范大学;2003年
2 姜卯生;数据挖掘中基于贝叶斯技术的分类问题的研究[D];合肥工业大学;2004年
3 陈爱斌;基于支持向量机的车型识别[D];中南大学;2004年
4 张海笑;数据挖掘分类技术在高校教学中的应用研究[D];广东工业大学;2005年
5 王威;基于决策树的数据挖掘算法优化研究[D];西南交通大学;2005年
6 魏涛;基于决策树的教育信息挖掘模型(DT-EIDM)的设计与实现[D];上海海事大学;2005年
7 胡江洪;基于决策树的分类算法研究[D];武汉理工大学;2006年
8 赵卫东;数据融合在入侵检测中的应用研究[D];河北大学;2006年
9 王鑫;数据挖掘中聚类分析算法的研究[D];山东师范大学;2006年
10 于承敏;高校教务管理系统中的数据分析和模型研究[D];华东师范大学;2006年
【二级引证文献】
中国期刊全文数据库 前4条
1 邱云飞;李雪;王建坤;邵良杉;;面向属性值遗漏数据决策树分类算法研究[J];计算机科学;2011年10期
2 赵国彦;刘强;刘超;;岩爆烈度分级预测中的贝叶斯判别分析[J];金属矿山;2010年05期
3 沈洪远;卢灿;杨树仁;刘建勋;;相关向量机及其在铜锍吹炼中的应用研究[J];湖南科技大学学报(自然科学版);2011年03期
4 张阳;洪卫军;;基于用户安全模型的SNMPv3优化研究[J];信息网络安全;2012年02期
中国硕士学位论文全文数据库 前10条
1 刘靖媛;个性搜索引擎中用户兴趣模型研究[D];哈尔滨工程大学;2010年
2 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
3 王宏磊;SNMP安全态势信息获取及分析技术[D];哈尔滨工程大学;2010年
4 李海丰;基于Lucene的企业文档搜索引擎研究与应用[D];中南林业科技大学;2009年
5 吴学辉;基于粗糙集的决策树算法在高校评教中的应用[D];太原理工大学;2011年
6 刘海燕;基于决策树分类算法的学习成绩分析系统的设计与实现[D];电子科技大学;2011年
7 毕野;博客自动发现方法[D];哈尔滨工业大学;2010年
8 葛科宇;发动机磨损故障知识获取方法研究及应用平台开发[D];南京航空航天大学;2011年
9 乔保栋;转子—滚动轴承耦合系统的滚动轴承故障分析与智能诊断[D];南京航空航天大学;2011年
10 胡尉;数据挖掘技术在远程教学系统中的运用[D];中山大学;2011年
【相似文献】
中国期刊全文数据库 前10条
1 王源;王甜甜;;改进决策树算法的应用研究[J];电子科技;2010年09期
2 张凤莲;林健良;;新的决策树构造方法[J];计算机工程与应用;2009年10期
3 赵德才;;决策树方法使用中的改进策略[J];科技信息;2010年08期
4 张伟;;数据挖掘中的ID3算法研究与实现[J];软件导刊;2010年05期
5 许旌莹;;决策树算法在图书馆个性化服务中的应用研究[J];科技信息;2011年14期
6 王莉;;ID3算法的研究与应用[J];福建电脑;2010年01期
7 谢妞妞;刘於勋;;决策树属性选择标准的改进[J];计算机工程与应用;2010年34期
8 徐远纯,盛昭瀚,柳炳祥;一种基于决策树的客户流失危机分析方法[J];计算机与现代化;2004年08期
9 蹇滔;谭建明;母晓科;;ID3算法在军事训练成绩分析中的应用[J];电脑知识与技术;2009年19期
10 程俊静;林意;;数据挖掘技术在教学管理系统中的应用[J];数字技术与应用;2011年05期
中国重要会议论文全文数据库 前10条
1 卜亚杰;胡朝举;;一种改进的ID3算法[A];第一届中国高校通信类院系学术研讨会论文集[C];2007年
2 王楠;慕晓冬;王宁燕;宋洪军;李佳晨;张阳子;;针对多线程架构的决策树查询算法优化及应用[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
3 黄冬梅;孙国基;王熙照;哈明虎;;决策树生成过程中模糊数值属性的处理(英文)[A];中国系统工程学会模糊数学与模糊系统委员会第十一届年会论文选集[C];2002年
4 杨磊;王贵成;汪勇;张占胜;;SQL Server 2005在数据挖掘中的应用[A];2009年中国智能自动化会议论文集(第二分册)[C];2009年
5 张守娟;周诠;;空间数据挖掘决策树算法在遥感图像分类中的应用研究[A];中国遥感应用协会2010年会暨区域遥感发展与产业高层论坛论文集[C];2010年
6 黄冬梅;花强;高印芝;;产生模糊决策树的一个新算法[A];模糊集理论与应用——98年中国模糊数学与模糊系统委员会第九届年会论文选集[C];1998年
7 丁鹏;徐波;;基于决策树的海量语音数据处理与建模[A];第六届全国人机语音通讯学术会议论文集[C];2001年
8 田松;;面向属性归纳的决策树算法在壁画病害信息提取方面的应用[A];2009`中国地理信息产业论坛暨第二届教育论坛就业洽谈会论文集[C];2009年
9 桑明茜;;决策树在财务报表分析中的应用[A];中国自动化学会、中国仪器仪表学会2004年西南三省一市自动化与仪器仪表学术年会论文集[C];2004年
10 曹阳;黄泰翼;;基于统计方法的汉语连续语音中声调模式的研究[A];第九届全国信号处理学术年会(CCSP-99)论文集[C];1999年
中国重要报纸全文数据库 前10条
1 陈芝蓉;举棋不定时 试试决策树[N];健康报;2004年
2 何志高;一“枝”一“节”总关情[N];医药经济报;2001年
3 徐筱舫;新法治脑转移指南成“决策树”[N];健康报;2008年
4 孙涤;祈愿刍议(一)[N];南方周末;2007年
5 ;选择合适的数据挖掘算法[N];计算机世界;2007年
6 赵焕焱;企业成败源于决策[N];中国企业报;2004年
7 ;数据挖掘:如何挖出效益?[N];中国计算机报;2004年
8 刘宝 胡善联;六大问题待解决[N];医药经济报;2002年
9 于津生;信用评分方法的技术基础[N];金融时报;2006年
10 张宗新 郭来生 朱伟骅 陈剑波 沈正阳 施东晖;全流通市场挑战内幕操纵行为监管[N];中国证券报;2007年
中国博士学位论文全文数据库 前10条
1 陈苗;海量地学数据查询优化关键技术的研究[D];吉林大学;2008年
2 王曙燕;医学图像智能分类算法研究[D];西北大学;2006年
3 牛晓太;多模式智能谈判支持系统的理论与方法研究[D];武汉大学;2004年
4 朱晓荣;基于决策树的洞庭湖湿地信息提取技术研究[D];中国林业科学研究院;2012年
5 伍平阳;基于数据挖掘技术的医疗设备绩效预测方法的应用研究[D];南方医科大学;2008年
6 王宏;基于粗糙集数据挖掘技术的客户价值分析[D];哈尔滨工程大学;2006年
7 海占广;河北省杨树速生林培育决策支持系统若干问题的研究[D];北京林业大学;2009年
8 李春艳;分级防火墙系统中动态访问控制技术研究[D];哈尔滨工程大学;2004年
9 黄定轩;企业核心能力智能挖掘应用基础研究[D];西南交通大学;2005年
10 刘涵;水库优化调度新方法研究[D];西安理工大学;2006年
中国硕士学位论文全文数据库 前10条
1 成文丽;基于决策树的数据挖掘算法的技术研究[D];太原理工大学;2003年
2 魏涛;基于决策树的教育信息挖掘模型(DT-EIDM)的设计与实现[D];上海海事大学;2005年
3 赵建峰;数据挖掘中一种基于遗传算法改进的ID3算法[D];武汉科技大学;2008年
4 欧芳芳;基于优化决策树的短期电力负荷预测研究[D];华北电力大学(河北);2009年
5 高晓艳;数据挖掘交互式过程可视化的研究与应用[D];沈阳工业大学;2007年
6 王峰;基于决策树分类算法的企业CRM研究[D];长春理工大学;2008年
7 胡小刚;数据挖掘中决策树分类算法的研究[D];华中师范大学;2002年
8 张素芳;基于集合划分的非线性积分及其在决策树算法中的应用[D];河北大学;2006年
9 王威;基于决策树的数据挖掘算法优化研究[D];西南交通大学;2005年
10 栗媛;基于决策树分类算法的CRM系统研究[D];山东科技大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026