收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于关联规则与决策树的预测方法研究及其应用

伊卫国  
【摘要】:关联规则挖掘(mining association rule)与决策树(decision tree)是模式识别、人工智能、数据挖掘等领域的研究热点,在商业决策、医院病人诊断与治疗规律分析等领域都有着广泛的应用,但目前面临缺少基于特定数据集的扩展研究、预测精度难以进一步提高等诸多挑战。为此,本文研究了关联规则挖掘与决策树算法,重点对关联规则挖掘的扩展研究,包括生成规则数量、挖掘支持度较低的长项目集关联规则以及决策树算法中属性选择标准和多值属性多类标数据决策树的构建等方面进行了深入探讨,开展了如下创新性研究。 (1)分析了支持度-置信度-兴趣度模型下的参数意义,并利用回归方法设计了多种规则条数与参数之间的方程。利用复相关系数检验了方程的拟合效果,并采用显著性检验来验证参数的系数是否显著为零。将复相关系数较大的回归方程作为拟合的最优方程。并利用冠心病数据和University of California Irvine(UCI)数据进行了验证。通过选定的最优方程,可以较好地预测给定参数下的规则的数量,同时优化参数的选择以及确定参数的选择范围。 (2)提出新的关联规则挖掘模型:模糊递减支持度,置信度。在此基础上,通过分析生成的规则前件与后件的相关性,提出了3种修正模型:模糊递减支持度,置信度,兴趣度模型;模糊递减支持度,双向置信度,兴趣度模型;模糊递减支持度,重合度,兴趣度模型。根据医院采集的冠心病数据,提取中医的辨证相关因素和病人的用药数据。实验结果表明,本文提出的模型不仅验证了已有的辨证与用药规律,而且能够挖掘出多因素组合的辨证和多种药物之间的配伍规律。 (3)分析了已有的基于变精度粗集的决策树分类算法,提出了两种新的属性选择方法。第一种属性选择方法,不仅考虑当前结点的属性值个数,而且考虑下层结点的变精度明确区大小,即同时考虑树的两层结点。通过新的属性选择方法,不仅克服了ID3算法中的不足,而且具有变精度粗糙集的优点。第二种属性选择方法,使用了一种综合考虑分类精度和分支数量的属性选择新标准——加权粗糙度和复杂度。同时在结点停止分裂条件中引入了支持度和置信度,提高决策树的泛化能力。为降低噪声数据和缺失值的影响,算法使用了基于匹配度的类别预测方法。通过对比实验,验证了本文提出的方法的有效性。 (4)提出了3种新的多值属性和多类标数据的决策树算法。算法中,首先提出了新的孩子结点的类标集相似度计算公式来评定属性分类效果,综合考虑两个多类标集合中元素同时出现或不出现的情况,使类标集相似度的计算更加全面和准确。其次,提出了新的结点停止分裂条件,使得结点的类标集标注更加准确。最后,给出了相应的预测方法。通过与已有的算法进行比较,验证了本文提出的算法的分类效果。文中提出的分类算法更适合处理多值属性和多类标数据的分类问题。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 辛海涛;用数据挖掘方法解决网络拥挤的问题[J];哈尔滨商业大学学报(自然科学版);2005年03期
2 宋海声;杨鸿武;裴东;;兴趣关联规则的挖掘[J];甘肃科技;2008年22期
3 王新;不完全数据库中关联规则的两种求估方法[J];计算机应用;2004年08期
4 曾安平;黄永平;阳万安;李广军;唐远翔;;一个基于兴趣度的FP-Growth算法改进[J];宜宾学院学报;2008年12期
5 吴磊;何嘉;;基于项目集矩阵的AprioriHybral算法研究[J];成都信息工程学院学报;2009年01期
6 雷红艳,邹汉斌;无最小支持度的关联规则挖掘方法[J];湖南文理学院学报(自然科学版);2005年02期
7 阮璐;肖冬荣;周杰;高风;;利用组合支持度进行关联规则的挖掘[J];微计算机信息;2008年09期
8 赵军民;王军豪;高蔚;;数据挖掘中关联规则衡量方法的改进[J];河南城建学院学报;2010年06期
9 施润身,赵青;改进的关联规则采掘算法及其实现[J];同济大学学报(自然科学版);2002年02期
10 易华容,任海燕;关联规则的开采算法在文本分类中的应用[J];株洲师范高等专科学校学报;2003年02期
11 黄建设;;一种改进的关联规则算法探讨[J];计算机仿真;2005年12期
12 王评;陈国龙;;一种基于人工免疫的新的频繁项挖掘算法[J];计算机科学;2005年08期
13 鲍静;;关联规则在图书馆个性化服务中的应用[J];科教文汇(中旬刊);2007年09期
14 郑新奇;赵璐;;基于MATLAB的关联规则空间数据挖掘探讨——以济南市平阴县安城乡为例[J];国土资源信息化;2008年02期
15 李国栋;杨霆;;数据挖掘在人寿保险业务中的应用[J];软件导刊;2009年01期
16 刘锋;严的兵;;数据挖掘在学生成绩分析中的应用[J];电脑知识与技术;2011年07期
17 王新,王湄生;关联规则挖掘中的关联推理[J];云南民族学院学报(自然科学版);2001年03期
18 汪洪涛,刘文才;数据挖掘技术关联规划算法在营销策略中的应用[J];工业控制计算机;2003年09期
19 田生伟,禹龙;关联规则挖掘在成绩录入、校对系统中的应用[J];微机发展;2003年08期
20 宋爱波,董逸生,赵茂先;稠密数据库有趣规则的快速挖掘[J];小型微型计算机系统;2001年07期
中国重要会议论文全文数据库 前10条
1 左万利;刘居红;;包含正负属性的关联规则及其挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
2 周焕银;张永;;关联规则候选项频度规律研究[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
3 方艳;别荣芳;;关联规则的有趣性研究[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
4 黄晓燕;许龙飞;;基于关联规则的网络入侵检测技术的应用研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
5 李阳;徐锡山;韩伟红;郑黎明;徐镜湖;;网络安全事件关联规则的自动化生成方法研究与实践[A];全国计算机安全学术交流会论文集·第二十五卷[C];2010年
6 潘海为;李建中;张炜;;挖掘脑部医学图像中的关联规则[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年
7 王宁;董淳;胡运发;陶晓鹏;;面向集合的关联规则挖掘算法[A];第十五届全国数据库学术会议论文集[C];1998年
8 李庆忠;张世栋;董国庆;;在数据多维体中进行关联规则的挖掘[A];第十六届全国数据库学术会议论文集[C];1999年
9 韩涛;张春海;;关系数据库中关联规则的高效挖掘算法[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
10 周皓峰;高攀;施伯乐;;一个基于兴趣度包含负属性项的关联规则采掘算法[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
中国博士学位论文全文数据库 前10条
1 伊卫国;基于关联规则与决策树的预测方法研究及其应用[D];大连海事大学;2012年
2 肖波;可信关联规则挖掘算法研究[D];北京邮电大学;2009年
3 叶小飞;基于自发呈报系统与循证医学的药品不良反应信号挖掘[D];第二军医大学;2011年
4 王越;分布式关联规则挖掘的方法研究[D];重庆大学;2003年
5 Vital Delmas MABONZO;大型数据库有效挖掘关联规则新方法研究[D];大连海事大学;2012年
6 蔡瑞初;基因表达数据挖掘若干关键技术研究[D];华南理工大学;2010年
7 李强;数据挖掘中关联分析算法研究[D];哈尔滨工程大学;2010年
8 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年
9 牛成林;增量数据挖掘及其在电站运行优化中的理论研究及应用[D];华北电力大学(北京);2010年
10 姜保庆;关于弱比例规则的挖掘及推理研究[D];西南交通大学;2005年
中国硕士学位论文全文数据库 前10条
1 武立昊;基于人工智能技术的企业决策支持系统研究[D];中北大学;2010年
2 聂倩雯;基于关联规则数据挖掘和扩展贝叶斯网络的电网故障诊断方法研究[D];西南交通大学;2010年
3 赵春胜;基于关联规则的数据挖掘方法在电厂脱硫监测中的应用研究[D];内蒙古大学;2011年
4 蒋秀英;数据挖掘中的关联规则算法优化研究及应用[D];山东师范大学;2003年
5 王玉荣;关联规则挖掘算法在大数据集上的应用研究[D];江南大学;2011年
6 刘玉锋;数据挖掘中关联规则算法的研究与应用[D];长春理工大学;2010年
7 涂明;关联规则增量式更新算法研究[D];合肥工业大学;2010年
8 王景;基于关联规则数据挖掘的研究[D];广西大学;2003年
9 岳慧颖;含有时空约束的关联规则挖掘方法研究[D];哈尔滨工程大学;2004年
10 张友平;基于关联规则的数据挖掘模型SM-MINER的设计与实现[D];上海海运学院;2002年
中国重要报纸全文数据库 前10条
1 严宁;挖掘数据寻保险商机[N];网络世界;2007年
2 邱红杰;过去有困难找单位,现在找谁[N];新华每日电讯;2006年
3 记者 曾卫康通讯员 市创卫办;对广州总体卫生状况满意度95% 对创建国家卫生城市支持度98%[N];广州日报;2007年
4 本报记者 袁跃;点击七彩人生[N];财会信报;2005年
5 特约评论员 王尔山;奥巴马高支持度的另面[N];21世纪经济报道;2009年
6 ;台媒:许信良支持度超过预期[N];团结报;2011年
7 南京市地方税务局信息管理处、计算机中心 明靖 朱岚;数据挖潜让业务说话[N];中国计算机报;2006年
8 王培森;从Web挖到竞争情报[N];中国计算机报;2003年
9 何宇;“感谢市民支持,我们会更努力”[N];广州日报;2009年
10 王玮 蔡莲红;数据挖掘走入语音处理[N];计算机世界;2001年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978