收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

朴素贝叶斯与决策树混合分类方法的研究

李冬梅  
【摘要】:数据挖掘是致力于数据分析和理解、揭示数据内部蕴藏知识的技术,并且能有效地从低信噪比数据中挖掘有价值的信息。分类的模型主要包括朴素贝叶斯、决策树、支持向量机等。朴素贝叶斯和决策树以算法简单、计算量小以及分类结果对噪音鲁棒等特点而得到广泛运用。本文从以下几个方面着眼,改进朴素贝叶斯和决策树算法:(1)尽管朴素贝叶斯的分类结果受到广泛承认,但是面对某些特殊情形,依然存在两个缺陷,即属性间必须满足独立的条件,以及概率估计方式粗糙的问题。针对朴素贝叶斯概率估计粗糙的问题,本文提出了基于朴素贝叶斯的概率优化算法。将概率优化函数运用到朴素贝叶斯中,充分考虑到朴素贝叶斯中条件概率为零的属性,从而避免了朴素贝叶斯易下溢和过度拟合的问题。本文采用了UCI数据集进行了多组验,与传统分类算法进行比较。实验结果表明在高维数据中,基于朴素贝叶斯的概率优化算法算法提高了分类准确率,表现出了优良的性能。(2)在针对多类标签的分类问题上,文中介绍了朴素贝叶斯与决策树的混合分类算法,由于在训练集中存在有噪声矛盾的实例,将使决策树遭遇过度拟合并且致使精确度下降。在构造决策树之前运用本文提出的朴素贝叶斯的概率优化算法进行预处理,来移除训练集中的噪音实例,从而避免决策树算法的过度拟合。本文采用UCI数据集,采用10倍交叉验证的方法,对论文中提出的算法进行实验。通过大量对比实验显示,本文中提出的方法产生了较好的结果。朴素贝叶斯与决策树的混合算法还允许我们自动的从拥有高维属性的噪声数据中抽取最具有代表性和高质量的数据集,并且根据不同的实例特征挑选出重要的属性。(3)本文将提出的朴素贝叶斯的概率优化算法和朴素贝叶斯与决策树的混合算法应用在冠心病中医辅助诊疗系统中,成功地对病人病症进行了分类,在冠心病的诊疗过程中起到了有效的辅助作用。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 钱颖能;胡运发;;用朴素贝叶斯分类法选股[J];计算机应用与软件;2007年06期
2 欧阳泽华;郭华平;范明;;在逐渐缩小的空间上渐进学习朴素贝叶斯参数[J];计算机应用;2012年01期
3 裴亚辉;熊盛武;;朴素贝叶斯及其扩展模型[J];网络安全技术与应用;2007年08期
4 赵彦琦;谢小西;荀宇畅;;朴素贝叶斯分类法的应用[J];电子制作;2013年07期
5 菅小艳;崔彩霞;;基于朴素贝叶斯的文本分类[J];电脑开发与应用;2013年12期
6 王实;高文;;增强型朴素贝叶斯学习[J];计算机科学;2000年04期
7 杨忠强;秦亮曦;;一种基于属性加权的朴素贝叶斯改进算法[J];广西大学学报(自然科学版);2013年05期
8 张彩丽;杨帆;张玉杰;;柴油机供油系统状态的朴素贝叶斯诊断方法研究[J];计算机测量与控制;2008年08期
9 白耀辉;陈明;王举群;;利用朴素贝叶斯方法实现异常检测[J];计算机工程与应用;2005年34期
10 王双成;冷翠平;侯彩虹;;操作风险等级预测的朴素贝叶斯方法研究[J];计算机工程与应用;2008年12期
11 谭小球;;基于朴素贝叶斯方法的数字化学习过程评价[J];现代计算机(专业版);2008年07期
12 安艳辉;董五洲;游自英;;基于改进的朴素贝叶斯文本分类研究[J];河北省科学院学报;2007年01期
13 李柏生;林亚平;鄢喜爱;;基于朴素贝叶斯网络的入侵检测分析[J];网络安全技术与应用;2007年09期
14 姜立标;马乐;余建伟;刘永花;;多阶段聚类—朴素贝叶斯的异常检测[J];重庆大学学报;2009年08期
15 杨光祖;王国军;;一种新的朴素贝叶斯属性选择算法[J];科学技术与工程;2009年04期
16 王小丽;远俊红;;基于加权朴素贝叶斯分类法的成绩预测模型[J];电子技术与软件工程;2013年19期
17 周文刚;金鑫;;基于树扩展朴素贝叶斯的高效网络入侵检测系统[J];北京师范大学学报(自然科学版);2007年01期
18 曾文赋;;样本-属性加权的朴素贝叶斯改进算法[J];微型机与应用;2014年06期
19 林国;;基于朴素贝叶斯的农业土地适宜性评价算法设计[J];杭州师范大学学报(自然科学版);2010年02期
20 江小平;李成华;向文;张新访;;云计算环境下朴素贝叶斯文本分类算法的实现[J];计算机应用;2011年09期
中国重要会议论文全文数据库 前2条
1 石志伟;吴功宜;;改善朴素贝叶斯在文本分类中的稳定性[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
2 李海军;王钲旋;王利民;苑森淼;;基于主成分分析提升朴素贝叶斯[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
中国硕士学位论文全文数据库 前10条
1 李偲;基于朴素贝叶斯的文本分类研究及其在微博分类中的应用[D];北京理工大学;2015年
2 李冬梅;朴素贝叶斯与决策树混合分类方法的研究[D];大连海事大学;2016年
3 胡为成;基于遗传算法的朴素贝叶斯分类研究[D];合肥工业大学;2006年
4 刘勇华;基于朴素贝叶斯的中文段落情感分析[D];太原理工大学;2015年
5 周龙;基于朴素贝叶斯的分类方法研究[D];安徽大学;2006年
6 王翔;基于朴素贝叶斯和One-R的入侵检测问题研究[D];合肥工业大学;2008年
7 周远阳;基于朴素贝叶斯方法的新闻分类系统的实现[D];暨南大学;2012年
8 李忠波;基于改进朴素贝叶斯的蛋白质提纯方法选择[D];大连理工大学;2014年
9 孙秀亮;基于属性加权的选择性朴素贝叶斯分类研究[D];哈尔滨工程大学;2013年
10 华林森;中文文本情感分类研究[D];重庆大学;2014年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978