收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于属性加权的选择性朴素贝叶斯分类研究

孙秀亮  
【摘要】:贝叶斯分类属于数据挖掘领域重要的分类方法之一,朴素贝叶斯分类是一种简单的贝叶斯分类方法,与其它分类方法相比,它的优点是简单、高速、分类效果稳定和理论基础坚实,因此也得到了广泛的应用。但是朴素贝叶斯模型假定在给定分类特征条件下属性间是相互独立的,而这个假定在实际应用中往往是不成立的,这就给朴素贝叶斯方法带来了局限性。为此,很多学者试图通过放松属性间的独立性假设来提高朴素贝叶斯分类器的性能,其中属性加权和属性选择是两种比较好的方法。 本文正是从属性加权和属性选择两个方面改进朴素贝叶斯分类模型。主要的研究工作包括: (1)从属性加权方面改进朴素贝叶斯分类,详细介绍了属性加权朴素贝叶斯分类的基本原理,深入分析了引入属性权值后对于分类结果的影响,介绍了一种称为相关概率法的确定属性权值的方法,并按照该方法构造了一个加权朴素贝叶斯分类器WNBC。 (2)从属性选择方面改进朴素贝叶斯分类,深入分析了两种不同的属性选择方法,分别是属性相关性度量法和包装法。关于属性相关性度量法,介绍了一种基于x~2统计量法的属性选择算法,并按照该方法构造了一个选择性朴素贝叶斯分类器RNBC;关于包装法,研究了包装法选择属性的具体过程,包装法实现时需要注意的各个方面,然后基于包装法构造了一个选择性朴素贝叶斯分类器SNBC。 (3)提出将两种方法相结合的进一步改进的NBC模型WRNBC和WRSNBC。WRNBC模型将属性加权和基于属性相关性度量的属性选择方法结合,首先通过x~2统计量法得到最优属性约简子集,然后在该子集上构造加权NBC模型;WRSNBC模型将属性加权和两种不同的属性选择方法结合,首先通x~2统计量法得到最优属性约简子集,然后在该子集上使用加权NBC模型运行包装法进一步对属性进行选择,最后在得到的属性子集上构造加权NBC模型。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李方;刘琼荪;;基于改进属性加权的朴素贝叶斯分类模型[J];计算机工程与应用;2010年04期
2 任喜峰;;基于朴素贝叶斯分类的考试成绩监测机制的研究[J];科技信息;2007年01期
3 蒋望东;陆小艺;林士敏;;处理缺失数据的朴素贝叶斯分类增量算法[J];科学技术与工程;2008年14期
4 金展;范晶;陈峰;徐从富;;基于朴素贝叶斯和支持向量机的自适应垃圾短信过滤系统[J];计算机应用;2008年03期
5 谢斌;;朴素贝叶斯分类在数据挖掘中的应用[J];甘肃联合大学学报(自然科学版);2007年04期
6 袁红星;;朴素贝叶斯基于学生信息库的数据挖掘研究[J];软件导刊;2005年16期
7 李君;张顺颐;王浩云;李翠莲;;基于贝叶斯网络的Peer-to-Peer识别方法[J];应用科学学报;2009年02期
8 徐光美;杨炳儒;秦奕青;张伟;;基于互信息的多关系朴素贝叶斯分类器[J];北京科技大学学报;2008年08期
9 赵敏;倪志伟;刘斌;;K-means与朴素贝叶斯在商务智能中的应用[J];计算机技术与发展;2010年04期
10 邵乐;于红;刘溪婧;綦孝姬;梁晓娜;;基于朴素贝叶斯的渔业文本分类器研究[J];大连水产学院学报;2010年01期
11 邓维斌;;维规约对朴素贝叶斯分类性能的影响研究[J];计算机应用与软件;2010年06期
12 郑炜;沈文;张英鹏;;基于改进朴素贝叶斯算法的垃圾邮件过滤器的研究[J];西北工业大学学报;2010年04期
13 李毅;顾健;顾铁军;;基于朴素贝叶斯方法的邮件样本预筛选[J];信息网络安全;2010年10期
14 张阳,张利军,闫剑锋,李战怀;基于关联特征的朴素贝叶斯文本分类器[J];西北工业大学学报;2004年04期
15 徐杰,施鹏飞;图像检索中基于标记与未标记样本的主动学习算法[J];上海交通大学学报;2004年12期
16 廖明涛;张德运;李金库;;基于朴素贝叶斯和层次聚类的两阶段垃圾邮件过滤方法[J];微电子学与计算机;2007年08期
17 白耀辉;陈明;王举群;;利用朴素贝叶斯方法实现异常检测[J];计算机工程与应用;2005年34期
18 夏克俭;张涛;;基于贝叶斯算法的垃圾邮件过滤的研究[J];微计算机信息;2008年09期
19 陈琳;邓万宇;;差分进化贝叶斯分类器[J];微处理机;2010年04期
20 王德文;赵文清;朱永利;;一个基于粗糙集理论的邮件分类模型[J];计算机工程与应用;2006年18期
中国重要会议论文全文数据库 前10条
1 李海军;王钲旋;王利民;苑森淼;;基于主成分分析提升朴素贝叶斯[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
2 蒋盛益;谢照青;余雯;;基于代价敏感的朴素贝叶斯不平衡数据分类研究[A];2010年第16届全国信息存储技术大会(IST2010)论文集[C];2010年
3 张阳;李战怀;卢维扬;;通过弱化朴素贝叶斯假设提高朴素贝叶斯文本分类器的性能[A];第十九届全国数据库学术会议论文集(研究报告篇)[C];2002年
4 张晓峰;王丽珍;陆叶;;一种基于属性加权的不确定K-means聚类算法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
5 李海军;王钲旋;王利民;苑森淼;;基于贝叶斯网络的回归树学习算法[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
6 张文波;蒋春华;姚天昉;;基于贝叶斯及多模式串模糊匹配算法的不良短消息甄别混合模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 张云涛;龚玲;王永成;;基于语料库的朴素贝叶斯方法的词义消歧[A];2005年中国智能自动化会议论文集[C];2005年
8 朱琳;周水庚;;基于聚类的文本分类属性加权[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
9 石志伟;吴功宜;;改善朴素贝叶斯在文本分类中的稳定性[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
10 陈猛;郭华平;范明;;一种基于贝叶斯的多窗口数据流分类模型[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
中国博士学位论文全文数据库 前10条
1 惠孛;基于即时分类的垃圾邮件过滤关键技术的研究[D];电子科技大学;2009年
2 陈景年;选择性贝叶斯分类算法研究[D];北京交通大学;2008年
3 陈治平;智能搜索引擎理论与应用研究[D];湖南大学;2003年
4 李丹;属性加权及不完备数据的模糊聚类方法研究[D];大连理工大学;2011年
5 白亮;聚类学习的理论分析与高效算法研究[D];山西大学;2012年
6 董立岩;贝叶斯网络应用基础研究[D];吉林大学;2007年
7 王美珍;垃圾邮件行为模式识别与过滤方法研究[D];华中科技大学;2009年
8 舒泓;电能质量扰动检测和分类问题的研究[D];北京交通大学;2009年
9 蒋良孝;朴素贝叶斯分类器及其改进算法研究[D];中国地质大学;2009年
10 李海军;计算机图形学若干基本算法的实现研究[D];吉林大学;2008年
中国硕士学位论文全文数据库 前10条
1 李方;关于朴素贝叶斯分类算法的改进[D];重庆大学;2009年
2 孙秀亮;基于属性加权的选择性朴素贝叶斯分类研究[D];哈尔滨工程大学;2013年
3 杨忠强;基于属性加权和归约的朴素贝叶斯算法研究[D];广西大学;2013年
4 彭浩威;选择性加权朴素贝叶斯分类方法的探讨[D];中山大学;2010年
5 罗福星;增量学习朴素贝叶斯中文分类系统的研究[D];中南大学;2008年
6 胡为成;基于遗传算法的朴素贝叶斯分类研究[D];合肥工业大学;2006年
7 禤毅良;电子商务智能推荐系统研究[D];广东工业大学;2004年
8 曾红伟;摘录式单文档中文自动文摘系统的研究与实现[D];华东师范大学;2009年
9 李光;朴素贝叶斯分类器预测拟南芥蛋白质相互作用及蛋白质功能注释[D];东北林业大学;2008年
10 段晶;朴素贝叶斯分类及其应用研究[D];大连海事大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978