收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

朴素贝叶斯分类器的改进研究

高岩  
【摘要】:朴素贝叶斯分类器基于条件独立性假设,结构简单,分类精度高,且具有坚实的数学理论基础,是目前学习效率较好的分类器之一。因此,近年来关于朴素贝叶斯分类器的研究和应用成为一个热点。但在许多实际情况中,条件独立性假设并不成立,影响了朴素贝叶斯分类器的性能。本文从属性选择的角度对不同的数据类型分别提出了两种改进朴素贝叶斯分类器的方法:基于因子分析的朴素贝叶斯分类模型和基于互信息的朴素贝叶斯分类模型。 基于因子分析的朴素贝叶斯分类模型FA-NBC,利用因子分析提取独立特征的性质,对原属性集做因子分析构建满足条件独立性假设的新属性集,在新属性集上构建朴素贝叶斯分类器,对未知类别样本进行分类。UCI数据集上的实验结果说明:对通过可行性检验的数据集,FA-NBC模型的分类效果优于朴素贝叶斯分类模型。 基于互信息和笛卡尔积的朴素贝叶斯分类模型MI-NBC,把相关属性放在一个集合内,将属性集划分为若干子集,各子集间相互独立,以同一子集内的相关属性的笛卡尔积作为一个新属性,在新属性集上构建朴素贝叶斯分类器。通过互信息度量属性相关度,同时为避免过拟合现象,设定一个阈值m,以每个强相关属性集中的前m个属性的笛卡尔积作为一个新属性。属性构建比属性删除技术保留了更多的样本信息,在模型复杂度和样本信息的完整性间达到了一个较好的平衡。UCI数据集上MI-NBC模型与朴素贝叶斯分类模型NB、属性删减改进朴素贝叶斯分类模型NB-del的对比实验表明:MI-NBC模型的分类正确率较NB模型、NB-del模型有显著提高。 最后,探讨了改进朴素贝叶斯分类模型在实际问题中的应用价值。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 董立岩;苑森淼;刘光远;贾书洪;;基于贝叶斯分类器的图像分类[J];吉林大学学报(理学版);2007年02期
2 李锦善;王志海;王中锋;;一种基于假设检验的贝叶斯分类器[J];计算机工程与应用;2008年21期
3 耿姝;秦玉平;;结合SVM与Bayesian为不带类别标记的兼类文本分类[J];科技信息(科学教研);2008年21期
4 张小红;张倩;;一种基于Bayesian的图像分类算法[J];计算机应用与软件;2009年09期
5 曹玲玲;潘建寿;;基于Fisher判别分析的贝叶斯分类器[J];计算机工程;2011年10期
6 苏中,张宏江,马少平;基于贝叶斯分类器的图像检索相关反馈算法[J];软件学报;2002年10期
7 丁厉华;张小刚;;一种基于类支持度的增量贝叶斯学习算法[J];计算机工程;2008年22期
8 张琼;;基于贝叶斯方法的高考成绩类别预测[J];太原师范学院学报(自然科学版);2009年02期
9 董立岩;李真;阎鹏飞;;基于贝叶斯分类器的重大危险源辨识[J];吉林大学学报(理学版);2009年04期
10 汪霞;郑宁;徐明;陈默;;基于中文变形词匹配的贝叶斯邮件过滤模型[J];计算机应用与软件;2010年01期
11 李红彪;张洪业;;QPSO算法在朴素贝叶斯分类上的应用研究[J];哈尔滨理工大学学报;2010年04期
12 薛静锋;曹元大;;贝叶斯分类在入侵检测中的应用研究[J];计算机科学;2005年08期
13 陈景年;黄厚宽;田凤占;乔珠峰;;一种基于不完整数据的朴素贝叶斯分类器[J];计算机工程;2006年17期
14 周立兵;柳景超;;贝叶斯理论在垃圾邮件过滤中的应用分析[J];网络安全技术与应用;2006年11期
15 张家勇;刘建辉;;基于中文分词技术的信息智能过滤系统[J];信息技术;2006年12期
16 应晓槟;吴炜;滕奇志;杨晓敏;朱强军;;基于Dirichlet分布的贝叶斯分类算法的手写数字字符识别[J];电子测量技术;2007年02期
17 连国云;刘辉;邓彬;;基于贝叶斯分类在人脸识别应用中的研究与实现[J];山西电子技术;2007年06期
18 李芳;钟映春;张毅;戚剑;刘小林;;神经切片图像中识别定位线断面的研究[J];计算机工程与应用;2010年22期
19 蒋方纯;赵静;诸振家;;机器学习在个性化网络课程学习中的应用分析[J];深圳信息职业技术学院学报;2010年04期
20 阳小兰;钱程;;基于贝叶斯分类器的垃圾邮件过滤的研究与改进[J];计算机与数字工程;2011年04期
中国重要会议论文全文数据库 前10条
1 岳全中;朱永利;;基于朴素贝叶斯分类器的电流互感器状态评估[A];中国高等学校电力系统及其自动化专业第二十四届学术年会论文集(上册)[C];2008年
2 孟中强;卢锦玲;;基于贝叶斯分类器的暂态稳定评估方法研究[A];中国高等学校电力系统及其自动化专业第二十四届学术年会论文集(上册)[C];2008年
3 吴铭;徐蔚然;郭军;;基于统计的中文标点识别算法研究[A];第八届全国汉字识别学术会议论文集[C];2002年
4 田京雷;毕胜;;基于视频的客流计数系统的研究[A];第十二届全国图象图形学学术会议论文集[C];2005年
5 吴崇斌;张全;;上下文边界可变的贝叶斯分类器词义消歧方法[A];第五届全国青年计算语言学研讨会论文集[C];2010年
6 李雪燕;辛涛;;青少年内隐问题行为的潜类别分析[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年
7 程泽凯;泰锋;;贝叶斯网络分类器结构学习:基于启发式的G2算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
8 韩柳欣;王浣尘;;决策支持系统构模理论研究现状及展望[A];Systems Engineering, Systems Science and Complexity Research--Proceeding of 11th Annual Conference of Systems Engineering Society of China[C];2000年
9 李庆奇;马莉;;基于小波能量的轮廓抖动性烟雾检测算法[A];浙江省电子学会2011学术年会论文集[C];2011年
10 秦文政;马莉;;基于视觉显著性和小波分析的烟雾检测方法[A];浙江省信号处理学会2011学术年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 张聪;基于信度网的不确定性推理、学习与分类研究[D];重庆大学;2005年
2 董立岩;贝叶斯网络应用基础研究[D];吉林大学;2007年
3 卢锦玲;电力系统暂态脆弱性评估及连锁故障跳闸预测研究[D];华北电力大学(河北);2009年
4 李永丽;应急平台建设若干问题研究[D];吉林大学;2010年
5 梁大为;视频运动对象跟踪技术研究[D];哈尔滨工业大学;2010年
6 李超群;名词性属性距离度量问题及其应用研究[D];中国地质大学;2012年
7 邵非;基于位置感知的移动信息服务若干关键技术研究[D];华东师范大学;2012年
8 郭烁;DNA信号序列分析的基因预测方法研究[D];大连海事大学;2010年
9 安百国;关于模型稀疏性的研究[D];东北师范大学;2012年
10 张超;轮胎磨损图形化分析的研究[D];北京交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 高岩;朴素贝叶斯分类器的改进研究[D];华南理工大学;2011年
2 余民杰;贝叶斯网络分类器与应用[D];云南财经大学;2012年
3 王国才;朴素贝叶斯分类器的研究与应用[D];重庆交通大学;2010年
4 施轶青;监督学习下的贝叶斯分类器研究[D];西安电子科技大学;2011年
5 郑宏;贝叶斯分类器在汽车发动机喷射故障诊断中的应用研究[D];重庆大学;2011年
6 李万武;基于贝叶斯理论的数据挖掘在高校信息管理的应用研究[D];哈尔滨工程大学;2005年
7 毛伟;基于统计语言模型的中文自动文本分类系统[D];北京邮电大学;2006年
8 姚天韵;入侵检测中的贝叶斯分类器的研究[D];大连交通大学;2008年
9 何佳珍;不确定数据的PU学习贝叶斯分类器研究[D];西北农林科技大学;2012年
10 郝丽锋;朴素贝叶斯分类器的集成学习方法研究[D];河北大学;2009年
中国重要报纸全文数据库 前9条
1 ;数据挖掘阻止银行客户流失[N];计算机世界;2007年
2 周光新;张家港市开展水资源综合规划原型模型实测[N];中国水利报;2003年
3 贾毅敏;引入客户关系管理系统的探索[N];中国城乡金融报;2004年
4 付春江;交易系统 分析师 投资人[N];期货日报;2004年
5 施东晖;中国金融学研究与市场实践脱节[N];21世纪经济报道;2003年
6 中南大学无机非金属材料研究所 王海东 吴建华;水泥回转窑模糊控制器骨架系统开发[N];中国建材报;2006年
7 赖茵;地球板块运动方式4000万年保持未变[N];地质勘查导报;2006年
8 笑天;看CPU在3D动画设计中的地位[N];中国电脑教育报;2002年
9 邵馨莲;造个能走一万年的钟,是梦想还是理想[N];新华每日电讯;2005年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978