收藏本站
《华南理工大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

朴素贝叶斯分类器的改进研究

高岩  
【摘要】:朴素贝叶斯分类器基于条件独立性假设,结构简单,分类精度高,且具有坚实的数学理论基础,是目前学习效率较好的分类器之一。因此,近年来关于朴素贝叶斯分类器的研究和应用成为一个热点。但在许多实际情况中,条件独立性假设并不成立,影响了朴素贝叶斯分类器的性能。本文从属性选择的角度对不同的数据类型分别提出了两种改进朴素贝叶斯分类器的方法:基于因子分析的朴素贝叶斯分类模型和基于互信息的朴素贝叶斯分类模型。 基于因子分析的朴素贝叶斯分类模型FA-NBC,利用因子分析提取独立特征的性质,对原属性集做因子分析构建满足条件独立性假设的新属性集,在新属性集上构建朴素贝叶斯分类器,对未知类别样本进行分类。UCI数据集上的实验结果说明:对通过可行性检验的数据集,FA-NBC模型的分类效果优于朴素贝叶斯分类模型。 基于互信息和笛卡尔积的朴素贝叶斯分类模型MI-NBC,把相关属性放在一个集合内,将属性集划分为若干子集,各子集间相互独立,以同一子集内的相关属性的笛卡尔积作为一个新属性,在新属性集上构建朴素贝叶斯分类器。通过互信息度量属性相关度,同时为避免过拟合现象,设定一个阈值m,以每个强相关属性集中的前m个属性的笛卡尔积作为一个新属性。属性构建比属性删除技术保留了更多的样本信息,在模型复杂度和样本信息的完整性间达到了一个较好的平衡。UCI数据集上MI-NBC模型与朴素贝叶斯分类模型NB、属性删减改进朴素贝叶斯分类模型NB-del的对比实验表明:MI-NBC模型的分类正确率较NB模型、NB-del模型有显著提高。 最后,探讨了改进朴素贝叶斯分类模型在实际问题中的应用价值。
【学位授予单位】:华南理工大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:TP182

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 王守选;叶柏龙;李伟健;谭一云;;决策树、朴素贝叶斯和朴素贝叶斯树的比较[J];计算机系统应用;2012年12期
中国硕士学位论文全文数据库 前1条
1 赵航;基于链接信誉分析的网页权威排序分类算法研究[D];暨南大学;2012年
【参考文献】
中国期刊全文数据库 前10条
1 陈弋兰;;基于模糊聚类的混合朴素贝叶斯分类模型[J];安徽建筑工业学院学报(自然科学版);2009年03期
2 徐光美;杨炳儒;秦奕青;张伟;;基于互信息的多关系朴素贝叶斯分类器[J];北京科技大学学报;2008年08期
3 王峻;刘淮生;;一种选择性的加权朴素贝叶斯分类器[J];湖南文理学院学报(自然科学版);2008年01期
4 王国才;张聪;;一种基于粗糙集的特征加权朴素贝叶斯分类器[J];重庆理工大学学报(自然科学版);2010年07期
5 周忠宝;马超群;周经伦;;贝叶斯网络在多态系统可靠性分析中的应用[J];哈尔滨工业大学学报;2009年06期
6 温尚清;郝志峰;廖芹;陈炎雄;;基于贝叶斯网络的脱机手写体汉字智能识别[J];计算机辅助工程;2006年03期
7 张焱,欧阳一鸣,王浩,汪曦东;数据挖掘在金融领域中的应用研究[J];计算机工程与应用;2004年18期
8 张静,王建民,何华灿;基于属性相关性的属性约简新方法[J];计算机工程与应用;2005年28期
9 李方;刘琼荪;;基于改进属性加权的朴素贝叶斯分类模型[J];计算机工程与应用;2010年04期
10 杨光祖;王国军;;一种新的朴素贝叶斯属性选择算法[J];科学技术与工程;2009年04期
中国博士学位论文全文数据库 前2条
1 宫秀军;贝叶斯学习理论及其应用研究[D];中国科学院研究生院(计算技术研究所);2002年
2 蒋良孝;朴素贝叶斯分类器及其改进算法研究[D];中国地质大学;2009年
中国硕士学位论文全文数据库 前3条
1 金哲;基于遗传算法的贝叶斯增广朴素贝叶斯分类器的研究与实现[D];吉林大学;2006年
2 郭炜星;数据挖掘分类算法研究[D];浙江大学;2008年
3 巩吉璋;决策树分类算法在银行个人信用评级中的应用[D];暨南大学;2008年
【共引文献】
中国期刊全文数据库 前10条
1 胡俊,汪忠明,方高倪;基于带有偏差单元的IRN模型的大体积混凝土温度预测与控制[J];安徽建筑工业学院学报(自然科学版);2005年01期
2 廖燕玲;;模糊聚类技术在甘蔗种植户信息分析中的应用[J];安徽农业科学;2007年28期
3 韩世芬;;模糊自适应遗传算法在农村电站无功补偿优化中的应用[J];安徽农业科学;2008年08期
4 陈志民;李亭;杨敬锋;彭晓琴;;融入监督信息的k-mean聚类瓜蓟马预警模型[J];安徽农业科学;2009年30期
5 郭长辉;鲍东杰;何宇;;基于神经网络模型的岩石边坡稳定性分析研究[J];安徽农业科学;2009年30期
6 高维英;李明;杜继稳;王雁林;;黄土高原地质灾害气象预报预警模型研究新思路[J];安徽农业科学;2010年23期
7 陈玉峰;张红燕;敬松;谢元瑰;;基于数据挖掘的农民工就业推荐系统构建[J];安徽农业科学;2011年33期
8 吴军,梁冰;基于粗糙集和自适应神经网络集成理论的边坡稳定性分析[J];安徽师范大学学报(自然科学版);2005年03期
9 王峻;;一种基于属性相关性度量的朴素贝叶斯分类模型[J];安庆师范学院学报(自然科学版);2007年02期
10 张林家;;基于Pareto遗传算法的多目标优化[J];鞍山师范学院学报;2008年04期
中国重要会议论文全文数据库 前10条
1 程泽凯;泰锋;;贝叶斯网络分类器结构学习:基于启发式的G2算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 杨波;秦锋;程泽凯;;一种新的分类学习系统评估度量[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 胡继华;陈瑾;孔凡芬;;重庆龙王坪滑坡形成机制及稳定性综合评价[A];河南地球科学通报2011年卷(下册)[C];2011年
4 赵越岭;王英丽;;基于粗糙集感应电动机故障诊断决策规则分析[A];第二十七届中国控制会议论文集[C];2008年
5 ;Gas Thickness On-line Monitoring Instrument Design Based on BP Neural Network[A];第二十七届中国控制会议论文集[C];2008年
6 刘志雄;杨光祥;;基于轮盘赌概率分配编码方法的并行机调度优化[A];第二十九届中国控制会议论文集[C];2010年
7 李会军;叶宾;;一种基于递归BP神经网络的多步预测控制方法[A];第二十九届中国控制会议论文集[C];2010年
8 ;Fault Diagnosis Based on Bayesian Networks for the Data Incomplete Industrial System[A];中国自动化学会控制理论专业委员会A卷[C];2011年
9 林大超;张瑞红;齐宏伟;张富强;;边坡位移演化的多尺度分析[A];第九届全国岩土力学数值分析与解析方法讨论会论文集[C];2007年
10 陈国庆;冯夏庭;周辉;陈炳瑞;黄书岭;张传庆;;锦屏二级水电站引水隧洞长期稳定性数值分析[A];第九届全国岩土力学数值分析与解析方法讨论会论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 朱志强;基于交叉熵的病毒式移动通信系统性能研究[D];山东科技大学;2010年
2 李佳;载人潜器阻力性能的数值和试验预报及外形优化研究[D];哈尔滨工程大学;2010年
3 刘家国;基于突发事件风险的供应链利益分配与行为决策研究[D];哈尔滨工程大学;2010年
4 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
5 曹宇;利用遗传算法对声障板优化设计的研究[D];哈尔滨工程大学;2010年
6 孟宇龙;基于本体的多源异构安全数据聚合[D];哈尔滨工程大学;2010年
7 陈得宇;基于MAS的智能电压控制系统研究[D];哈尔滨工程大学;2010年
8 胡沙;面向服务的模具企业信息系统集成平台关键技术研究[D];华中科技大学;2010年
9 何英;干旱区典型流域水资源优化配置研究[D];新疆农业大学;2010年
10 蔡智勇;高安全等级网络中信息隐蔽分析和实用抵抗模型[D];浙江大学;2009年
中国硕士学位论文全文数据库 前10条
1 张静;协同产品开发过程规划方法研究[D];山东科技大学;2010年
2 王利明;一种基于PMIPv6的智能辅助高效切换方案[D];郑州大学;2010年
3 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
4 黄铖;无人艇的有限元参数化建模与变截面优化方法研究[D];哈尔滨工程大学;2010年
5 赵淑香;零航速下减摇鳍的运动规律与能量优化研究[D];哈尔滨工程大学;2010年
6 王东阳;多智能体调度优化算法研究[D];哈尔滨工程大学;2010年
7 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
8 李媛;电子商务个性化推荐关键技术研究[D];哈尔滨工程大学;2010年
9 李魁星;基于信息熵遗传算法的舰船导航路径规划技术研究[D];哈尔滨工程大学;2010年
10 林鸿蕴;船用封闭行星齿轮传动优化设计研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 完谨裕;周勇;;企业信誉管理的多维度理解[J];滁州学院学报;2007年04期
2 陆远蓉;;使用数据挖掘工具Weka[J];电脑知识与技术;2008年06期
3 刘雁书,方平;Web网站站外链接类型与特征调查——链接分析法可行性研究[J];大学图书馆学报;2001年05期
4 李静梅,孙丽华,张巧荣,张春生;一种文本处理中的朴素贝叶斯分类器[J];哈尔滨工程大学学报;2003年01期
5 陆玉昌,鲁明羽,李凡,周立柱;向量空间法中单词权重函数的分析和构造[J];计算机研究与发展;2002年10期
6 姜欣,徐六通,张雷;C4.5决策树展示算法的设计[J];计算机工程与应用;2003年04期
7 官理;祖峰;唐文胜;;快速的支持向量机多类分类研究[J];计算机工程与应用;2008年05期
8 台德艺;王俊;;文本分类特征权重改进算法[J];计算机工程;2010年09期
9 鲁松,李晓黎,白硕,王实;文档中词语权重计算方法的改进[J];中文信息学报;2000年06期
10 张海涛,刘甲学,宋川;超文本系统信息结构组成元素—链的分析[J];情报科学;2002年04期
中国博士学位论文全文数据库 前1条
1 于士涛;基于问答网络论坛知识体系的自动问答系统研究[D];南开大学;2009年
中国硕士学位论文全文数据库 前10条
1 李宜兵;基于搜索引擎网页排序算法研究[D];沈阳理工大学;2011年
2 任函;大规模中文网页的自动分类研究[D];华中师范大学;2006年
3 徐法艳;基于Web挖掘技术的网页分类研究[D];扬州大学;2008年
4 高珊;信息检索中的查询扩展及相关技术研究[D];华中师范大学;2008年
5 刘军;基于Web结构挖掘的HITS算法研究[D];中南大学;2008年
6 林忠会;基于归纳学习的数据挖掘技术在高校教学研究中的应用[D];哈尔滨工程大学;2008年
7 汪洋;网络营销在测量仪器仪表行业的应用研究[D];复旦大学;2009年
8 罗江锋;一种抑制恶意网页的web权威结点挖掘算法研究[D];国防科学技术大学;2008年
9 龚畅;基于web挖掘技术的网页分类研究[D];江南大学;2009年
10 时延军;基于Nutch的分布式搜索引擎的设计与研究[D];长春理工大学;2010年
【二级引证文献】
中国期刊全文数据库 前1条
1 王昭霞;;基于分类回归方法的电商网站订单因素分析[J];中国商贸;2014年02期
中国硕士学位论文全文数据库 前1条
1 左红江;基于样本定邻域概率的贝叶斯分类器[D];河北大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 陈弋兰;王鸣;孙书诚;;朴素贝叶斯分类器的误差估计[J];安徽工程科技学院学报(自然科学版);2008年04期
2 陈雪,戴芹,马建文,李小文;贝叶斯网络分类算法在遥感数据变化检测上的应用[J];北京师范大学学报(自然科学版);2005年01期
3 王峻;刘淮生;;一种选择性的加权朴素贝叶斯分类器[J];湖南文理学院学报(自然科学版);2008年01期
4 王大玲,于戈,鲍玉斌,王国仁;一种基于关联性度量的决策树分类方法[J];东北大学学报;2001年05期
5 周颜军,王双成,王辉;基于贝叶斯网络的分类器研究[J];东北师大学报(自然科学版);2003年02期
6 吴立增,朱永利,苑津莎;基于贝叶斯网络分类器的变压器综合故障诊断方法[J];电工技术学报;2005年04期
7 李玉榕,乔斌,蒋静坪;基于熵的粗糙集属性简约算法[J];电路与系统学报;2002年03期
8 吉翔华;陈超;邵正荣;俞能海;;基于主题概念空间的文本模糊c-均值聚类方法(英文)[J];Journal of Southeast University(English Edition);2007年03期
9 张文宾,林景晔,刘概琴,韦学锐;对应分析油气水层识别方法及应用[J];大庆石油地质与开发;2002年06期
10 冯亚丽,伊三泉,冯卓利,于志刚,许少华;ISODATA在油水层综合判别中的应用[J];大庆石油地质与开发;2005年05期
中国硕士学位论文全文数据库 前2条
1 刘军丽;基于数据挖掘技术的个人住房贷款信用风险评估研究[D];上海海事大学;2003年
2 曾辉;基于数据挖掘的银行个人客户信用评分模型的研究[D];对外经济贸易大学;2007年
【相似文献】
中国期刊全文数据库 前10条
1 王科欣;徐辉;;基于最小错误率与最小风险的贝叶斯分类比较与研究[J];科技信息;2009年23期
2 马晓敏;齐永波;;基于贝叶斯最小风险分类的邮件过滤系统[J];微计算机信息;2007年24期
3 余承依;;基于贝叶斯增量分类的邮件过滤研究[J];科学技术与工程;2009年09期
4 周超俊,蒋慰孙,叶银忠,藤井省三;一种基于贝叶斯分类原理的动态系统故障检测与诊断方法[J];控制与决策;1995年03期
5 许润国,韩国强;基于数据挖掘的入侵检测系统研究与设计[J];网络安全技术与应用;2005年10期
6 刘子轶;郝玲;;反垃圾邮件策略的研究[J];机电产品开发与创新;2009年02期
7 邹磊;卢炎生;崔得暄;胡蓉;;一种基于最小损失的垃圾邮件屏蔽算法[J];华中科技大学学报(自然科学版);2005年S1期
8 吴玮;周建中;杨俊杰;莫莉;;基于混合贝叶斯SVM的电价分类与预测[J];计算机工程;2007年18期
9 惠孛;吴跃;;基于不完全朴素贝叶斯分类模型的垃圾邮件分类模型[J];计算机应用;2009年03期
10 刘学亮;严捷丰;周荷琴;;基于轮廓特征的车辆遮挡检测和分离算法[J];计算机仿真;2009年04期
中国重要会议论文全文数据库 前10条
1 陈猛;郭华平;范明;;一种基于贝叶斯的多窗口数据流分类模型[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 李伟红;龚卫国;陈伟民;梁毅雄;张红梅;;基于中国人人脸区域特征的贝叶斯分类法研究[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
3 高霞;;创建基于贝叶斯分类的农作物病虫害等级预测模型[A];第26届中国气象学会年会农业气象防灾减灾与粮食安全分会场论文集[C];2009年
4 刘玉洁;谢小萍;杜秉玉;;利用FY-1D全球数据监测北极冰雪覆盖[A];中国气象学会2006年年会“卫星遥感技术进展及应用”分会场论文集[C];2006年
5 程新荣;杨仁刚;;网页自动分类在搜索引擎上的应用研究[A];2007'中国仪器仪表与测控技术交流大会论文集(二)[C];2007年
6 张文波;蒋春华;姚天昉;;基于贝叶斯及多模式串模糊匹配算法的不良短消息甄别混合模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 袁野;胡邦辉;刘丹军;苏宏琛;;基于贝叶斯分类判别方法的雷暴预报研究[A];第26届中国气象学会年会灾害天气事件的预警、预报及防灾减灾分会场论文集[C];2009年
8 曹三省;李丹;黄祥林;;一种基于贝叶斯分类的图像自动标引系统[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
9 邓文胜;邵晓莉;刘海;万诰方;许亮;;基于证据理论的遥感图像分类方法探讨[A];中国地理学会2006年学术年会论文摘要集[C];2006年
10 龚小谨;邢琰;林颖;雷杰;刘济林;;基于贝叶斯分类与水平集演化的月面岩石自动检测[A];中国宇航学会深空探测技术专业委员会第八届学术年会论文集(下篇)[C];2011年
中国博士学位论文全文数据库 前10条
1 陈景年;选择性贝叶斯分类算法研究[D];北京交通大学;2008年
2 惠孛;基于即时分类的垃圾邮件过滤关键技术的研究[D];电子科技大学;2009年
3 王传旭;视频图像中人体目标的检测方法研究[D];中国海洋大学;2007年
4 张纪阳;蛋白质组学中串联质谱数据搜库结果质量控制方法研究[D];国防科学技术大学;2007年
5 刘凯;基于知识发现的珠江口湿地识别监测及演变规律挖掘研究[D];中国科学院研究生院(广州地球化学研究所);2007年
6 张文涛;暂态电能质量问题研究[D];天津大学;2009年
7 夏定元;基于内容的图像检索通用技术研究及应用[D];华中科技大学;2004年
8 魏维;基于统计学的视频语义分析与提取技术研究[D];南京理工大学;2006年
9 齐国君;多类别模式分类技术及其在多媒体分析上的应用[D];中国科学技术大学;2009年
10 杜炅;离散型随机变量的贝叶斯分类方法研究[D];北京大学;2011年
中国硕士学位论文全文数据库 前10条
1 郑熠煜;贝叶斯分类方法及其在冠心病诊疗中的应用研究[D];大连海事大学;2013年
2 朱晓丹;朴素贝叶斯分类模型的改进研究[D];厦门大学;2014年
3 胡来宾;代价敏感贝叶斯分类方法改良[D];广西师范大学;2013年
4 秦鑫;一种蒙特卡罗贝叶斯分类的改进方法[D];华中师范大学;2004年
5 段晶;朴素贝叶斯分类及其应用研究[D];大连海事大学;2011年
6 李慧;基于贝叶斯分类方法的中文问句分类研究[D];石家庄铁道学院;2010年
7 阮乐中;基于贝叶斯分类的多代理入侵检测研究[D];合肥工业大学;2003年
8 郑默;贝叶斯分类算法的研究与应用[D];重庆大学;2011年
9 曹玲玲;贝叶斯分类方法的对比研究与改进算法[D];西北大学;2011年
10 朱杰;云计算在基于贝叶斯分类的垃圾短信过滤中的研究与应用[D];电子科技大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026