收藏本站
《中山大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

选择性加权朴素贝叶斯分类方法的探讨

彭浩威  
【摘要】: 朴素贝叶斯分类(Naive Bayes Classification,NBC)方法是简单的贝叶斯分类方法,在众多分类方法和理论中,它具有计算效率高、精确度高、理论基础坚实等特点,因此得到了广泛应用。朴素贝叶斯方法假定在给定分类特征条件下属性值之间是相互独立的,同时认为每个条件属性对决策分类的重要性是相同的,但这些假设在真实数据中不一定成立,此为朴素贝叶斯方法的局限性。 本文详细介绍了贝叶斯决策理论及朴素贝叶斯分类器。详细阐述了NBC模型的优缺点,引入了一种常用的属性选择统计学方法--χ~2统计量法及一种属性加权方法--信息增益比率法来弱化其局限性,并提出进一步改进NBC性能的若干方法:针对属性选择提出寻求最优约简子集的广义相关函数法,建立了基于广义相关函数的选择性朴素贝叶斯分类器GNBC(见3.4节模型);同时又根据χ~2统计量相关度、广义相关函数得出属性权重建立了加权NBC模型WKNBC及WGNBC(见4.3节模型);最后,本文将属性选择和属性加权相结合得到4.4节中几种选择性加权模型,并通过实验比较分析证实得出本文提出的基于广义相关函数的选择性加权NBC模型SWGNBC性能最好(本文在5.1节给出了各种改进模型的索引)。 本文在属性选择及属性加权时把广义相关函数作为度量依据,这种相关性衡量标准对改进分类效果来说是否最优有必要进一步讨论。另外,本文实验所用数据集均为离散型,本文提出的各种改进模型是否对数值型分类数据同样起到很好的效果值得进一步研究。
【学位授予单位】:中山大学
【学位级别】:硕士
【学位授予年份】:2010
【分类号】:O212.8

手机知网App
【引证文献】
中国期刊全文数据库 前1条
1 李艳姣;蒋同海;;基于改进权重贝叶斯的维文文本分类模型[J];计算机工程与设计;2012年12期
中国硕士学位论文全文数据库 前4条
1 周鸣;面向手机病毒挖掘引擎的增量贝叶斯算法的研究与实现[D];北京邮电大学;2012年
2 胡银娥;基于粗糙集的朴素贝叶斯分类算法研究[D];长沙理工大学;2012年
3 周远阳;基于朴素贝叶斯方法的新闻分类系统的实现[D];暨南大学;2012年
4 梁婷;基于内容的垃圾邮件过滤技术研究[D];华东师范大学;2013年
【参考文献】
中国期刊全文数据库 前7条
1 张静,王建民,何华灿;基于属性相关性的属性约简新方法[J];计算机工程与应用;2005年28期
2 张凤莲;林健良;;新的决策树构造方法[J];计算机工程与应用;2009年10期
3 邓维斌;王国胤;王燕;;基于Rough Set的加权朴素贝叶斯分类算法[J];计算机科学;2007年02期
4 邓维斌;黄蜀江;周玉敏;;基于条件信息熵的自主式朴素贝叶斯分类算法[J];计算机应用;2007年04期
5 杨明,张载鸿;决策树学习算法ID3的研究[J];微机发展;2002年05期
6 韩家新,王家华;一种以相关性确定条件属性的决策树[J];微机发展;2003年05期
7 谈恒贵,王文杰,李游华;数据挖掘分类算法综述[J];微型机与应用;2005年02期
中国硕士学位论文全文数据库 前3条
1 张剑飞;贝叶斯网络学习方法和算法研究[D];东北师范大学;2005年
2 王峻;朴素贝叶斯分类模型的研究与应用[D];合肥工业大学;2006年
3 李方;关于朴素贝叶斯分类算法的改进[D];重庆大学;2009年
【共引文献】
中国期刊全文数据库 前10条
1 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
2 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
3 俞能福;陈邦考;;主成分分析法在学生成绩分析中的应用[J];安徽建筑工业学院学报(自然科学版);2007年01期
4 李瑞娟;杨文明;;中医证候研究方法学探讨[J];中医药临床杂志;2010年02期
5 丁春;盛周君;;基于主成分分析法的南淝河水质综合评价[J];安徽农业科学;2007年35期
6 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
7 李兵;陈国华;杨涤尘;朱宁;;食品安全体系的抽样理论研究[J];安徽农业科学;2009年22期
8 陈碧珊;潘安定;李冰;;有序聚类方法在沉积物粒度分带中的应用[J];安徽农业科学;2009年35期
9 赵晖;温学飞;赫晓辉;王政峰;安钰;;基于因子分析法分析宁夏农村信息化的发展[J];安徽农业科学;2010年13期
10 唐君;;我国31个省区农村居民经济状况排序和聚类[J];安徽农业科学;2010年34期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 程泽凯;泰锋;;贝叶斯网络分类器结构学习:基于启发式的G2算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 杨波;秦锋;程泽凯;;一种新的分类学习系统评估度量[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 赵越岭;王英丽;;基于粗糙集感应电动机故障诊断决策规则分析[A];第二十七届中国控制会议论文集[C];2008年
5 ;Gas Thickness On-line Monitoring Instrument Design Based on BP Neural Network[A];第二十七届中国控制会议论文集[C];2008年
6 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
7 ;Fault Diagnosis Based on Bayesian Networks for the Data Incomplete Industrial System[A];中国自动化学会控制理论专业委员会A卷[C];2011年
8 赵晖;温学飞;赫晓辉;王政峰;安钰;;基于因子分析法分析宁夏农村信息化的发展[A];2011全国灌区信息化建设与防渗抗冻胀新技术应用专刊[C];2011年
9 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
10 应江勇;周宇;;决策树在我国通信行业用户预警模型中的研究应用[A];第十三届中国管理科学学术年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 刘家国;基于突发事件风险的供应链利益分配与行为决策研究[D];哈尔滨工程大学;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 孟宇龙;基于本体的多源异构安全数据聚合[D];哈尔滨工程大学;2010年
4 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
5 吕宁;基于数据驱动的故障诊断模型及算法研究[D];哈尔滨理工大学;2009年
6 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
7 李炳龙;文档碎片取证关键技术研究[D];解放军信息工程大学;2007年
8 杨娜;基于云参数干旱遥感监测模型与集合卡尔曼滤波的土壤湿度同化研究[D];武汉大学;2010年
9 徐河杭;面向PLM的数据挖掘技术和应用研究[D];浙江大学;2010年
10 鄢煜尘;基于信息融合的中文笔迹鉴别研究[D];武汉大学;2009年
中国硕士学位论文全文数据库 前10条
1 游振华;种子产业链企业合作绩效影响因素实证研究[D];华中农业大学;2010年
2 吴香庭;基于遗传算法的K-means聚类方法的研究[D];山东科技大学;2010年
3 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
4 王晓换;基于粗糙集和神经网络的故障诊断虚拟系统的研究[D];郑州大学;2010年
5 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
6 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
7 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
8 孙明帅;面向NSSA的异构数据规范化处理与集成[D];哈尔滨工程大学;2010年
9 李晓光;数据挖掘技术在高校招生和教务管理中的应用[D];哈尔滨工程大学;2010年
10 秦园;基于SPOT5的土地信息提取技术研究[D];大连理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 王波,黄迪明;遗传神经网络在邮件过滤器中的应用[J];电子科技大学学报;2005年04期
2 王世安;手机病毒原理及防范[J];大连轻工业学院学报;2004年01期
3 张敏;;贝叶斯分类方法在个性化信息检索中的应用研究[J];电脑学习;2006年02期
4 曹锐;;一种改进的朴素贝叶斯算法在入侵检测中的应用[J];电脑开发与应用;2009年09期
5 陈建发;吴顺祥;;一种基于用户行为分析的协同反垃圾邮件策略[J];电脑知识与技术(学术交流);2007年07期
6 孙其博;;手机病毒与移动通信安全[J];电信网技术;2008年07期
7 刘利东;基于组合度的汉语分词决策算法研究[J];德州学院学报(自然科学版);2003年02期
8 吴应良,韦岗,李海洲;一种基于N-gram模型和机器学习的汉语分词算法[J];电子与信息学报;2001年11期
9 王艳;元昌安;覃晓;彭昱忠;宋叶俊;;基于VC++/MFC的中文自动分词算法及其软件的实现[J];广西师范学院学报(自然科学版);2008年03期
10 潘莉;;手机病毒的特点与防范[J];电脑与电信;2011年05期
中国博士学位论文全文数据库 前3条
1 张丽新;高维数据的特征选择及基于特征选择的集成学习研究[D];清华大学;2004年
2 刘天羽;基于特征选择技术的集成学习方法及其应用研究[D];上海大学;2007年
3 陈景年;选择性贝叶斯分类算法研究[D];北京交通大学;2008年
中国硕士学位论文全文数据库 前10条
1 范小丽;文本分类中特征选择的研究与实现[D];西北大学;2011年
2 段晶;朴素贝叶斯分类及其应用研究[D];大连海事大学;2011年
3 范媛媛;手机病毒传播模型与分析技术研究[D];北京邮电大学;2011年
4 李晓丽;手机病毒的分析及对策研究[D];武汉大学;2004年
5 王峻;朴素贝叶斯分类模型的研究与应用[D];合肥工业大学;2006年
6 吴明旺;基于粗糙的数据挖掘属性约简算法研究[D];电子科技大学;2006年
7 潘文锋;基于内容的垃圾邮件过滤研究[D];中国科学院研究生院(计算技术研究所);2004年
8 郭前进;手机病毒分析及智能手机杀毒软件设计[D];河北工业大学;2007年
9 李岚;基于信息熵的属性约简及其应用[D];大连海事大学;2008年
10 郭雨松;一种启发式贝叶斯分类算法及其在铁路货运客户细分中的应用研究[D];北京交通大学;2008年
【二级引证文献】
中国期刊全文数据库 前2条
1 陈洋;哈力旦·阿布都热依木;伊力亚尔·达吾提;亚力青·阿里玛斯;;基于加权改进贝叶斯算法的维吾尔文文本分类[J];计算机工程与设计;2014年06期
2 龚静;胡平霞;胡灿;;用于文本分类的特征项权重算法改进[J];计算机技术与发展;2014年09期
中国硕士学位论文全文数据库 前1条
1 孟德;基于增量聚类的手机病毒挖掘技术的研究与实现[D];北京邮电大学;2013年
【二级参考文献】
中国期刊全文数据库 前10条
1 王峻;;一种基于属性相关性度量的朴素贝叶斯分类模型[J];安庆师范学院学报(自然科学版);2007年02期
2 王大玲,于戈,鲍玉斌,王国仁;一种基于关联性度量的决策树分类方法[J];东北大学学报;2001年05期
3 王辉;用于决策支持的贝叶斯网络[J];东北师大学报(自然科学版);2001年04期
4 王辉;用于预测的贝叶斯网络[J];东北师大学报(自然科学版);2002年01期
5 周颜军,王双成,王辉;基于贝叶斯网络的分类器研究[J];东北师大学报(自然科学版);2003年02期
6 李玉榕,乔斌,蒋静坪;基于熵的粗糙集属性简约算法[J];电路与系统学报;2002年03期
7 谢斌;;朴素贝叶斯分类在数据挖掘中的应用[J];甘肃联合大学学报(自然科学版);2007年04期
8 赵翔,祁云嵩,刘同明;协方差及相关系数在决策树构造中的应用[J];华东船舶工业学院学报(自然科学版);2003年05期
9 宫秀军,孙建平,史忠植;主动贝叶斯网络分类器[J];计算机研究与发展;2002年05期
10 曲开社,成文丽,王俊红;ID3算法的一种改进算法[J];计算机工程与应用;2003年25期
中国硕士学位论文全文数据库 前5条
1 赵斌;关联规则分布式挖掘算法研究和实现[D];南京师范大学;2003年
2 王德兴;基于量化概念格的关联规则挖掘模型研究[D];合肥工业大学;2003年
3 姜卯生;数据挖掘中基于贝叶斯技术的分类问题的研究[D];合肥工业大学;2004年
4 于莉;基于高校学生信息库的数据挖掘[D];内蒙古大学;2004年
5 张剑飞;贝叶斯网络学习方法和算法研究[D];东北师范大学;2005年
【相似文献】
中国期刊全文数据库 前10条
1 李丙春,梁俊峰,田华;统计学方法在数据挖掘中的应用与评价[J];喀什师范学院学报;2003年06期
2 王勇;李净;;基于改进的朴素贝叶斯分类的手机垃圾短信识别研究[J];江西科学;2008年05期
3 黄涛;谢嵘;;垃圾邮件过滤研究与实现[J];山东大学学报(理学版);2007年09期
4 王科欣;徐辉;;基于最小错误率与最小风险的贝叶斯分类比较与研究[J];科技信息;2009年23期
5 李国志;王洪春;聂勇;李世全;;基于因果图的贝叶斯网络[J];江西师范大学学报(自然科学版);2009年05期
6 谭喜成;边馥苓;;用贝叶斯分类方法和本体实现空间信息语义互操作[J];武汉大学学报(信息科学版);2006年08期
7 聂永红;;用于全国高校计算机等级考试的贝叶斯分类预测算法设计[J];科技资讯;2006年09期
8 杨诸胜;郭雷;罗欣;胡新韬;;基于分段主成分分析的高光谱图像波段选择算法研究[J];测绘工程;2006年03期
9 周桂如;;统计学方法在数据挖掘中的应用[J];甘肃联合大学学报(自然科学版);2009年S2期
10 孙笑微;;数据分类技术在高校人才识别系统中的应用[J];沈阳师范大学学报(自然科学版);2008年02期
中国重要会议论文全文数据库 前10条
1 陈猛;郭华平;范明;;一种基于贝叶斯的多窗口数据流分类模型[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
2 李伟红;龚卫国;陈伟民;梁毅雄;张红梅;;基于中国人人脸区域特征的贝叶斯分类法研究[A];中国仪器仪表学会第六届青年学术会议论文集[C];2004年
3 高霞;;创建基于贝叶斯分类的农作物病虫害等级预测模型[A];第26届中国气象学会年会农业气象防灾减灾与粮食安全分会场论文集[C];2009年
4 刘玉洁;谢小萍;杜秉玉;;利用FY-1D全球数据监测北极冰雪覆盖[A];中国气象学会2006年年会“卫星遥感技术进展及应用”分会场论文集[C];2006年
5 程新荣;杨仁刚;;网页自动分类在搜索引擎上的应用研究[A];2007'中国仪器仪表与测控技术交流大会论文集(二)[C];2007年
6 张文波;蒋春华;姚天昉;;基于贝叶斯及多模式串模糊匹配算法的不良短消息甄别混合模型[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
7 袁野;胡邦辉;刘丹军;苏宏琛;;基于贝叶斯分类判别方法的雷暴预报研究[A];第26届中国气象学会年会灾害天气事件的预警、预报及防灾减灾分会场论文集[C];2009年
8 曹三省;李丹;黄祥林;;一种基于贝叶斯分类的图像自动标引系统[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
9 邓文胜;邵晓莉;刘海;万诰方;许亮;;基于证据理论的遥感图像分类方法探讨[A];中国地理学会2006年学术年会论文摘要集[C];2006年
10 龚小谨;邢琰;林颖;雷杰;刘济林;;基于贝叶斯分类与水平集演化的月面岩石自动检测[A];中国宇航学会深空探测技术专业委员会第八届学术年会论文集(下篇)[C];2011年
中国博士学位论文全文数据库 前10条
1 王传旭;视频图像中人体目标的检测方法研究[D];中国海洋大学;2007年
2 陈景年;选择性贝叶斯分类算法研究[D];北京交通大学;2008年
3 惠孛;基于即时分类的垃圾邮件过滤关键技术的研究[D];电子科技大学;2009年
4 张纪阳;蛋白质组学中串联质谱数据搜库结果质量控制方法研究[D];国防科学技术大学;2007年
5 刘凯;基于知识发现的珠江口湿地识别监测及演变规律挖掘研究[D];中国科学院研究生院(广州地球化学研究所);2007年
6 张文涛;暂态电能质量问题研究[D];天津大学;2009年
7 夏定元;基于内容的图像检索通用技术研究及应用[D];华中科技大学;2004年
8 魏维;基于统计学的视频语义分析与提取技术研究[D];南京理工大学;2006年
9 齐国君;多类别模式分类技术及其在多媒体分析上的应用[D];中国科学技术大学;2009年
10 杜炅;离散型随机变量的贝叶斯分类方法研究[D];北京大学;2011年
中国硕士学位论文全文数据库 前10条
1 彭兴媛;朴素贝叶斯分类改进算法的研究[D];重庆大学;2012年
2 郑熠煜;贝叶斯分类方法及其在冠心病诊疗中的应用研究[D];大连海事大学;2013年
3 朱晓丹;朴素贝叶斯分类模型的改进研究[D];厦门大学;2014年
4 张秀方;基于贝叶斯网络的多维数据分类研究[D];西安电子科技大学;2014年
5 胡来宾;代价敏感贝叶斯分类方法改良[D];广西师范大学;2013年
6 秦鑫;一种蒙特卡罗贝叶斯分类的改进方法[D];华中师范大学;2004年
7 段晶;朴素贝叶斯分类及其应用研究[D];大连海事大学;2011年
8 李慧;基于贝叶斯分类方法的中文问句分类研究[D];石家庄铁道学院;2010年
9 阮乐中;基于贝叶斯分类的多代理入侵检测研究[D];合肥工业大学;2003年
10 郑默;贝叶斯分类算法的研究与应用[D];重庆大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026