收藏本站
《北京交通大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于Volume Test的贝叶斯分类器研究

李锦善  
【摘要】: 数据挖掘将传统的数据分析方法与处理大量数据的复杂算法相结合,目的是从大量数据中找出先前未知的有用知识。分类是数据挖掘领域研究和应用最广泛的一个分支。目前已知的分类技术中基于统计模型的贝叶斯分类方法是一种具有坚实理论基础与广泛应用价值的分类技术之一,这种方法计算简单,运行速度快,并且分类正确率高,已经成为近年来的研究热点。而构造贝叶斯分类网络的一个关键问题是寻找随机变量间的依赖关系,统计学自然而然地成为这一问题的理论来源。因此,研究基于统计学的贝叶斯分类器有重要的理论和实践意义。 本文介绍了数据挖掘的有关概念。分析了分类器的构造方法与评估方法等,并着重分析了限制性贝叶斯分类器,包括不同的学习策略及与学习策略对应的典型分类算法,总结出限制性贝叶斯分类器的一个重要问题是寻找属性间的依赖关系。进而,研究了统计学假设检验中寻找属性间依赖关系的方法,并深入比较了卡方检验和Volume Test。在以上研究的基础上提出了基于Volume Test的树形贝叶斯分类算法。该算法在结构上采用了类似最大生成树结构,并使用Volume Test作为属性间依赖关系的判断标准。在理论和实验数据分析的基础上,又提出了一种朴素贝叶斯与树形贝叶斯相结合的分类算法,该算法充分吸收了朴素贝叶斯算法的优点、统计学的特点和假设检验的思想。更进一步地,在总结不同分类器学习策略的基础上,对本文以上两算法进一步改进,提出了基于评价与基于条件依赖相结合的贝叶斯分类算法,该算法结合两种学习策略的优点,提高了贝叶斯网络的灵活性。此外,在算法实现的细节方面,本文对三个算法的关键步骤最大生成树根节点的选择也进行了深入研究,经过实验分析,提出了使用第一个SuperParent作为根节点的方法。 最后,在WEKA系统上实现了新算法和比较算法,并通过实验进行了多方面的比较。实验结果表明,本文三个算法分类正确率都优于朴素贝叶斯、TAN算法,而基于评价与基于条件依赖相结合的贝叶斯分类算法达到了与SuperParent算法几乎相同的分类正确率,且其运行速度明显优于SuperParent算法。
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:TP18;TP311.13

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前2条
1 王静;地铁分时定价对乘客出行选择影响研究[D];西南交通大学;2011年
2 刘志丽;基于内容的社会标签推荐技术研究[D];哈尔滨工程大学;2012年
【共引文献】
中国期刊全文数据库 前10条
1 徐文婷;李承鹏;;基于自适应遗传算法的离散化方法[J];合肥师范学院学报;2011年03期
2 蔡莉;胡学钢;;一种基于粗集的决策表求核算法[J];安徽大学学报(自然科学版);2007年06期
3 周玉华;李景杰;;不完备决策表的一种属性约简方法[J];安徽大学学报(自然科学版);2009年04期
4 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
5 杨萍,万上海,陈耿;一种基于可变支持度的缺省规则挖掘算法[J];安徽工程科技学院学报(自然科学版);2004年02期
6 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
7 孙全玲;基于粗集和神经网络的建模方法研究[J];安徽建筑工业学院学报(自然科学版);2005年02期
8 孙虹;方敏;;基于Rough集和RBF网络的车牌字符识别方法[J];安徽建筑工业学院学报(自然科学版);2006年04期
9 孙虹;;粗糙集神经网络系统在车牌字符识别中的研究[J];安徽建筑工业学院学报(自然科学版);2007年04期
10 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 程泽凯;泰锋;;贝叶斯网络分类器结构学习:基于启发式的G2算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 杨波;秦锋;程泽凯;;一种新的分类学习系统评估度量[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 危前进;董荣胜;孟瑜;崔更申;;基于粗糙集的机械装配知识发现方法[A];广西计算机学会25周年纪念会暨2011年学术年会论文集[C];2011年
5 ;Fuzziness in Covering Generalized Rough Sets[A];第二十六届中国控制会议论文集[C];2007年
6 李雄;党生;;基于Rough集理论的战场侦察情报处理[A];第二十六届中国控制会议论文集[C];2007年
7 赵越岭;王英丽;;基于粗糙集感应电动机故障诊断决策规则分析[A];第二十七届中国控制会议论文集[C];2008年
8 ;Gas Thickness On-line Monitoring Instrument Design Based on BP Neural Network[A];第二十七届中国控制会议论文集[C];2008年
9 陈楚湘;沈建京;陈冰;尚长兴;王运成;;运用粗糙集理论建立中老年肺炎中医症候诊断标准[A];第二十九届中国控制会议论文集[C];2010年
10 龚锦红;杨辉;衷路生;;稀土萃取分离过程的Rough集案例推理方法[A];第二十九届中国控制会议论文集[C];2010年
中国博士学位论文全文数据库 前10条
1 刘家国;基于突发事件风险的供应链利益分配与行为决策研究[D];哈尔滨工程大学;2010年
2 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
3 孟宇龙;基于本体的多源异构安全数据聚合[D];哈尔滨工程大学;2010年
4 姜延吉;多传感器数据融合关键技术研究[D];哈尔滨工程大学;2010年
5 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
6 张目;高技术企业信用风险影响因素及评价方法研究[D];电子科技大学;2010年
7 渠瑜;基于SVM的高不平衡分类技术研究及其在电信业的应用[D];浙江大学;2010年
8 苏煜;基于SCF范式的在线P300脑机接口研究[D];浙江大学;2010年
9 李炳龙;文档碎片取证关键技术研究[D];解放军信息工程大学;2007年
10 郭戈;数字视频语义信息提取与分析[D];解放军信息工程大学;2010年
中国硕士学位论文全文数据库 前10条
1 郑伟;MDL算法用于时间梯度设计试验猪骨骼肌基因调控网络分析上的研究[D];华中农业大学;2010年
2 郑纪业;基于H.264的校园视频监控系统的设计与实现[D];山东科技大学;2010年
3 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
4 张晓冬;基于全矢谱的智能诊断技术研究[D];郑州大学;2010年
5 李昕哲;关系邻域系统的属性约简[D];郑州大学;2010年
6 刘琪;正态云模型模糊推理系统及其应用研究[D];郑州大学;2010年
7 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
8 冯为军;基于粗糙集理论的数据挖掘算法的研究[D];哈尔滨工程大学;2010年
9 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
10 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 董昕;于秀山;;正交试验方法在软件测试中的应用[J];北京化工大学学报(自然科学版);2007年S1期
2 贺崇明;马小毅;;广州市轨道交通网络发展研究[J];城市交通;2009年01期
3 方晓平,陈治亚,黄由衡;差别定价法在铁路运输中的应用研究[J];长沙铁道学院学报;2000年04期
4 肖旭;唐可月;李玉娜;;高峰负荷定价模型在运输业中的应用[J];大连铁道学院学报;2006年03期
5 刘迁;国内城市快速轨道交通项目前期研究的发展[J];地铁与轻轨;2003年02期
6 周立新,祁品苹;轨道交通余能利用的分时段票价制探讨[J];城市轨道交通研究;2004年04期
7 徐蔷薇;袁振洲;张宇石;;城市轨道交通通勤乘客心理及运营对策分析[J];城市轨道交通研究;2007年12期
8 王占生;张宁;陈晖;何铁军;黄卫;;轨道交通动态票价对城市交通的影响[J];城市轨道交通研究;2008年12期
9 郭平;;城市轨道交通客流特征及预测相关问题[J];城市轨道交通研究;2010年01期
10 于良春;彭恒文;;中国铁路客运高峰负荷定价模型分析[J];中国工业经济;2006年03期
中国硕士学位论文全文数据库 前6条
1 潘红艳;个性化信息服务的研究与实现[D];大连理工大学;2005年
2 刘钦启;综合网络管理决策支持系统关键技术研究[D];西安电子科技大学;2006年
3 罗正海;面向语义Web服务的本体合并研究[D];大连海事大学;2009年
4 丁洁冰;基于SP调查的客运专线旅客乘车选择行为研究[D];北京交通大学;2009年
5 张长星;隐私保护数据挖掘算法的研究[D];江南大学;2009年
6 张晓航;高速公路联网收费稽查管理应用研究[D];长安大学;2010年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 余博;城市轨道交通高峰定价问题的研究[D];北京交通大学;2012年
【相似文献】
中国期刊全文数据库 前10条
1 邓甦;付长贺;;四种贝叶斯分类器及其比较[J];沈阳师范大学学报(自然科学版);2008年01期
2 张丽娟;李舟军;;分类方法的新发展:研究综述[J];计算机科学;2006年10期
3 张晓龙;江川;骆名剑;;ROC分析技术在机器学习中的应用[J];计算机工程与应用;2007年04期
4 陈祎荻;秦玉平;;基于机器学习的文本分类方法综述[J];渤海大学学报(自然科学版);2010年02期
5 赵波;吴庆畅;高联雄;王万升;;学生就业贝叶斯网模型的构建与推理[J];云南民族大学学报(自然科学版);2008年04期
6 温尚清;郝志峰;廖芹;陈炎雄;;基于贝叶斯网络的脱机手写体汉字智能识别[J];计算机辅助工程;2006年03期
7 李广群;王志海;田凤占;;一种基于AdaBoost方法的树形HNB组合分类器[J];广西师范大学学报(自然科学版);2007年04期
8 易江芳;佟冬;程旭;;使用贝叶斯网络的高效模拟矢量生成方法[J];计算机辅助设计与图形学学报;2007年05期
9 李锦善;王志海;王中锋;;一种基于假设检验的贝叶斯分类器[J];计算机工程与应用;2008年21期
10 王和勇;樊泓坤;姚正安;李成安;;不平衡数据集的分类方法研究[J];计算机应用研究;2008年05期
中国重要会议论文全文数据库 前10条
1 富羽鹏;张敏;马少平;;通过邮件分析进行专家查找[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年
2 马永立;寿国础;胡怡红;钱宗珏;区海平;;新型网络流量识别分析系统及其性能评估[A];第六届全国信息获取与处理学术会议论文集(2)[C];2008年
3 谢世朋;胡茂林;;基于局部仿射区域对稀疏纹理分类的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
4 刘艳民;;中文网页分类方法的研究[A];2009年全国开放式分布与并行计算机学术会议论文集(下册)[C];2009年
5 雷蕾;吴乃君;刘鹏;刘兰娟;;灵敏度分析:分类器中的缺失数据[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
6 谢世朋;胡茂林;;基于滤波器库的纹理自动分类的研究[A];第一届建立和谐人机环境联合学术会议(HHME2005)论文集[C];2005年
7 夏诏杰;郭力;李晓霞;;化学主题网络爬虫的研究[A];第十届全国计算(机)化学学术会议论文摘要集[C];2009年
8 刘小平;黎夏;张啸虎;;一种新的基于多标记分解模型的遥感软分类方法[A];中国地理学会百年庆典学术论文摘要集[C];2009年
9 左南;李涓子;唐杰;;基于SVM的肖像照片抽取[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
10 李刚;郭崇慧;林鸿飞;杨志豪;唐焕文;;基于词典法和机器学习法相结合的蛋白质名识别[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
中国重要报纸全文数据库 前10条
1 记者 陶艺音;因势利导 拓展空间[N];上海科技报;2006年
2 海风;数据集中 为保险业防范风险提供有力保障[N];金融时报;2005年
3 陈卫东;银行数据集中后会计风险防范初探[N];中国城乡金融报;2007年
4 王跃庆;骨性关节炎需个体化治疗[N];家庭医生报;2006年
5 记者 汤璇 通讯员 廖启光 蒋明 王鹏翔;垃圾分类将有部颁标准[N];广东建设报;2004年
6 河南省邓州市人行 宋玉长 张卫东;数据集中 安全任重[N];网络世界;2002年
7 本报记者 吴晓伟;提升信息化从数据集中开始[N];计算机世界;2005年
8 中国人寿山东泰安分公司 高永文;保险业进入后数据集中时代[N];中国保险报;2010年
9 中国科学院东北地理与农业生态研究所 李建平;保护地球之肾 遥感体检湿地健康[N];中国水利报;2008年
10 刘藉仁;宏观数据集中冲击 债市积极应对[N];证券日报;2005年
中国博士学位论文全文数据库 前10条
1 李启青;遥感数据处理的遗传优化及其组合算法研究[D];中国科学院研究生院(遥感应用研究所);2004年
2 华斌;贝叶斯网络在水电机组状态检修中的应用研究[D];华中科技大学;2004年
3 张少中;基于贝叶斯网络的知识发现与决策应用研究[D];大连理工大学;2003年
4 李俭川;贝叶斯网络故障诊断与维修决策方法及应用研究[D];中国人民解放军国防科学技术大学;2002年
5 刘思远;信息融合和贝叶斯网络集成的故障诊断理论方法及实验研究[D];燕山大学;2010年
6 胡崇海;基于图的半监督机器学习[D];浙江大学;2008年
7 胡文斌;基于多Agent的分布式智能群决策支持系统关键技术研究[D];武汉理工大学;2004年
8 蒋良孝;朴素贝叶斯分类器及其改进算法研究[D];中国地质大学;2009年
9 徐海祥;基于支持向量机方法的图像分割与目标分类[D];华中科技大学;2005年
10 李忠伟;支持向量机学习算法研究[D];哈尔滨工程大学;2006年
中国硕士学位论文全文数据库 前10条
1 李锦善;基于Volume Test的贝叶斯分类器研究[D];北京交通大学;2008年
2 刘孟旭;基于EP的多分类器表决分类算法[D];郑州大学;2004年
3 毛杰;基于贝叶斯网络结构学习和分类器的数据挖掘研究[D];浙江大学;2008年
4 王雪飞;词间相关性对文本分类的影响[D];南京理工大学;2007年
5 李永;分类算法研究[D];吉林大学;2009年
6 温箐笛;训练基于EP的分类器算法[D];郑州大学;2006年
7 陈新亿;基于KL距离的贝叶斯网络结构学习算法研究[D];云南大学;2010年
8 山丹;基于显露模式的分类算法研究[D];北京交通大学;2008年
9 杨迪;基于显现模式的懒惰式贝叶斯分类方法[D];北京交通大学;2009年
10 马波;支持向量机多类分类算法的分析与设计[D];扬州大学;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026