收藏本站
《北京交通大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

树型贝叶斯网络分类器鉴别式训练研究

王中锋  
【摘要】:分类器是自动识别、预测与诊断系统等智能技术应用研究的基础,是数据挖掘和机器学习领域的一个主要研究对象.在众多分类模型中,贝叶斯网络分类器得到了多年的持续研究,综合性能不断提高.近年来,为了进一步提高其分类精度,一些研究人员开始研究其与贝叶斯网络学习算法的差异性.因为优化贝叶斯网络分类器的目的是提高分类器的精度与效率,而优化贝叶斯网络的目的是提高描述数据变量分布的能力,所以两者在有些方面存在很大的不同.一般来讲,学习算法的设计可以采用生成式策略或鉴别式策略.由于鉴别式策略采用的评价标准能够直接衡量分类器的精度,且能够对与实际数据变量分布有一定差异的网络结构进行调整,所以更适合应用于设计分类器学习算法.但是,鉴别式训练策略的优化目标函数缺乏良好的数学性质、学习的复杂度较高,所以需要结合其特点研究分类模型的设计,提高分类器的精度,减少训练的时间;需要分析新模型对环境和数据质量的依赖程度,研究其实际应用的价值.本文围绕一些实际问题深入研究了树型贝叶斯网络分类器(Tree-Structured Bayesian Network Classifier, TBNC),主要贡献如下: (1)研究得出鉴别式参数学习算法不适合在具有冗余边的树型贝叶斯网络结构上训练参数.首先,对贝叶斯网络结构与数据中变量的真实分布之间的关系进行了定量描述,将比真实分布复杂的网络结构定义为存在冗余边的网络结构;然后,用实验验证了冗余边存在的普遍性及其消极影响,说明了研究树型贝叶斯网络分类器分类器的价值;最后,基于对数条件似然函数偏导数的性质提出了一种消除网络结构中冗余边的RSD (Reducing Structure by Derivatives, RSD)算法,对网络结构进行优化,并用实验验证了该算法能够有效提高鉴别式参数学习算法在树型贝叶斯网络结构上训练得到的分类器的分类精度. (2)研究得出有相同结构底图的树型贝叶斯网络分类器等价.首先,分析了树型贝叶斯网络结构空间及其等价类,描述了具有相同底图的树型贝叶斯网络结构的等价关系和属性变量子网中边的方向无关性:然后,提出了一种树型贝叶斯网络分类器学习框架LFWAR (A Learning Framework of TBNC Without Considering Arc Reversal, LFWAR),实验验证了LFWAR得到的分类器的精度和稳定性在统计意义上无显著差异;最后,在场景分类问题的基准图像数据库上实验验证了应用属性变量子网中边的方向无关性设计的算法能够在不降低分类精度的前提下,减少分类引擎的训练时间. (3)研究得出树型贝叶斯网络分类器结构训练过程在多源非独立同分布数据上是健壮的.利用菲谢尔p值组合方法设计了一种应用于多源非独立同分布数据的分类器学习算法,来分析非独立同分布数据对树型贝叶斯网络分类器结构训练的影响.尽管在机器学习领域的研究成果表明贝叶斯网络结构训练会受到非独立同分布数据的较强影响,菲谢尔p值组合方法能够有效降低这种影响,但这种方法难以有效提高树型贝叶斯网络分类器的性能,因而表明在非独立同分布数据上的树型贝叶斯网络分类器结构训练过程是健壮的. (4)研究得出树型贝叶斯网络分类器鉴别式参数训练过程对噪声数据是敏感的,需要相应降噪策略.首先,将仅适用于二类值分类问题的集成贝叶斯网络参数学习扩展到适用于多类值分类问题的集成参数学习;然后,应用一种控制样本权重的方法抑制噪声数据的影响,且对多类值分类问题,提出了一种适用于处理不平衡数据样本的类别置信度量函数和降噪算法SmoothedBNB (Smoothed Bayesian Network Boosted Classifier, SmoothedBNB);最后,实验验证了控制样本权重的方法能够降低鉴别式参数训练过程的噪声敏感性,且所提的SmoothedBNB算法能够处理多类值分类器降噪时遇到的不平衡数据问题. 这些结论从多种角度论述了应用于分类的贝叶斯网络与应用于描述性的贝叶斯网络的差异性,展示了树型贝叶斯网络分类器的应用价值,改善了鉴别式训练策略的适应性,为实际应用奠定了良好的理论基础.
【学位授予单位】:北京交通大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:TP181

手机知网App
【参考文献】
中国期刊全文数据库 前5条
1 谢昭;高隽;;基于高斯统计模型的场景分类及约束机制新方法[J];电子学报;2009年04期
2 ;国家中长期科学和技术发展规划纲要(2006—2020年)[J];中华人民共和国国务院公报;2006年09期
3 王双成;冷翠平;曹锋;;小数据集贝叶斯网络多父节点参数的修复[J];计算机研究与发展;2009年05期
4 石洪波,王志海,黄厚宽,励晓健;一种限定性的双层贝叶斯分类模型[J];软件学报;2004年02期
5 张向荣;骞晓雪;焦李成;;基于免疫谱聚类的图像分割[J];软件学报;2010年09期
【共引文献】
中国期刊全文数据库 前10条
1 蔡坤琪;;基于相关鉴别分析和随机森林的人脸识别方法[J];安徽电子信息职业技术学院学报;2012年01期
2 王永梅;胡学钢;;决策树中ID3算法的研究[J];安徽大学学报(自然科学版);2011年03期
3 叶明全;;数据挖掘在医疗数据中的应用[J];安徽工程科技学院学报(自然科学版);2007年03期
4 范生万;王浩;;贝叶斯网络在高职英语应用能力考试中的应用研究[J];安徽工程科技学院学报(自然科学版);2007年04期
5 范生万;;贝叶斯网络分类模型在教育中的应用研究[J];安徽建筑工业学院学报(自然科学版);2008年01期
6 贾泽露;;基于GIS与SDM集成的农用地定级专家系统[J];安徽农业科学;2008年14期
7 蔡丽艳;冯宪彬;丁蕊;;基于决策树的农户小额贷款信用评估模型研究[J];安徽农业科学;2011年02期
8 濮永仙;;贝叶网在农业专家系统中的研究与应用[J];安徽农业科学;2011年07期
9 唐晓芬;赵秉新;;基于支持向量机的农村劳动力转移预测[J];安徽农业科学;2011年11期
10 赵静娴;;基于决策树的食品安全评估研究[J];安徽农业科学;2011年32期
中国重要会议论文全文数据库 前10条
1 叶红云;倪志伟;陈恩红;;一种混合型集成学习演化决策树算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
2 程泽凯;泰锋;;贝叶斯网络分类器结构学习:基于启发式的G2算法[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
3 杨波;秦锋;程泽凯;;一种新的分类学习系统评估度量[A];2005年“数字安徽”博士科技论坛论文集[C];2005年
4 张彬;金连文;;基于AdaBoost的手写体汉字相似字符识别[A];第二十六届中国控制会议论文集[C];2007年
5 赵越岭;王英丽;;基于粗糙集感应电动机故障诊断决策规则分析[A];第二十七届中国控制会议论文集[C];2008年
6 ;Gas Thickness On-line Monitoring Instrument Design Based on BP Neural Network[A];第二十七届中国控制会议论文集[C];2008年
7 ;Learning Algorithm of Decision Tree Generation for Continuous-valued Attribute[A];第二十九届中国控制会议论文集[C];2010年
8 ;Fault Diagnosis Based on Bayesian Networks for the Data Incomplete Industrial System[A];中国自动化学会控制理论专业委员会A卷[C];2011年
9 毛存礼;余正涛;线岩团;郭剑毅;雷雄丽;;基于短信的旅游景点酒店问答系统研究[A];中国自动化学会控制理论专业委员会A卷[C];2011年
10 王琦;;基于贝叶斯决策树算法的垃圾邮件识别机制[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
中国博士学位论文全文数据库 前10条
1 于化龙;基于DNA微阵列数据的癌症分类技术研究[D];哈尔滨工程大学;2010年
2 刘家国;基于突发事件风险的供应链利益分配与行为决策研究[D];哈尔滨工程大学;2010年
3 孟宇龙;基于本体的多源异构安全数据聚合[D];哈尔滨工程大学;2010年
4 曹静;区域产学研结合技术创新体系研究[D];哈尔滨工程大学;2010年
5 李书艳;单点氨基酸多态性与疾病相关关系的预测及其机制研究[D];兰州大学;2010年
6 张明;电能质量扰动相关问题研究[D];华中科技大学;2010年
7 姚志明;基于步态触觉信息的身份识别研究[D];中国科学技术大学;2010年
8 王晓明;基于统计学习的模式识别几个问题及其应用研究[D];江南大学;2010年
9 汪澎;驾驶人警觉状态检测技术研究[D];江苏大学;2010年
10 吴少智;时间序列数据挖掘在生物医学中的应用研究[D];电子科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 郑伟;MDL算法用于时间梯度设计试验猪骨骼肌基因调控网络分析上的研究[D];华中农业大学;2010年
2 马冉冉;集成学习算法研究[D];山东科技大学;2010年
3 吕万里;中文文本分类技术研究[D];山东科技大学;2010年
4 姜成玉;基于支持向量机的时间序列预测[D];辽宁师范大学;2010年
5 岳海亮;信息论在粗糙集连续属性离散化中的应用[D];辽宁师范大学;2010年
6 石国强;基于规则的组合分类器的研究[D];郑州大学;2010年
7 陈松峰;利用PCA和AdaBoost建立基于贝叶斯的组合分类器[D];郑州大学;2010年
8 雷斌;基于Java技术的智能化搜索引擎的研究与设计[D];哈尔滨工程大学;2010年
9 徐洪伟;数据挖掘中决策树分类算法的研究与改进[D];哈尔滨工程大学;2010年
10 曹振兴;适应概念漂移的数据流分类算法研究[D];哈尔滨工程大学;2010年
【二级参考文献】
中国期刊全文数据库 前2条
1 焦李成,杜海峰;人工免疫系统进展与展望[J];电子学报;2003年10期
2 王双成,苑森淼;具有丢失数据的可分解马尔可夫网络结构学习[J];计算机学报;2004年09期
【相似文献】
中国期刊全文数据库 前10条
1 胡春玲;;贝叶斯网络研究综述[J];合肥学院学报(自然科学版);2013年01期
2 张琨,徐永红,王珩,刘凤玉;用于入侵检测的贝叶斯网络[J];小型微型计算机系统;2003年05期
3 陈晓怀,程真英,刘春山;动态测量误差的贝叶斯建模预报[J];仪器仪表学报;2004年S1期
4 李芸;;基于贝叶斯信念网络的数据分类挖掘算法[J];计算机科学;2006年09期
5 徐计;张桂芸;;基于贝叶斯网络的一种牛奶产量预测研究[J];计算机工程与科学;2008年10期
6 李甦;陈新亿;李娟;李斯娜;;贝叶斯网的学习与应用研究综述[J];云南大学学报(自然科学版);2009年S1期
7 李天纵;王强;;一种基于贝叶斯网络的软件项目风险管理方法[J];计算机系统应用;2011年02期
8 王玮,蔡莲红;贝叶斯网络拓扑结构确定方法的研究[J];小型微型计算机系统;2002年04期
9 陈亚楠;王黎明;;基于贝叶斯的多议题协商优化[J];计算机工程与应用;2006年06期
10 鲁华;周德云;;贝叶斯网络的对地多目标攻击决策[J];火力与指挥控制;2008年07期
中国重要会议论文全文数据库 前10条
1 David Z.D'Argenio;;贝叶斯方法在实验室研究向临床的转化以及辨识隐含亚群体中的应用(英文)[A];中国药理学会临床药理学专业委员会会议暨第十次全国临床药理学学术会议论文集[C];2007年
2 姜峰;高文;姚鸿勋;;贝叶斯网络的推理和学习[A];全国网络与信息安全技术研讨会'2005论文集(下册)[C];2005年
3 丁东洋;刘希阳;;风险分析中的稳健贝叶斯方法[A];2011年全国电子信息技术与应用学术会议论文集[C];2011年
4 周桃庚;沙定国;;贝叶斯可靠性序贯验证试验方法[A];中国仪器仪表学会第三届青年学术会议论文集(下)[C];2001年
5 陈晓怀;程真英;刘春山;;动态测量误差的贝叶斯建模预报[A];第二届全国信息获取与处理学术会议论文集[C];2004年
6 杜鹏英;罗小平;何志明;;贝叶斯网络的发展及理论应用[A];第三届全国虚拟仪器大会论文集[C];2008年
7 杨丽;武海滨;李康;;无金标准诊断试验评价的贝叶斯方法及应用[A];2011年中国卫生统计学年会会议论文集[C];2011年
8 宁鹏达;;贝叶斯方法在风险投资项目决策中的应用[A];第四届中国科学学与科技政策研究会学术年会论文集(Ⅰ)[C];2008年
9 朱永生;;贝叶斯方法确定泊松变量的置信上限[A];中国物理学会高能物理分会第七届学术年会实验分会场论文集[C];2006年
10 王增忠;柳玉杰;施建刚;;建筑工程项目全寿命安全管理决策的贝叶斯方法[A];中国优选法统筹法与经济数学研究会第七届全国会员代表大会暨第七届中国管理科学学术年会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 贾海洋;贝叶斯网学习若干问题研究[D];吉林大学;2008年
2 黄友平;贝叶斯网络研究[D];中国科学院研究生院(计算技术研究所);2005年
3 朱允刚;贝叶斯网学习中若干问题研究及其在信息融合中的应用[D];吉林大学;2012年
4 董立岩;贝叶斯网络应用基础研究[D];吉林大学;2007年
5 李小琳;面向智能数据处理的贝叶斯网络研究与应用[D];吉林大学;2005年
6 江敏;贝叶斯优化算法的若干问题研究及应用[D];上海大学;2012年
7 胡笑旋;贝叶斯网建模技术及其在决策中的应用[D];合肥工业大学;2006年
8 何岩;统计稀疏学习中的贝叶斯非参数建模方法及应用研究[D];浙江大学;2012年
9 范敏;基于贝叶斯网络的学习与决策方法研究及应用[D];重庆大学;2008年
10 张什永;贝叶斯网不确定性推理研究[D];中国科学技术大学;2010年
中国硕士学位论文全文数据库 前10条
1 时光;贝叶斯认识论初探[D];南京师范大学;2008年
2 喻晓锋;贝叶斯网在认知诊断中的应用[D];江西师范大学;2009年
3 高倩;基于贝叶斯网络预测的故障诊断的应用与研究[D];华北电力大学(北京);2011年
4 马壮;基于ACO的贝叶斯网结构学习与应用[D];合肥工业大学;2005年
5 陆洋;学习大规模贝叶斯网络的新框架及其在构建蛋白质—蛋白质相互作用网络中的应用[D];上海交通大学;2013年
6 单冬冬;具有隐藏变量贝叶斯网学习算法的研究[D];苏州大学;2009年
7 史旻;基于贝叶斯网络的并行概率分布估计算法研究[D];武汉理工大学;2005年
8 蒋莉莉;基于贝叶斯网络的刑事侦查决策模型研究[D];河海大学;2007年
9 王竞骊;统计分析技术与贝叶斯网在分子筛合成数据库中的应用[D];吉林大学;2007年
10 赵海丰;关联规则挖掘及贝叶斯网表示研究[D];重庆大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026