收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

面向智能数据处理的图形模式研究

王双成  
【摘要】:图形模式是概率理论和图形理论的结合,是随机变量之间依赖关系的图形表示。在图形中的结点表示随机变量,边(有向或无向)的存在性表示随机变量之间的条件独立性。它具有形象直观的知识表示形式,以及更接近人思维特征的推理方式,被广泛用于专家系统、决策分析、模式识别,机器学习和数据采掘等领域,是近些年国内外智能数据处理的研究热点之一。图形模式由两部分构成,一部分是结构(图形),另一部分是参数(条件或边缘概率分布),分别用于定性与定量描述随机变量之间的依赖关系。图形模式研究的内容较多,其核心部分是贝叶斯网络(有向无环图),马尔科夫网络(无向图)和链图(有向和无向混合图)。本文主要研究贝叶斯网络和马尔科夫网络,并对链图作简要介绍。侧重研究图形模式在智能数据处理方面的应用,即如何转化数据为知识(图形模式学习)和知识转化为智能(基于图形模式的推理)。具体研究内容如下: 1.具有完整数据和离散变量的图形模式学习 对有代表性的方法和算法进行概述和分析。分别建立基于依赖分析思想和因果语义定向的贝叶斯网络结构学习方法,以及基于变量之间基本依赖关系、基本结构和依赖分析思想的贝叶斯网络和马尔科夫网络结构学习方法。这两种方法均能避免现有的打分-搜索方法的指数复杂性和局部最优结构问题,以及依赖分析方法中的大量高阶条件概率计算和边定向的局限性等问题。同时介绍了两种贝叶斯网络学习算法准确性评价方法。 2.具有不完整数据和离散变量的图形模式学习 由于具有不完整数据(或丢失数据)的现象普遍存在,而且由于丢失数据的存在无法直接进行图形模式学习,因此具有丢失数据的图形模式学习一直是一个被关注的重要而困难的研究课题。目前主要结合EM算法(或基于梯度的 WP=153 优化方法)和打分-搜索方法进行具有丢失数据的图形模式学习,效率低,而且易于陷入局部最优结构。本文提出了新的具有丢失数据的图形模式学习方法。该方法结合图形模式和Gibbs sampling,通过对随机初始化丢失数据的迭代修正与图形模式的优化调整进行具有丢失数据的图形模式迭代学习。由于Gibbs sampling过程收敛到全局平稳分布,因此可避免使用EM算法(或基于梯度的优化方法)所带来的局部最优和欺骗收敛问题。在每一次迭代中,基于图形模式分解联合概率能够显著提高抽样效率,通过图形模式的优化调整,使迭代过程中的图形模式逐渐接近于平稳分布的图形模式,直到满足终止条件结束迭代。 本文研究了具有不完整数据的三种情况:(1)随机丢失数据情况。每一列含有部分随机丢失的数据,具有变量的维数(取值范围)信息和部分例子信息;(2)隐藏变量(或聚类变量)的丢失数据情况。隐藏变量(或聚类变量)列的数据完全丢失,不具有隐藏变量(或聚类变量)的维数信息和例子信息;(3)小样本集的丢失数据情况。大量的行数据完全丢失(没有观察到),具有所有变量的维数信息和部分例子信息。在对这三种情况现有的方法和算法进行分析的基础上,针对存在的一些问题分别建立了新的方法和算法,并进行了必要的理论论证和对比试验分析。具有连续变量的图形模式学习也可转化为不完整数据问题,其学习也是一个迭代过程。在迭代过程中,本文使用混合数据聚类方法离散化连续变量,在新的离散变量的基础上对图形模式进行优化调整,直到收敛。 3.图形模式渐进学习 同化和顺应是人类学习新知识的两个基本机制,人类的学习过程可以看作是对新知识的不断同化和顺应的过程。本文基于人类学习新知识的基本机制和图形模式的结构和参数变化的不同步性,建立一种新的图形模式渐进学习方法。该方法首先进行图形模式的原结构与数据集的适应性检验,以决定是否进行结构调整。如果需要,则对结构进行适应性调整,并在新结构的基础上进行参数调整,否则只在原结构的基础上进行参数调整,以获得新的图形模式。这一学习过程符合人类学习新知识的基本机制,并能够有效地刻画图形模式结构和参数的动态变化,不需要现有方法中的平稳性和马尔科夫性两个假设。 4.图形模式基础理论和基于图形模式的推理 从概率模式中随机变量之间的条件独立性,图形模式中结点之间的 WP=154 d-separation(或s-separation)性,以及二者之间的联系三个方面对图形模式的基础理论进行了概述。对贝叶斯网络基础理论中的核心概念d-separation标准,给出了非否定形式的定义(原定义以否定形式给出,很难理解),并介绍了有助于理解d-separation标准的两个贝叶斯网络模型(信息管道模型和小球模型)。分别从概率推断,证据传递和因果分析等方面对基于图形模式的推理进行了系统的阐述和分析,并结合例子予以必要的说明。 5.图形模式分类器 在图形模式学习方法的基础上,分别建立了基于类约束图形模式分类器的学习方法和一般图形模式分类器的学习和优化方法,并在0-1损失下给出了图形模式分类器的最优性证明。同时介绍了常用的分类器分类准确性估计方法和不同分类器分类准确性比较方法。 6.基于图形模式的特征子集选择 特征子集选择是一个尽可能多的排除不相关和冗余特征以优化分类器性能的过程,是机器学习、模


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 李玮玮;王建东;方黎明;丁建立;;基于遗传禁忌算法的贝叶斯网边定向方法[J];计算机工程;2009年12期
2 张剑飞;王辉;周颜军;王双成;;基于局部优化具有连续变量的贝叶斯网络结构学习[J];东北师大学报(自然科学版);2006年01期
3 黄浩;宋瀚涛;陆玉昌;;基于小生境遗传算法的贝叶斯网络结构学习算法研究[J];计算机应用研究;2007年04期
4 胡春玲;胡学钢;;一种具有缺失数据的贝叶斯网络结构学习方法[J];合肥工业大学学报(自然科学版);2007年04期
5 付丹丹;;贝叶斯网络结构学习算法探析[J];牡丹江师范学院学报(自然科学版);2010年04期
6 李冰寒;刘三阳;李战国;;构建贝叶斯网络本质图的新方法[J];计算机工程与应用;2011年07期
7 喻晓锋;秦春影;;一种改进的贝叶斯网弧定向算法研究[J];计算机工程与科学;2010年03期
8 冀俊忠;张鸿勋;胡仁兵;刘椿年;;基于蚁群算法的贝叶斯网结构学习[J];北京工业大学学报;2011年06期
9 王双成;刘喜华;唐海燕;;具有隐藏变量的贝叶斯网络结构学习[J];模式识别与人工智能;2006年05期
10 王双成;冷翠平;;贝叶斯网络适应性学习[J];小型微型计算机系统;2009年04期
11 王双成,苑森淼;具有丢失数据的贝叶斯网络结构学习研究[J];软件学报;2004年07期
12 蒋望东;林士敏;鲁明羽;;基于选择性集成遗传算法的BNC结构学习[J];计算机辅助工程;2006年03期
13 冯楠;李敏强;寇纪淞;方德英;;一种改进的软件项目开发风险管理模型[J];计算机工程与应用;2007年21期
14 王双成;冷翠平;杜瑞杰;;一种新的贝叶斯网络增量学习方法[J];系统仿真学报;2009年17期
15 史达;谭少华;;混合式贝叶斯网络结构增量学习算法研究[J];控制与决策;2010年06期
16 高晓利;李冰寒;刘三阳;;构建本质图的改进算法[J];计算机应用研究;2010年12期
17 王辉,张剑飞,王双成;基于预测能力的贝叶斯网络结构学习[J];东北师大学报(自然科学版);2005年01期
18 王双成;基于结点排序的贝叶斯网络结构学习[J];计算机工程与应用;2005年18期
19 黄解军,万幼川,潘和平;贝叶斯网络结构学习及其应用研究[J];武汉大学学报(信息科学版);2004年04期
20 李海成;一种基于规则库的贝叶斯网络开发器的设计与实现[J];陕西科技大学学报;2005年02期
中国重要会议论文全文数据库 前10条
1 宫义山;钱娜;;贝叶斯网络结构在线学习算法及应用[A];科学发展与社会责任(A卷)——第五届沈阳科学学术年会文集[C];2008年
2 杜鹏英;罗小平;何志明;;贝叶斯网络的发展及理论应用[A];第三届全国虚拟仪器大会论文集[C];2008年
3 马海军;黄德镛;唐立建;;采空区顶板事故动态贝叶斯模型研究[A];2010'中国矿业科技大会论文集[C];2010年
4 黄桂松;;一种基于贝叶斯网络的业务驱动认知网络实现方法[A];江苏省电子学会2010年学术年会论文集[C];2010年
5 董杰;刘春红;李峰;李素芳;王传跃;;基于贝叶斯网络在双相抑郁的静息态网络间关系研究[A];中华医学会精神病学分会第九次全国学术会议论文集[C];2011年
6 杨卓鹏;郑恒;薛峰;任立明;;基于蒙特卡洛--贝叶斯网络方法的卫星地面站可用性分析[A];第二届中国卫星导航学术年会电子文集[C];2011年
7 瞿英;贾建;吴祈宗;;基于灰色关联聚类的隐变量学习算法研究[A];2009中国控制与决策会议论文集(3)[C];2009年
8 朱宏博;张芊;赵海;宋纯贺;;基于贝叶斯网络英文电影对白的潜在语义分析[A];第八届沈阳科学学术年会论文集[C];2011年
9 李立志;;基于贝叶斯网络的冠心病血瘀证辨证分析[A];2010中国医师协会中西医结合医师大会摘要集[C];2010年
10 王鹏;刘震;潘瑾;程尊平;汪卫;施伯乐;;OSBNC:一种快速贝叶斯网络分类算法[A];第二十届全国数据库学术会议论文集(研究报告篇)[C];2003年
中国博士学位论文全文数据库 前10条
1 王双成;面向智能数据处理的图形模式研究[D];吉林大学;2004年
2 张少中;基于贝叶斯网络的知识发现与决策应用研究[D];大连理工大学;2003年
3 黄解军;贝叶斯网络结构学习及其在数据挖掘中的应用研究[D];武汉大学;2005年
4 李俭川;贝叶斯网络故障诊断与维修决策方法及应用研究[D];中国人民解放军国防科学技术大学;2002年
5 王红梅;保护隐私的贝叶斯网络学习研究[D];天津大学;2006年
6 刘思远;信息融合和贝叶斯网络集成的故障诊断理论方法及实验研究[D];燕山大学;2010年
7 曹卫东;基于改进贝叶斯网络结构学习的航班延误波及分析[D];天津大学;2009年
8 胡文斌;基于多Agent的分布式智能群决策支持系统关键技术研究[D];武汉理工大学;2004年
9 华斌;贝叶斯网络在水电机组状态检修中的应用研究[D];华中科技大学;2004年
10 胡春玲;贝叶斯网络结构学习及其应用研究[D];合肥工业大学;2011年
中国硕士学位论文全文数据库 前10条
1 姚宏亮;贝叶斯网络结构学习及其多Agent系统模型研究[D];合肥工业大学;2003年
2 程泽凯;贝叶斯网络结构学习及MBNC实验平台的构建[D];广西师范大学;2004年
3 郝佳;贝叶斯网络开发平台的研究与实现[D];沈阳工业大学;2010年
4 毛杰;基于贝叶斯网络结构学习和分类器的数据挖掘研究[D];浙江大学;2008年
5 曹凯峰;基于贝叶斯网络方法的客户忠诚研究[D];合肥工业大学;2009年
6 蒋望东;基于遗传算法的贝叶斯分类器结构学习研究[D];广西师范大学;2005年
7 胡春玲;贝叶斯网络的结构学习算法研究[D];合肥工业大学;2006年
8 王婷;因子分析中的贝叶斯网络方法的研究[D];苏州大学;2008年
9 应凤刚;无人作战飞机对地攻击态势威胁评估方法和算法研究[D];西北工业大学;2005年
10 张捷;基于贝叶斯网络的分布式商务数据挖掘模型研究[D];浙江工商大学;2007年
中国重要报纸全文数据库 前10条
1 刘颍;丢失数据巧恢复[N];中国计算机报;2002年
2 本报法律组;修电脑丢失数据能否索赔[N];检察日报;2001年
3 ;移动存储介质丢失数据原因[N];中国电脑教育报;2005年
4 徐继业;欧倍德横向整合价值链图谋超速扩张[N];国际商报;2003年
5 ;Kingmax 256MB SD[N];中国计算机报;2004年
6 喻正东;防微杜渐降病毒[N];解放军报;2001年
7 王向东;从做鞋到买鞋[N];计算机世界;2004年
8 本报记者 卜居;迪比特:FD模式决战百万时代[N];计算机世界;2004年
9 杨阿昭;性能不稳 谁在作怪[N];中国计算机报;2003年
10 晓喻;数据修复 “春雨”在行动[N];中国电脑教育报;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978