收藏本站
《西安电子科技大学》 2008年
收藏 | 手机打开
二维码
手机客户端打开本文

基于数据几何特性的概率推理和统计学习研究

王开军  
【摘要】: 概率推理与统计学习是从数据中发掘客观事物之间关联和内在联系的重要工具,是一个具有挑战性与诸多困难的研究领域。本文对概率推理和统计学习的关键技术进行了深入探讨,以几何方法描述数据的几何特性并与概率推理和统计学习方法相结合为主线和特色,研究了利用数据间几何关联性的线性和支持向量回归方法、基于检测时间序列几何结构的变结构动态贝叶斯网络自适应学习、基于几何模式相关的动态贝叶斯网络、以及基于两聚类几何模型的聚类数目估计问题。本文工作的主要贡献总结如下: 1.针对目前线性回归和支持向量回归方法尚未关注挖掘和利用单个变量的数据关联性的问题,提出了几何关联学习方法(GcLearn)以利用这种关联性提高回归模型的预测性能。几何关联学习方法预测性能的理论分析表明,该方法具有比传统的线性回归和支持向量回归方法更好的预测性能,并给出了该方法的适用条件和判别准则。实验结果也验证了几何关联学习方法的有效性。该方法主要的创新点包括:提出挖掘单个变量的数据之间几何关联的方法、在曲线水平的几何回归方法和利用几何关联的回归模型预测方法。 2.提出了通过检测时间序列的几何结构来自适应学习变结构动态贝叶斯网络的方法(autoDBN),较好解决了从多变量时间序列数据中寻找较准确的模型区域和学习较准确的变结构动态贝叶斯网络的问题,并且求得的一系列模型自适应于多变量时间序列之间的变化依赖关系。该方法克服了现有方法无专门机制寻找模型区域和盲目搜索的弱点,实验结果表明其性能明显优于现有方法。具体的创新点包括:设计了时间序列转换为曲线流形的方法,提出了描述和检测时间序列几何结构的方法来分割时间序列;进而设计了确定合理模型区域的寻找策略;最后,提出了基于竞争F-检验的模型回访机制修正求得的一系列模型区域和动态贝叶斯网络模型的可能错误。 3.为了发现不同基因的表达水平在变化趋势上相关的基因调控关系,提出了基于几何模式相关的动态贝叶斯网络方法(Gp-DBN)。该方法较好地解决了基于趋势相关的基因调控关系的发现问题。真实基因表达数据的实验结果验证了该方法的有效性。该方法主要的创新点包括:提出的将基因表达的时间序列转换为几何模式的方法可以描述基因表达水平随时间上升与下降的变化趋势,用几何模式上的切向量表示几何模式特征的方法来有效地获取几何模式的离散特征量、确定调控子和估计调控时滞。 4.针对在使用PAM聚类算法的基因表达数据聚类分析中现有估计类数方法在聚类结构比较复杂的情况(例如小聚类靠近大聚类和聚类间有轻微重叠)下效果不佳的问题,提出了基于两聚类几何模型的系统演化方法这一类数估计方法。系统演化方法较好地解决了在基因表达数据的聚类分析中当小聚类靠近大聚类和聚类间有轻微重叠情况时的类数估计问题。实验结果表明,系统演化方法在估计聚类数目的准确性上明显优于现有方法。系统演化方法通过分析所有潜在聚类中最靠近的两个聚类(孪生聚类)是否可分来完成对整个聚类结构的分析,并提出了两聚类的几何模型用于分析孪生聚类的可分性。同时,该方法将一个数据集视为伪热力学系统,提出了依据孪生聚类之间能量关系的系统演化规则确定最优聚类数目。
【学位授予单位】:西安电子科技大学
【学位级别】:博士
【学位授予年份】:2008
【分类号】:TP181

手机知网App
【引证文献】
中国博士学位论文全文数据库 前1条
1 周世兵;聚类分析中的最佳聚类数确定方法研究及应用[D];江南大学;2011年
中国硕士学位论文全文数据库 前1条
1 唐丽;基于Petri网和贝叶斯概率推理的动态业务流程优化研究[D];西南交通大学;2011年
【参考文献】
中国期刊全文数据库 前10条
1 姚智胜;邵春福;高永亮;;基于支持向量回归机的交通状态短时预测方法研究[J];北京交通大学学报;2006年03期
2 欧阳赟;马建文;戴芹;;利用动态贝叶斯网络进行多时相遥感变化检测[J];电子与信息学报;2007年03期
3 王珏,石纯一;机器学习研究[J];广西师范大学学报(自然科学版);2003年02期
4 李洪双;吕震宙;;支持向量回归机在结构可靠性分析中的应用[J];航空学报;2007年01期
5 田凤占,张宏伟,陆玉昌,石纯一;多模块贝叶斯网络中推理的简化[J];计算机研究与发展;2003年08期
6 孙德山,吴今培,侯振挺,肖健华;基于SVR的混沌时间序列预测[J];计算机工程与应用;2004年02期
7 王飞,刘大有,薛万欣;基于遗传算法的Bayesian网中连续变量离散化的研究[J];计算机学报;2002年08期
8 王双成;混合贝叶斯网络隐藏变量学习研究[J];计算机学报;2005年09期
9 张浩然;汪晓东;;回归最小二乘支持向量机的增量和在线式学习算法[J];计算机学报;2006年03期
10 赵广社,张希仁;数据挖掘中的统计方法概述[J];计算机测量与控制;2003年12期
中国博士学位论文全文数据库 前3条
1 孙德山;支持向量机分类与回归方法研究[D];中南大学;2004年
2 田英杰;支持向量回归机及其应用研究[D];中国农业大学;2005年
3 刘靖旭;支持向量回归的模型选择及应用研究[D];国防科学技术大学;2006年
中国硕士学位论文全文数据库 前1条
1 桑立锋;动态贝叶斯网络及其在说话人识别中的应用[D];浙江大学;2004年
【共引文献】
中国期刊全文数据库 前10条
1 李晓红;田军委;;面向FCM聚类阈值分割的聚类有效性判别函数[J];安徽大学学报(自然科学版);2007年05期
2 王东霞;张楠;路晓丽;;基于育种算法的SVM参数优化[J];安徽大学学报(自然科学版);2009年04期
3 杨绪兵,韩自存;ε不敏感的核Adaline算法及其在图像去噪中的应用[J];安徽工程科技学院学报(自然科学版);2003年04期
4 陶秀凤,唐诗忠,周鸣争;基于支持向量机的软测量模型及应用[J];安徽工程科技学院学报(自然科学版);2004年02期
5 李淑华;徐良培;陶建平;;基于支持向量机的我国水产品出口贸易风险预警研究[J];安徽农业科学;2008年30期
6 许高程;张文君;王卫红;;支持向量机技术在遥感影像滑坡体提取中的应用[J];安徽农业科学;2009年06期
7 程伟;张燕平;赵姝;;支持向量机在粮食产量预测中的应用[J];安徽农业科学;2009年08期
8 武素华;;基于最小二乘支持向量机的土壤含水量检测的研究与分析[J];安徽农业科学;2009年09期
9 赵万明;黄彦全;谌贵辉;;基于支持向量机的农村用电量需求预测[J];安徽农业科学;2009年25期
10 陈念;沈佐民;;基于化学成分检测和SVM分类的茶叶品质鉴定[J];安徽农业科学;2010年15期
中国重要会议论文全文数据库 前10条
1 ;An effective procedure exploiting unlabeled data to build monitoring system[A];中国科学院地质与地球物理研究所第11届(2011年度)学术年会论文集(下)[C];2012年
2 宋海鹰;桂卫华;阳春华;;基于核偏最小二乘的简约最小二乘支持向量机及其应用研究[A];第二十六届中国控制会议论文集[C];2007年
3 ;A Novel Kernel PCA Support Vector Machine Algorithm with Feature Transition Function[A];第二十六届中国控制会议论文集[C];2007年
4 ;A Novel Proximal Support Vector Machine and Its Application in Radar Target Recognition[A];第二十六届中国控制会议论文集[C];2007年
5 周绮凤;林成德;罗林开;彭洪;;一种基于黎曼度量的训练样本类不平衡SVM分类方法研究[A];第二十六届中国控制会议论文集[C];2007年
6 顾小军;杨世锡;钱苏翔;;基于支持向量机的旋转机械多类故障识别研究[A];第二十六届中国控制会议论文集[C];2007年
7 吕蓬;柳亦兵;马强;魏于凡;;支持向量机在齿轮智能故障诊断中的应用研究[A];第二十六届中国控制会议论文集[C];2007年
8 姜明辉;袁绪川;;基于GA优化的个人信用评估SVM模型[A];第二十六届中国控制会议论文集[C];2007年
9 韩露;余正涛;邓锦辉;章程;毛存礼;郭剑毅;;领域知识关系对领域文本分类的影响[A];第二十七届中国控制会议论文集[C];2008年
10 ;Fault Pattern Recognition of Rolling Bearings Based on Wavelet Packet and Support Vector Machine[A];第二十七届中国控制会议论文集[C];2008年
中国博士学位论文全文数据库 前10条
1 母丽华;煤矿安全预警系统的方法研究[D];哈尔滨工程大学;2010年
2 梁洪;基于内容的医学图像检索及语义建模关键技术研究[D];哈尔滨工程大学;2010年
3 殷志伟;基于统计学习理论的分类方法研究[D];哈尔滨工程大学;2009年
4 朱广平;混响干扰中的信号检测技术研究[D];哈尔滨工程大学;2009年
5 孔凡芝;引线键合视觉检测关键技术研究[D];哈尔滨工程大学;2009年
6 李晚龙;六自由度Stewart平台分散智能控制研究[D];哈尔滨工程大学;2010年
7 杨宁;计算机辅助卷烟配方设计关键技术研究[D];中国海洋大学;2010年
8 王敏;分布式电源的概率建模及其对电力系统的影响[D];合肥工业大学;2010年
9 郑大腾;柔性坐标测量机空间误差模型及最佳测量区研究[D];合肥工业大学;2010年
10 全惠敏;电能质量相关信号的S变换检测算法及应用研究[D];湖南大学;2010年
中国硕士学位论文全文数据库 前10条
1 展慧;基于多源信息融合技术的板栗分级检测方法研究[D];华中农业大学;2010年
2 杜二玲;拟概率空间上等均值噪声下统计学习理论的理论基础[D];河北大学;2007年
3 李金华;基于SVM的多类文本分类研究[D];山东科技大学;2010年
4 徐芳芳;优化问题的PVD算法研究[D];山东科技大学;2010年
5 朱耿峰;支持向量机在冲击地压预测模型中的应用研究[D];山东科技大学;2010年
6 韩晓峰;高斯混合模型及在探测网络社区结构中的应用[D];山东科技大学;2010年
7 安文娟;Fisher和支持向量综合分类器[D];辽宁师范大学;2010年
8 姜成玉;基于支持向量机的时间序列预测[D];辽宁师范大学;2010年
9 李海清;支持向量机在金融市场预测中的应用[D];辽宁师范大学;2010年
10 杨勇;基于SOA的浙江永康某小家电企业应用系统集成平台开发与应用[D];浙江理工大学;2010年
【同被引文献】
中国期刊全文数据库 前10条
1 冀俊忠,刘椿年,江川,杨文盛;贝叶斯网及其概率推理在智能教学中的应用[J];北京工业大学学报;2002年03期
2 李玉鑑;;分层子树合并聚类算法[J];北京工业大学学报;2006年05期
3 李辉;张振华;;基于Petri网的电子运维系统工作流建模[J];北京化工大学学报(自然科学版);2009年S1期
4 石剑飞;闫怀志;牛占云;;基于凝聚的层次聚类算法的改进[J];北京理工大学学报;2008年01期
5 姜园,张朝阳,仇佩亮,戚玉鹏;对聚类算法普遍存在问题的解决办法[J];电路与系统学报;2004年03期
6 高新波,李洁,姬红兵;基于加权模糊c均值聚类与统计检验指导的多阈值图像自动分割算法[J];电子学报;2004年04期
7 淦文燕;李德毅;王建民;;一种基于数据场的层次聚类方法[J];电子学报;2006年02期
8 黄宇;付琨;吴一戎;;基于Markov随机场K-Means图像分割算法[J];电子学报;2009年12期
9 姜园,张朝阳,仇佩亮,周东方;用于数据挖掘的聚类算法[J];电子与信息学报;2005年04期
10 董俊;王锁萍;熊范纶;;可变相似性度量的近邻传播聚类[J];电子与信息学报;2010年03期
中国博士学位论文全文数据库 前7条
1 钱鹏江;大规模数据集聚类方法研究及应用[D];江南大学;2011年
2 范九伦;模糊聚类新算法与聚类有效性问题研究[D];西安电子科技大学;1998年
3 洪国彬;基于随机Petri网的企业业务流程重组的理论与优化方法研究[D];天津大学;2003年
4 张爱华;基于模糊聚类分析的图像分割技术研究[D];华中科技大学;2004年
5 赵恒;数据挖掘中聚类若干问题研究[D];西安电子科技大学;2005年
6 陈黎飞;高维数据的聚类方法研究与应用[D];厦门大学;2008年
7 李艳灵;基于聚类的图像分割算法研究[D];华中科技大学;2009年
中国硕士学位论文全文数据库 前10条
1 贺炜;贝叶斯网络在远程考试系统中的应用[D];西北工业大学;2001年
2 陈玲;基于贝叶斯网络的学生模型的设计与实现[D];太原理工大学;2003年
3 胡彩平;贝叶斯网络及其在范例推理中的应用研究[D];安徽大学;2004年
4 张剑飞;贝叶斯网络学习方法和算法研究[D];东北师范大学;2005年
5 严慧鑫;贝叶斯网精确推理算法的研究[D];吉林大学;2006年
6 程杰;基于Petri网的第三方物流企业业务流程优化方法研究[D];北京交通大学;2007年
7 陈友光;基于Petri网的流程优化和重组的应用研究[D];电子科技大学;2007年
8 俞奎;贝叶斯网络建模及推理算法研究[D];合肥工业大学;2007年
9 刘俊娜;贝叶斯网络推理算法研究[D];合肥工业大学;2007年
10 艾厚文;基于随机Petri网的铁路应急预案流程化研究[D];北京交通大学;2008年
【二级引证文献】
中国硕士学位论文全文数据库 前1条
1 刘明术;聚类算法及其有效性问题研究[D];安徽大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 李昌爱,顾也萍;主成分分析和回归分析在水稻土质量评价中的应用——以桐城市为例[J];安徽师范大学学报(自然科学版);2001年04期
2 蓝永超,王新民;岭回归分析在融雪径流预报中的应用[J];冰川冻土;1992年01期
3 陈雪,戴芹,马建文,李小文;贝叶斯网络分类算法在遥感数据变化检测上的应用[J];北京师范大学学报(自然科学版);2005年01期
4 曾庆军,王菲,黄国建,李洪瑞;基于线谱特征提取的被动声纳目标识技术研究[J];船舶工程;2001年03期
5 吴今培;邹平;;时间序列的稳健分析[J];长沙铁道学院学报;1990年01期
6 郑福寿,沈长松,林益才;主成分回归分析法在混凝土坝初次蓄水期应力统计模型中的应用[J];大坝与安全;2001年01期
7 吴子安;;回归参数的有偏估计——岭回归法[J];大坝观测与土工测试;1993年02期
8 葛宏立;魏占才;杨林;张树森;宋桂香;;稳健回归及其在林业中的应用[J];东北林业大学学报;1996年03期
9 王辉;用于决策支持的贝叶斯网络[J];东北师大学报(自然科学版);2001年04期
10 姚宜斌,陶本藻,施闯;稳健回归分析及其应用研究[J];大地测量与地球动力学;2002年02期
中国重要会议论文全文数据库 前1条
1 万中英;王明文;廖海波;左家莉;;维数约简在网页分类中的应用[A];NCIRCS2004第一届全国信息检索与内容安全学术会议论文集[C];2004年
中国硕士学位论文全文数据库 前2条
1 李华;SVM中多项式核函数的修改及Exon-Intron特征序列的研究[D];北京工业大学;2001年
2 周东树;支撑向量回归机(SVRM)的微分几何方法[D];北京工业大学;2001年
【相似文献】
中国期刊全文数据库 前10条
1 叶苗;王勇;;基于支持向量回归学习机的网络流量预测[J];桂林工学院学报;2007年02期
2 罗拥华;张仕华;;基于SVM的BP改进新法[J];湖南工程学院学报(自然科学版);2007年01期
3 王华秋;曹长修;;一种并行核径向基神经网络预测模型[J];重庆大学学报(自然科学版);2006年03期
4 高昆仑;刘建明;徐茹枝;王宇飞;李怡康;;基于支持向量机和粒子群算法的信息网络安全态势复合预测模型[J];电网技术;2011年04期
5 严晓明;郑之;;BP神经网络梯度函数的分析研究[J];福建教育学院学报;2011年01期
6 刘伟,张巧龄,夏岩;湖北省土地资源可持续性利用综合评价研究[J];科技进步与对策;2004年10期
7 郭超;陆新建;;工业过程数据中缺失值处理方法的研究[J];计算机工程与设计;2010年06期
8 邹家禄,张广福,程时昕,朱岩;南京市无线电噪声测量及分布规律[J];东南大学学报;1996年04期
9 王香柯,王金柱;邮电业务总量的预测研究[J];西安邮电学院学报;1999年03期
10 肖明,柯惠新;“网民知多少?”——中国互联网络信息中心全国调查抽样方案设计[J];数理统计与管理;2001年05期
中国重要会议论文全文数据库 前10条
1 吴海镇;叶海龙;林宏伟;孙华;;利用气候因子建立油菜菌核病回归预测模式[A];第四届长三角科技论坛论文集(下册)[C];2007年
2 张雨石;唐丽敏;王庸凯;陈文科;;关于中日航线集装箱运量不平衡原因的分析[A];中国航海学会——2004年度学术交流会优秀论文集[C];2004年
3 杜春雄;李平;;三化螟发蛾期期距相关回归预测[A];水稻螟虫灾变规律及治理对策研讨会论文集[C];2001年
4 罗本家;曹炳元;;含T-Fuzzy数据的回归预测模型及其在石油地质企业管理中的应用[A];数学及其应用文集——中南模糊数学和系统分会第三届年会论文集(上卷)[C];1995年
5 龙如银;;矿井深部相对瓦斯涌出量的预测研究[A];管理科学与系统科学进展——全国青年管理科学与系统科学论文集(第4卷)[C];1997年
6 祖巧红;陈定方;胡吉全;;客户分析中的数据挖掘算法比较研究[A];12省区市机械工程学会2006年学术年会湖北省论文集[C];2006年
7 荆象泉;刘继荣;卢宪忠;唐祖华;李士明;;运用现代企业经济分析方法实施企业节能节水的量化管理[A];济南市2005年学术年会论文集[C];2005年
8 刘子阳;郭崇慧;;应用支持向量回归方法预测胎儿体重[A];大连理工大学生物医学工程学术论文集(第2卷)[C];2005年
9 管河山;姜青山;谭忠;;一种处理缺失数据的回归模型[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
10 要晶晶;王霞;金伟其;朱平;;遥感傅里叶变换红外多组分气体光谱定量分析的仿真研究[A];光电技术与系统文选——中国光学学会光电技术专业委员会成立二十周年暨第十一届全国光电技术与系统学术会议论文集[C];2005年
中国重要报纸全文数据库 前6条
1 马明超;“紧平衡”缓解 小麦市场阶段性供大于求[N];期货日报;2005年
2 黄勇;贵阳:在建和空置商品房4年才能消化完[N];新华每日电讯;2005年
3 王海亚;负荷预测的几种方法及特点[N];黔西南日报;2008年
4 杨连民;预测,让商业物流心中有数[N];医药经济报;2003年
5 华泰证券综合研究所 张俊;如何为创业企业评估收益[N];证券时报;2001年
6 2010~2020年山东粮食供需平衡问题研究课题组;未来10年山东粮食供需形势前瞻[N];粮油市场报;2011年
中国博士学位论文全文数据库 前10条
1 王开军;基于数据几何特性的概率推理和统计学习研究[D];西安电子科技大学;2008年
2 谭泗桥;支持向量回归机的改进及其在植物保护中的应用[D];湖南农业大学;2008年
3 温胜强;基于组合预测与模糊优化的高速公路路面养护决策研究[D];大连理工大学;2009年
4 张晓利;基于非参数回归的短时交通流量预测方法研究[D];天津大学;2007年
5 孙文霞;公共交通系统规划若干关键问题研究[D];天津大学;2010年
6 柴艳莉;基于智能信息处理的煤与瓦斯突出的预警预测研究[D];中国矿业大学;2011年
7 宋杰鲲;基于不确定优化理论的油藏经营管理系统决策研究[D];中国石油大学;2007年
8 杜乃成;弧焊机器人金属快速成形研究[D];天津大学;2009年
9 林士奇;领导力、经营战略与组织绩效关系之研究[D];中国科学技术大学;2011年
10 王世锦;空域分类关键技术及应用研究[D];南京航空航天大学;2010年
中国硕士学位论文全文数据库 前10条
1 冯明辉;基于单目视觉照相法的人体参数快速测量研究[D];吉林大学;2012年
2 陈建宇;基于仿真的交通管理辅助决策支持技术研究[D];国防科学技术大学;2004年
3 岳瑞;税收收入预测模型的研究与实现[D];郑州大学;2005年
4 梁武波;新疆阿勒泰地区经济社会综合评价与预测[D];中国地质大学(北京);2007年
5 郭得令;基于LS-SVM的围岩位移非线性预测应用研究[D];武汉理工大学;2006年
6 王帅;我国铜矿资源保障程度研究[D];中国地质大学(北京);2009年
7 李源;数据仓库与数据挖掘技术在综合网管中的应用[D];西安电子科技大学;2006年
8 翟信德;基于支持向量机的大坝变形预测研究[D];合肥工业大学;2007年
9 陆云飞;上海市郊水稻经营绩效评估及微观经济学分析[D];华东师范大学;2005年
10 姜鸿亮;基于支持向量机的生理信号预测方法研究[D];哈尔滨工业大学;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026