收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

贝叶斯方法在变量选择问题中的应用

袁晶  
【摘要】:贝叶斯分析方法由于其统计推断的灵活性,得到众多研究者的青睐。近年来,抽样技术不断进步和计算机性能的不断提升,使得相关计算在实际应用中更加便于实现,拥趸日益增多。 本文主要利用贝叶斯方法,处理一些当前比较热门且实用的课题Lasso变量选择法,混合效应模型中的变量选择问题。 Lasso方法可以同时实现参数估计与变量选择,且形式简单易懂,被广泛应用于各种学术领域,在实际中也有不俗表现。在贝叶斯框架下,当回归系数被施以独立Laplace先验时,其边际后验众数便与非贝叶斯型Lasso给出的估计一致。现有贝叶斯Lasso方法主要集中于使用MCMC抽样技术的迭代型算法:一种是在E-步使用马尔科夫链蒙特卡罗法(Markov Chain Monte Carlo,以下简称MCMC)的蒙特卡罗期望最大化(Monte Carlo Expectation Maximization,以下简称MCEM)算法,另一种则是采用MCMC技术的全贝叶斯分析方法。值得注意的是,采用MCMC迭代抽样技术,其抽样样本具有很大的相关性,因此很可能存在收敛问题或是收敛速度缓慢,并且计算量较大。为了解决这些难题,我们借助逆贝叶斯公式(Inverse Bayes Formulae,以下简称IBF),给出了两种新型的基于非迭代抽样技术的算法,能够快速有效的解决贝叶斯Lasso问题。 混合效应模型常被用于刻画重复测量数据、纵向数据的特征,在生物医药以及计量经济等领域都有广泛应用。在实际应用中,纵向数据常常是非均衡的或是不完整的,换句话说,并不是所有的受试者均在相同的时间点被观测,而且关于每个受试者的观测样本数量、采样条件也不尽相同。在建模时需要考虑到纵向数据的非均衡性,并找到相对稀疏的协方差结构。因此,为了解决这些问题,我们针对这一类型的纵向数据,采用了既包含个体随机效应部分又带有服从自回归过程AR(1)的组间误差模型来进行拟合 本文共分四个章节,全文组织如下 第一章着重探讨本文的选题意义,并对相关背景知识作以简单的介绍 第二章中,我们设计了一种基于IBF抽样的非迭代型抽样技术,采用MCEM算法求得层次模型中回归系数的边际后验众数,即为贝叶斯Lasso问题的解该算法在全条件分布为非显示式时,通过调整重要抽样的权重来实现模拟结果也显示,不论是在预测精度还是变量选择的准确性方面,我们的方法都不输于现行的一些贝叶斯Lasso方法,甚至更为出色,尤其是当样本量相对较大时。 第三章中,我们同样就贝叶斯Lasso问题展开讨论,与第二章不同,我们在这里给出的方法本质上是基于一种非迭代算法的全贝叶斯分析法,首先给出一种EM算法得到回归系数的后验众数估计,然后将其作为初始点,借助IBF和重要重抽样算法,抽取一组近似服从后验分布的独立同分布样本,于是避免了MCMC算法所遇到的收敛性问题。基于这些独立同分布的样本,我们便可以很容易地给出回归系数的估计及其区间估计(贝叶斯可信区间)。模拟实验结果显示,我们的方法与现有的贝叶斯Lasso方法不相上下。 第四章中,我们将混合效应协方差阵进行修正Cholesky分解,进而对模型参数进行重新参数化,并采用MCMC技术,针对带AR(1)型误差的线性混合模型讨论了其贝叶斯变量选择方法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孙道德;再论线性模型自变元选择的BIC方法相容性条件[J];高校应用数学学报A辑(中文版);1995年01期
2 戴伯新;;回归变量选择中的数据诊断[J];应用概率统计;1992年04期
3 张大仁,赵立新;遗传算法对QSAR研究中变量选择的应用[J];环境化学;2000年03期
4 严于鲜;;层次分析法在线性回归方程中的应用[J];四川理工学院学报(自然科学版);2006年05期
5 罗英姿,张洁洋;用人工神经网络研究地方经济指标[J];河南广播电视大学学报;2005年02期
6 杨璐,高自友;用神经网络进行变量选择[J];北方交通大学学报;1999年03期
7 王今,韩文秀;财务危机预警中财务比率的选择研究[J];数学的实践与认识;2003年08期
8 韩敏,林云,孙燕楠,齐东海;基于神经网络的建筑行业投标报价研究[J];系统工程学报;2003年04期
9 陈战波;耿志林;杨珂玲;;城市日用水量预测的部分线性自回归模型[J];武汉工业学院学报;2009年02期
10 温忠麟;回归变量的一种选择方法及其应用[J];云南教育学院学报;1994年05期
11 张小亚;申琦;;基因表达式编程在环氧酶抑制剂定量构效关系中的应用[J];计算机与应用化学;2009年10期
12 杨宜平;薛留根;;高维部分线性模型的变量选择和估计(英文)[J];应用概率统计;2011年02期
13 田益祥;GMDH建模中变量选择的方法研究[J];安康师专学报;2001年04期
14 周一星,陈彦光;城市地理研究的几个基本问题[J];经济地理;2004年03期
15 孙道德;;随机回归模型选择的简单方法及其相合性[J];应用数学;2006年01期
16 徐慧;;资本结构的变量选择[J];沿海企业与科技;2006年11期
17 赵培信;;带有缺失数据线性回归模型的变量选择[J];河池学院学报;2009年02期
18 张海;王尧;常象宇;徐宗本;;L_(1/2)正则化[J];中国科学:信息科学;2010年03期
19 王占锋;吴耀华;赵林城;;删失回归模型中一个LASSO型变量选择和估计方法(英文)[J];应用概率统计;2010年01期
20 钟登华,刘豹,张世英,张维;非线性计量经济建模变量选择[J];天津大学学报;1993年03期
中国重要会议论文全文数据库 前10条
1 胡军华;蒋志刚;;环境变量选择与尺度变化对物种适宜栖息地模拟的影响:以普氏原羚为例[A];四川省动物学会第九次会员代表大会暨第十届学术研讨会论文集[C];2011年
2 李洪东;梁逸曾;;高维数据变量选择新方法研究[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
3 李慷;席裕庚;;带有输出反馈的多变量控制系统中变量的选择[A];1994中国控制与决策学术年会论文集[C];1994年
4 刁宁;张永清;;改进蚁群算法在麻痹性贝毒素的QSAR中变量选择的研究[A];第五届全国环境化学大会摘要集[C];2009年
5 韩敏;林云;;用神经网络的方法进行投标报价中的变量选择[A];第二十届中国控制会议论文集(下)[C];2001年
6 黄蓉;乔园园;;指示向量选择法在QSAR研究中的应用[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
7 张俊华;方伟武;;调查表数据分析中变量选择和判别分析的一些方法及简单比较[A];面向复杂系统的管理理论与信息系统技术学术会议专辑[C];2000年
8 张永清;费红琳;丁凯;;修正CP_EA-PLS用于多环芳烃光解半衰期QSAR的研究[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
9 梁逸曾;李洪东;许青松;曹东升;张志敏;;灰色化学建模与模型集群分析——兼论过拟合、稳健估计、变量选择与模型评价[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
10 刘咸姝;潘日芳;;满意控制结构综合的专家系统[A];1996年中国智能自动化学术会议论文集(上册)[C];1996年
中国博士学位论文全文数据库 前10条
1 王明秋;高维数据下若干回归模型的变量选择问题研究[D];大连理工大学;2012年
2 盖玉洁;若干高维模型变量选择和模型重建问题的研究[D];山东大学;2011年
3 任允文;基于处罚经验似然和跳惩罚最小二乘的变量选择[D];复旦大学;2010年
4 李腾飞;似然自适应惩罚变量选择方法研究[D];复旦大学;2012年
5 赵为华;变系数模型变量选择的稳健方法[D];华东师范大学;2013年
6 袁晶;贝叶斯方法在变量选择问题中的应用[D];山东大学;2013年
7 吕亚召;含指标项半参数回归模型的分位数回归与变量选择[D];华东师范大学;2013年
8 王树云;基于Bayes方法和图限制下正规化方法的变量选择问题及其在基因组数据中的应用[D];山东大学;2010年
9 陶凤梅;对应分析的数学模型[D];吉林大学;2005年
10 徐路;多元校正新算法研究和二维数据分析方法在色谱分离评价中的应用[D];湖南大学;2008年
中国硕士学位论文全文数据库 前10条
1 胡俊英;基于切比雪夫损失的变量选择方法[D];西北大学;2013年
2 李玲玲;高维线性模型的变量选择[D];广西师范大学;2010年
3 闫闯;多元回归模型中变量选择问题研究[D];黑龙江大学;2011年
4 鞠思秋;半参数变系数部分线性模型的变量选择方法[D];华东师范大学;2012年
5 刘存银;基于修正经验似然的变量选择方法及其应用研究[D];华东理工大学;2011年
6 刘琳;几类回归模型中的变量选择方法[D];广西大学;2013年
7 肖金花;函数系数部分线性模型的变量选择[D];湖南师范大学;2012年
8 梁爱;半参数变系数部分线性测量误差模型的变量选择[D];华东师范大学;2011年
9 满敬銮;生存数据模型的变量选择[D];中南大学;2009年
10 周玮;变量选择中的LARS算法及其在国民经济中的应用[D];山东大学;2011年
中国重要报纸全文数据库 前10条
1 ;到蒙特卡罗领略国际电动车[N];中国汽车报;2003年
2 甘文瑾;《等郎妹》折桂蒙特卡罗电视节最佳导演奖[N];中国电影报;2008年
3 葛新权 北京信息科技大学经济管理学院;经济统计模型的建模原则与创新[N];中国社会科学报;2010年
4 罗辛;姑且称之为“新芭蕾”[N];文艺报;2000年
5 记者 贾薇;中国杂技团一年演出超1800场[N];北京日报;2006年
6 张云中;摩纳哥“投赌”商务会奖[N];国际商报;2006年
7 海通股指期货联合研究中心 李子婧;基于BIRR模型的宏观因子套利策略[N];期货日报;2010年
8 徐福敏;中国石化牵手F1举行推介活动[N];中国石化报;2004年
9 中研博峰咨询有限公司咨询顾问 高荣霞;六步骤锁定细分市场[N];通信产业报;2009年
10 范超;浅谈如何备战统计建模大赛[N];中国信息报;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978