收藏本站
《山东大学》 2011年
收藏 | 手机打开
二维码
手机客户端打开本文

经验似然纵向数据和似然Dantzig Selector方法

胡爽  
【摘要】:本文主要对如何充分利用纵向数据的组内相关性来提高对纵向数据半参模型的估计精度以及高维数据的变量选择问题进行研究。 纵向数据是对多个观测主体的响应变量和相应的多个协变量进行重复观测形成的数据。对每个主体的观测数据称为一组数据。纵向数据最主要的特征是组内数据相关而组间数据独立。对纵向数据进行分析的难点就是如何充分利用组内数据的相关性来提高统计推断的精度。在第二章,我们将利用经验似然方法对纵向数据的半参模型的回归参数构造置信域。众所周知,与基于渐近正态的方法或基于Bootstrap的方法相比较,经验似然方法在构造置信域时有很大的优越性。本章的主要贡献是充分利用了纵向数据的组内相关性来提高估计精度。我们的方法是:首先,我们为每个主体的观测数据的误差假设一个半参的协方差结构。然后,我们同时利用观测数据的一阶矩和二阶矩条件来构造估计方程。其中的讨厌参数被profile掉了。由于在估计方程中插入了未知分量的非参估计,我们采用了under-smoothing技术来保证所得到的对数经验似然比统计量渐近收敛于标准卡方分布。我们还做了大量的统计模拟来验证我们提出的方法的优越性。 受很多实际应用的激励,近年来人们对高维数据的研究有了很大的进展。一些为传统的低维数据设计的统计方法已经无法适应现代统计学的要求。进行高维数据分析的重点是如何利用数据结构的特征进行降维。如果在高维数据中,有很多的预测变量是冗余的,也就是说这些变量根本不含有响应变量的信息,那么,有效地分辨出哪些预测变量是重要的,哪些是冗余的,可以帮助我们建立一个解释性更强、更有用的模型。在第三章,我们将考虑似然情况下的变量选择问题。Dantzig方法自提出就受到了广泛的关注。Dantzig方法主要适应于参数是高维且稀疏情形的线性模型:Y=Xβ+ε,其中Y是n×1响应变量,X是n×p预测变量的矩阵,β是p维且稀疏的参数向量,ε是n×1的零均值、独立同分布的误差项。Dantzig的原理是:假设ε是正态分布,在将得分函数的取值控制在一定的范围内的同时,找寻那个使参数β的l1,范数达到最小的参数值,此向量即为我们的解。在第三章,我们将Dantzig方法的思想推广到了一般的似然情况。我们的方法是:首先得到未知参数的极大似然估计βmle然后,将得分函数在βmle点Taylor展开,得到得分函数的一个线性近似,然后我们就可以利用Dantzig已有的分析方法讨论它的统计性质了。我们的方法在参数维数随样本容量一起趋于无穷时也表现良好。我们研究了解的存在唯一性,并且得到了解的相合和渐近正态性。为了确保模型选择的相合性,我们提出了基于似然的Adaptive Dantzig方法并得到其Oracle性质。最后,我们做了大量的统计模拟来验证我们所提出的方法的优良特性。 在实际应用中,高维问题的参数经常具有某种分组结构,即,每组参数同时为零或同时非零。通常的例子就是多元的ANOVA问题以及非参成分的可加模型。在以上的情况中,进行变量选择等同于对一组变量进行选择而非选择单个的变量。在这类变量选择问题中如何充分利用这种结构是我们要加以考虑的重要问题。在第四章中,考虑到每组中元素的个数可能不同,我们提出了新的Group Dantzig Selector方法。我们得到了估计的非渐近的l2范数的上界。我们还做了大量模拟来研究我们的方法在实际中的表现。
【学位授予单位】:山东大学
【学位级别】:博士
【学位授予年份】:2011
【分类号】:O212.1

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 薛留根;朱力行;;纵向数据下部分线性模型的经验似然推断[J];中国科学(A辑:数学);2007年01期
2 冯三营;樊明智;;纵向数据部分线性模型的广义经验似然推断[J];数理统计与管理;2011年04期
3 秦永松;条件分位数和条件密度的经验似然置信区间[J];数学年刊A辑(中文版);1999年03期
4 郭波涛;王文昌;李辉智;刘岭;易东;;Weibull分布拟合的经验似然方法[J];中国卫生统计;2009年01期
5 王伯成,李朝阳;高阶中心矩的经验似然比区间估计[J];工科数学;1996年03期
6 张军舰;φ混合样本下的经验似然估计[J];广西师范大学学报(自然科学版);2001年01期
7 崔恒建,袁修久;附加信息下的p分位数光滑经验似然置信区间[J];系统科学与数学;2001年02期
8 郑明;杜玮;;含有截断和缺失数据的经验似然推断(英文)[J];应用概率统计;2008年04期
9 姜波;秦永松;;相依样本下密度函数经验似然置信区间[J];安徽工业大学学报(自然科学版);2006年03期
10 贺飞燕;;普通似然及经验似然情况下的结点问题[J];价值工程;2006年08期
中国重要会议论文全文数据库 前10条
1 韦博成;解锋昌;林金官;;ZI数据的统计分析[A];江苏省现场统计研究会第11次学术年会论文集[C];2008年
2 孙志猛;张忠占;;随机右删失数据下线性变换模型的经验似然推断[A];北京市第十五次统计科学讨论会获奖论文集[C];2009年
3 孙燕;柴根象;;纵向数据混合效应模型参数估计的强相合性[A];2003中国现场统计研究会第十一届学术年会论文集(下)[C];2003年
4 林金官;韦博成;;离散型广义非线性纵向数据模型中偏离名义离差的检验及其功效模拟[A];中国现场统计研究会第12届学术年会论文集[C];2005年
5 李玉梅;钱伟民;;纵向数据半参数混合效应模型中的估计方法[A];2003中国现场统计研究会第十一届学术年会论文集(上)[C];2003年
6 刘超;贾知青;;基于动态线性混合模型的居民消费行为研究[A];第九届中国管理科学学术年会论文集[C];2007年
7 李春红;张忠占;;一类毒性试验中药物剂量水平的识别[A];北京市第十三次统计科学讨论会论文选编[C];2006年
8 胡军华;蒋志刚;;环境变量选择与尺度变化对物种适宜栖息地模拟的影响:以普氏原羚为例[A];四川省动物学会第九次会员代表大会暨第十届学术研讨会论文集[C];2011年
9 杨爱军;林金官;;具有AR(1)误差的非线性混合效应模型中的Cook距离[A];江苏省现场统计研究会第十次学术年会论文集[C];2006年
10 刁宁;张永清;;改进蚁群算法在麻痹性贝毒素的QSAR中变量选择的研究[A];第五届全国环境化学大会摘要集[C];2009年
中国重要报纸全文数据库 前10条
1 李杰;统计的稳健性及其应用取得成果[N];科技日报;2006年
2 华亭轩;戴尔助力新疆哈密金保工程[N];中国信息报;2006年
3 崔昕;带着经验前行[N];中国医药报;2005年
4 义川;河北“触网”步伐加速[N];网络世界;2000年
5 金立新;银行理财如何面对股市的红火?[N];金融时报;2007年
6 见依;学会用计量经济学研究人力资本[N];北京人才市场报;2003年
7 本报记者 王梓 特约记者 孙铮;把握中国教育的高回报率[N];21世纪经济报道;2003年
8 湖南 李杰;单片机同步驱动LED点阵屏的方法[N];电子报;2004年
9 本报记者 张然;大连会展经济增长轨迹[N];市场报;2003年
10 ;四川矿权管理有望信息化[N];中国矿业报;2002年
中国博士学位论文全文数据库 前10条
1 胡爽;经验似然纵向数据和似然Dantzig Selector方法[D];山东大学;2011年
2 张涛;含有测量误差的纵向数据的统计推断[D];复旦大学;2011年
3 袁晓惠;基于辅助信息的非参数和半参数似然推断[D];东北师范大学;2012年
4 许佩蓉;高维纵向数据中边际模型和混合效应模型的若干研究[D];华东师范大学;2013年
5 梁薇;右删失数据与经验似然方法[D];北京大学;2011年
6 陈黎;不等式约束下的经验似然推断[D];云南大学;2012年
7 韩玉;非线性时间序列模型经验似然推断的若干结果[D];吉林大学;2012年
8 王秀丽;半参EV模型和缺失数据下估计方程的经验似然推断[D];山东大学;2011年
9 于卓熙;相依误差下部分线性模型的经验似然统计推断[D];吉林大学;2010年
10 李周平;经验似然方法的若干应用[D];兰州大学;2010年
中国硕士学位论文全文数据库 前10条
1 刘琦;广义线性模型的惩罚高维经验似然[D];辽宁师范大学;2012年
2 韩慧;关于部分线性模型的惩罚高维经验似然[D];辽宁师范大学;2011年
3 王明辉;纵向数据下部分线性模型的分位数回归[D];中南大学;2012年
4 吕婷;舍入数据的经验似然方法[D];广西师范大学;2012年
5 朱琳琳;m-相依误差下非线性半参数模型的经验似然推断[D];辽宁师范大学;2011年
6 李俊云;φ-混合样本下密度函数的经验似然推断[D];广西师范大学;2012年
7 张彦;φ-混合样本下线性模型的经验似然推断[D];广西师范大学;2012年
8 孙杏园;纵向数据模型选择的Lagrange乘子法[D];大连理工大学;2010年
9 黄逸;时间序列的经验似然拟合优度检验[D];南京大学;2011年
10 陈畅一;基于纵向数据的半参联合均值方差模型[D];华东师范大学;2011年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026