收藏本站
收藏 | 论文排版

若干复杂数据模型的经验似然和复合推断方法

周小双  
【摘要】:作为一种非参数统计方法,经验似然自Oweb(1988)年提出以来已经得到越来越多的关注.它已经广泛用于构造兴趣参数和光滑函数的置信区域.许多文献表明相比于正态逼近方法,经验似然方法有许多的优势.比如,由经验似然构造的置信区域其形状完全由数据决定,而且还具有域保持性和变换不变性.如今,作为一种重要的非参数统计方法,经验似然已经成为非常有用的统计推断工具.许多学者已经把它应用到线性模型,非参模型及半参模型中.在许多的应用领域,比如工农业生产、社会调查、经济学、生物医学和流行病学等领域,常常遇到纵向数据、测量误差数据,缺失数据等复杂数据.如何处理这些复杂数据进而进行有效的统计推断已经成为当今统计界的研究热点之一.因此:研究复杂数据下的半参数模型的统计推断有着一定的理论意义和实用价值.本学位论文创新点之一是应用经验似然方法研究复杂数据下半参数模型的统计推断,进而丰富经验似然方法的应用领域. 近年来,半参数模型由于其灵活性和可解释性得到了很好的研究及广泛的应用.在半参数模型中,变系数部分线性模型和可加部分线性模型是两类常用的模型,这两类模型既能够有效地避免了非参数模型的维数灾难问题,又都具有线性模型的可解释能力.基于此,在本学位论文的第二章我们把经验似然方法应用到纵向数据下半参数可加部分线性测量误差模型的估计问题中.我们在第三章考虑响应变量缺失时纵向数据下半参数变系数部分线性测量误差模型的经验似然推断. 纵向数据下可加部分线性测量误差模型具有下面的形式:其中Yij是第i个个体响应变量Y的第j次观测值,Xij是第i个个体协变量x∈RP的第j次观测值,Zij=(Zij1,...ZijD)T是第i个个体协变量Z∈RD的第j次观测值,f1,...,fD是未知函数,β=(β1,...,βp)T是p-维的未知参数向量,εij是随机误差,满足在给定Xij和Zij条件下均值为零.Uij是均值为零的测量误差,满足E(Uij)=0和Cov(Uij)=∑uu,并且与(Xij,Zij,Yij)独立.为简单起见,我们研究D=2的情况.为保证非参函数的可识别性,假设E{f1(Z1)}=E{f2(Z2)}=0,同时假设X和Y已中心化.创新点是通过对衰减的修正(correction-for-attenuation),我们得到了未知参数β基于纠衰(corrected-attenuation)下的辅助随机变量作为其估计函数,然后定义相应的基于纠衰的分块经验似然比函数,证明了相应统计量极限分布是标准卡方分布,因此基于该统计量可以得到未知参数的置信区域.模拟结果表明:通过比较置信区域的覆盖概率和平均长度,我们提出的方法要优于Liang,Thurston,Duppert,Apanasovich和Hauser(2008)提出的截面最小二乘方法.基于参数β的分块经验似然比统计量,得出其极大经验似然估计β,进而得到非参函数修正的后拟(backfitting)估计.因此,对非参函数我们又给出了其残差调整的经验对数似然比统计量.并证明它仍具有非参的Wilks定理.值得一提的是在对非参函数f1(z1)进行推断时并不需要精确估计非参函数f2(z2)在任意点的值,只需知道f2(z2)修正的后拟估计在样本观测点处的值即可. 类似第二章的思想,在第三章研究纵向数据下响应变量缺失时半参数变系数部分线性测量误差模型的经验似然推断,假定观测数据{Yij,Zij,Uij,Wij,δij,i=1,...,n,j=1,...,nj}为来自下述模型的一个不完全随机样本.其中Yij是响应变量第i个个体第j次观测值,Zij,Xij和Uij是协变量第i个个体第j次观测值.β=(β1,...,βp)T是p-维未知参数向量,α(·)=(α1(·),...,αq(·))T是q-维未知的函数系数向量,εij是第i个个体中第j次观测的误差.满足条件E(εij|Xij,Zij,Uij)=0,var(εij|Xij,Zij,Uij)=(σ2.E(Vij)=0和Cov(Vij)=Σuv.另外,协变量Xij,Zij和Uij可以完全观测.并且当δij=1时,Yij可以观测,δij=0时Yij缺失.我们首先构造未知参数的纠衰的分块经验对数似然比统计量,然后证明提出的统计量其极限分布为一卡方分布.基于这一理论,我们得到参数分量β的置信区域.模拟结果表明,通过比较置信区域的覆盖率和平均长度这两个方面,我们提出的经验似然方法要优于最小二乘方法. 分位数回归作为一种稳健的估计方法,在数量经济学,社会科学以及生物医药等各个领域中都有广泛的应用:分位数回归方法的优点是它对误差的二阶矩没有要求;它的不足之处在于分位数回归估计的效率有时会很低.Zou和Yuan(2008)在线性模型的背景下提出一种新的参数估计方法,称之为复合分位数回归(composite quantile regression,CQR)方法;复合分位数回归方法一方面继承了分位数回归方法的稳健性,另一方面显著地改进了分位数回归估计的效率.复合分位数回归方法假设不同的分位数水平对预测变量的影响相同,差别仅在截距项.与经典的最小二乘方法相比,复合分位数回归估计对异常值不敏感,具有稳健性,并且在大多数情况下能够显著地改进最小二乘估计的效率.本学位论文创新点之二是:将经验似然方法与复合分位数回归方法结合,构造线性回归模型中未知参数的置信域,考虑下述线性模型:其中β=(β1,…,βp)T∈Rp是未知的回归系数向量.记0τ1τ2…τq1,bτ是ε的100τ%分位数.我们首先构造了未知参数β的两种形式的估计方程,一是基于复合分位数回归方法所得的估计方程Zil(β),一是基于逐个分位数所得的β的估计方程Zi2(β).进而构造了相应的经验似然比统计量以及极大经验似然估计,并且证明了经验似然比统计量渐近分布均为标准卡方分布.为获得高阶精确度,用光滑函数逼近分位数得分函数中示性函数,提出了光滑的经验似然方法,给出了相对应的两种光滑形式的估计方程,进而构造了光滑的经验似然比统计量Zi1h(β)和Zi2h(β),证明了相应的经验似然比统计量分布为标准卡方分布,此外,类似于Wang和Zhu(2011),证明了在一定条件下,通过Bartlett纠偏,我们提出的光滑经验似然置信域可以降为较小的收敛误差. 在第五章我们考虑·般的非参数回归模型其中Y是响应变量,T是与ε独立的一维协变量,m(T)=E(Y|T)是光滑的非参数回归函数,标准差函数σ(T)恒正.假定E(ε)=0,var(ε)=1对于上述模型,有许多估计方法可以选择.例如核估计方法,样条方法,傅里叶级数展开法和局部多项式方法;这些方法求出的估计都是线性光滑器.特别地,局部多项式方法在Fan和Gijbels(1996)的专著中有详细的介绍并在实际中得到了广泛的应用.假没{(ti,yi),i=1,...,n}是来自上述模型的一个独立同分布的随机样本,我们感兴趣的不是光滑函数m(·)本身而是它的导数m,(·)的估计,第五章主要通过复合的方法导出了m,(·)的有效估计,这也是本学位论文的又一创新点.一种复合方式是损失函数的加权局部二次复合其中ρτκ(z)=τκz-zI(z≤0),k=1,...,q为在第q个分位数位置的分位数损失函数,并且ωk≥0,k=1,...,q,∑kq=1ωk=1为权重.则m'(to)的加权局部二次复合分位数回归估计(WCQR)可以表示为m'WCQR(t0)=b1我们得出了m'WCQR(t0)的渐近偏差,渐近方差和渐近正态性.另一种复合形式是估计量的加权复合,对固定的τk,0τk1,考虑如下的局部二次非参数分位数回归:易知上述优化问题中b1的解,记作m'(τk,t0),是m'(t0)的一个估计.对于不同的τk=k/(q(?)1),k1,2,...,q,基于m'(τk,t0)的加权平均给出m(t0)的一个估计,称之为加权的分位数平均估计(WQAE),即有m'WQAE(t0)=∑k=1qωkm'(τk,t0)其中ω=(ω1,ω2,...,ωq)T为权重向量,满足条件∑kq=1ωk=1和∑kq=1xkF1(τk)=0.并且我们求得mWQAE(t0)的渐近偏差,渐近方差和渐近正态性.数值模拟表明我们提出的两种复合形式的估计在渐近相对效率方面要优于局部二次最小二乘估计.


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 东宇,秦永松;有附加信息下φ-混合样本的M-估计及分位数估计的渐进性质[J];四川大学学报(自然科学版);2005年04期
2 杨维珍;陈波;李剑君;;区间约束数据条件分位数估计的大样本性质[J];凯里学院学报;2010年03期
3 秦永松;条件分位数和条件密度的经验似然置信区间[J];数学年刊A辑(中文版);1999年03期
4 王伯成,李朝阳;高阶中心矩的经验似然比区间估计[J];工科数学;1996年03期
5 钱永江;秦永松;;缺失数据下均值的经验似然置信区间[J];统计与决策;2009年15期
6 张军舰;φ混合样本下的经验似然估计[J];广西师范大学学报(自然科学版);2001年01期
7 崔恒建,袁修久;附加信息下的p分位数光滑经验似然置信区间[J];系统科学与数学;2001年02期
8 郑明;杜玮;;含有截断和缺失数据的经验似然推断(英文)[J];应用概率统计;2008年04期
9 姜波;秦永松;;相依样本下密度函数经验似然置信区间[J];安徽工业大学学报(自然科学版);2006年03期
10 贺飞燕;;普通似然及经验似然情况下的结点问题[J];价值工程;2006年08期
11 朱复康;王德辉;李凤翔;李涵;;一个整值ARCH(p)模型的经验似然推断[J];吉林大学学报(理学版);2008年06期
12 于培超;孟昭为;;基于经验似然方法的Value-at-Risk估计[J];重庆理工大学学报(自然科学版);2010年08期
13 王雅丽;王小飞;;经验似然在正态分布中的应用[J];廊坊师范学院学报(自然科学版);2011年02期
14 王学丽;含附加信息下局部线性模型的估计及收敛性[J];滨州师专学报;1999年02期
15 秦永松,苏淳;条件分位数的经验似然置信区间[J];数学年刊A辑(中文版);2000年02期
16 王启华,Wolfgang Hardle;核实数据帮助下误差在反映线性模型经验似然降维推断[J];中国科学A辑;2004年05期
17 齐化富;王炜;;随机设计下部分线性模型经验欧氏似然比置信域[J];港航论坛;2007年01期
18 齐化富;王炜;;随机设计下部分线性模型经验欧氏似然比置信域[J];桂林航天工业高等专科学校学报;2008年01期
19 庞伟才;韦程东;;同模型下数据缺失时线性回归模型反应变量均值的经验似然置信区间[J];广西科学;2009年01期
20 周彦;王国长;;基于经验似然的拟合优度检验及应用题[J];哈尔滨理工大学学报;2010年01期
中国重要会议论文全文数据库 前10条
1 陈娟;林龙;叶阿忠;;基于分位数回归的中国居民消费研究[A];中国社会科学院第三届中国经济论坛论文集(下)[C];2007年
2 孙志猛;张忠占;;随机右删失数据下线性变换模型的经验似然推断[A];北京市第十五次统计科学讨论会获奖论文集[C];2009年
3 林艺圃;;中国股市价量关系的实证分析分位数回归模型[A];中国社会科学院第三届中国经济论坛论文集(下)[C];2007年
4 易当祥;刘春和;王肇赢;封艳文;;电子设备加速寿命试验优化设计方法研究[A];中国电子学会可靠性分会第十四届学术年会论文选[C];2008年
5 李竹渝;;非参数统计方法对收入分布的解释[A];加入WTO和中国科技与可持续发展——挑战与机遇、责任和对策(上册)[C];2002年
6 翟宇梅;赵瑞星;肖仁春;钱尧;王力维;;用K近邻非参数回归技术作淮河流域降水预报试验[A];新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“03.7淮河大水的水文气象学问题”分会论文集[C];2003年
7 杨珍;王慧;;引入支路流量的非参数回归交通流短时预测[A];2007第三届中国智能交通年会论文集[C];2007年
8 刘小平;黎夏;张啸虎;;一种新的基于多标记分解模型的遥感软分类方法[A];中国地理学会百年庆典学术论文摘要集[C];2009年
9 吴硕思;黄建新;;人民币基准利率的AGARCH非参数模型[A];发展的信息技术对管理的挑战——99’管理科学学术会议专辑(下)[C];1999年
10 钟静;何丽燕;何庆秋;;流动人口肺结核流行因素分析[A];新发和再发传染病防治热点研讨会论文集[C];2009年
中国博士学位论文全文数据库 前10条
1 周小双;若干复杂数据模型的经验似然和复合推断方法[D];山东大学;2013年
2 陈雪蓉;复杂数据下分位数回归建模及其应用[D];云南大学;2012年
3 李周平;经验似然方法的若干应用[D];兰州大学;2010年
4 李红梅;居民收入的分位数回归与反事实因素分解[D];首都经济贸易大学;2012年
5 关静;分位数回归理论及其应用[D];天津大学;2009年
6 韩月丽;极值统计与分位数回归理论及其应用[D];天津大学;2009年
7 林路;相依数据的若干统计模型及分析[D];南开大学;2001年
8 梁薇;右删失数据与经验似然方法[D];北京大学;2011年
9 陈黎;不等式约束下的经验似然推断[D];云南大学;2012年
10 解其昌;分位数回归方法及其在金融市场风险价值预测中的应用[D];西南财经大学;2012年
中国硕士学位论文全文数据库 前10条
1 刘昕明;两类非参数分位数回归模型的研究[D];北京化工大学;2013年
2 张晓丹;分位数回归及其在糖尿病治疗中的应用[D];天津大学;2010年
3 郝亦朗;分位数回归与金融风险研究[D];首都经济贸易大学;2011年
4 张广梅;分位数回归在房地产行业的应用[D];温州大学;2013年
5 李振鹏;基于分位数回归模型的中国股市风险测量研究[D];东北财经大学;2010年
6 张明宇;分位数回归在金融风险管理中的应用[D];长春工业大学;2011年
7 李士民;基于分位数回归的中国居民消费[D];长春工业大学;2012年
8 庄桂敏;加权组合分位数回归[D];大连理工大学;2013年
9 唐丽;基于经验似然的部分线性变系数模型的统计诊断[D];南京理工大学;2013年
10 刘倩;生长曲线模型的分位数回归[D];华东师范大学;2013年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978