收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

对独立及相依数据的非参和半参模型的半参调整

王凯平  
【摘要】: 传统来讲,统计分析中的函数估计有两种方法,其一是参数方法,另一种是非参数方法. 非参数方法具有吸引人的灵活性,然而,在多变量情况下,由于维数问题的影响,其估计的函数不能达到合理的准确度。为避免维数问题的影响,人们开始越来越多的关注半参数方法,例如可加模型,部分线性模型等等。 在第1章中,我们简单介绍了一些基本的非参数和半参数模型。 对于非参数模型,最具代表性的就是核平滑,包括核密度估计与核回归估计。核回归估计又包括Nadaraya-Watson估计,Gasser-Muller估计和局部多项式估计。 对于半参数模型,我们介绍几种典型的形式,包括可加模型、部分线性模型、广义可加模型、广义部分线性模型以及广义部分线性可加模型。 一元随机变量的概率密度函数(简称为密度)的估计是统计学中的一个基本问题。令X_1,…,X_n为一列独立同分布的一元随机变量,其密度为f。我们可以通过参数方法(如最大似然估计)或非参数方法(如核密度估计)来估计f。 非参数模型具有很好的灵活性,然而,参数模型也有自己的优势,如,其结构容易被理解和接受。为结合这两种方法的优点,人们提出了一种半参数乘积调整方法(Hjort&Glad,1995,Hjort&Jones,1996,Naito,2004)。该方法首先使用一个参数密度估计g(x,(?)),将它作为真实密度f(x)的一个粗略的近似,这个参数估计再乘以一个调整因子ξ=ξ(x),该调整因子可以按照某些调整准则通过非参数方法来确定。Hjort&Glad(1995),Hjort&Jones(1996)以及Naito(2004)提出了几种不同的确定调整因子的准则。Hjort&Glad(1995)的准则是基于对ξ的一种简单估计;Hjort&Jones(1996)给出了两种调整准则:局部似然准则和局部L_2拟合准则;Naito(2004)提出了一种带有指数α的局部L_2拟合准则,该准则是最为一般的情况,其它几个准则都是其特例。理论比较表明,在非常大的一类密度中,该半参数密度估计要优于传统的核密度估计。 然而,以上所讨论的方法都是基于独立同分布的观测。该方法对相依数据的统计性质迄今为止还没有得到研究。而无论是在理论分析还是实际应用中,都需要对非线性时间序列建模、估计时间趋势、建立预测区间等等对于非线性时间序列的处理,这促使我们考虑该方法是否适用于相依数据的情况。 在第2章中,我们将这种半参数调整方法推广到时间序列的情况,给出了估计的渐近性质并做了有限样本模拟。我们发现,当观测数据满足一定的混合条件时,所得结果与独立样本时非常相似:偏差没有受到相依性的影响,而渐近方差(方差的主要部分)与独立情况下相同。然而,渐近方差的结果主要依赖于X_t之间的相依强度。令Z_t=K_h(X_t-x)g_0(X_t)~(1-α),则有(*)式右边的第一项就是独立情况下的方差,第二项是由X_t之间的相依性造成的额外可变性.相依强度就可以通过(?)Cov(z_1,z_(l+1))加以度量。对α混合过程,我们有如下的标准结果:所以有Var(?)_α(x)=1/ThR(K)f(x)+o(1/Th).然而,如果不满足一定的相依条件,(*)式右边的第二项就会非常大,达到可以超过第一项的程度,这会极大地影响到所得估计的收敛速度。 在第3章,我们研究的是关于时间序列数据的回归问题。假设观测到平稳序列(X_1,Y_1),…,(X_T,Y_T),感兴趣的问题是如何估计条件均值函数m(x)=E(Y|X=x).在独立同分布的情况下,Glad(1998)提出了一种新的估计回归函数的半参数方法,该方法首先给出一个参数回归,然后用一个局部多项式回归估计对此参数回归进行乘积调整。与标准的非参数回归估计相比,当所选的参数回归估计属于真实回归曲线的一个很大的邻域时,所得到的估计都可以有效的降低估计的偏差,而渐近方差不受影响。 本章中,我们证明了该半参数方法可以推广到混合相依数据,此时的数据可以服从ρ混合过程或α混合过程。尽管相依情况下的结果与独立时类似,但是证明过程却有很大差别。对于独立同分布的情况,可以通过关于设计阵X取条件期望得到偏差与方差的表达式,而对相依数据却不可以,如对于自回归模型,对X取条件期望相当于对整个序列来取,所以在推导渐近性质时需要采用不同的方法。本文中,我们通过推导估计的渐近正态性而得到其渐近偏差和渐近方差。 在第4章,我们提出了一种具有适应性的半参数方法来估计部分线性模型的非参数部分。要估计的部分线性模型的形式如下:Y_i=x_i~τβ+g(t_i)+ε_i,i=1,…,n其中,{x_i}和{t_i}分别为p维和一维解释变量,β为未知的p维参数向量,g(t)是一个未知的平滑函数,t∈(0.1],ε_1,…,ε_n独立同分布,其均值为0,方差为σ~2。不失一般性,假设设计点t_1,…,t_n满足0≤t_1t_2…t_n≤1。令(?)_n(t)为由通常的估计程序所得的g(t)的估计,在某些正则条件下,(?)_n(t)的均方误差为MSE((?)_n(t))=σ~2/nh+O(h~4)+o(n~(-1)h~(-1))+o(h~4).由上式可知,窗宽h的最优选择应与n~(-1/5)成比例,而当窗宽最优时,均方误差MSE((?)_n(t))的阶为n~(-4/5)。 注意到n~(-4/5)是非参数估计的标准收敛速度。然而,尽管我们并不知道g(t)的具体形式,我们仍然希望能够找到一种估计方法,使得所得到的g(t)的估计能够具有如下性质: 如果g(t)事实上是一个参数函数,那么所得到的估计应具有参数估计的收敛速度;否则,应该具有非参数估计的收敛速度。换句话说,估计方法应该适应于函数g(t)。 本章中我们将使用一种半参数调整技术来解决上述问题。该半参数调整技术最早用于改善密度估计(见Naito,2004,Hjort&Glad,1995和Hjort,&Jones,1996)。在该方法中,首先用一个参数模型作为g(t)的初始估计,该估计仅仅是一个粗略猜测,然后再乘以一个非参数因子进行调整。由此产生的估计能够达到令人满意的收敛速度,尤其当回归函数空间具有好的性质时,可以达到参数估计的收敛速度。此处所谓的好的性质是指要估计的函数充分的平滑或者就是在初始的参数模型类中。 值得注意的是,在我们的估计程序中,我们事先不需要知道函数g(t)的任何信息。新的估计的MSE的收敛速度一般为O(n~(-4/5))——这是非参数估计的最优收敛速度,最快能够达到O(n~(-1))——这是参数估计的最优收敛速度。因此,该估计具有适应性,即能够适应于所估计的函数而达到不同的收敛速度。 此外,为了确定调整因子,我们使用了类似于Hjort&Jones(1996)所使用的局部L_2拟合准则,然而为了从该准则得到调整因子的估计,Hjort&Jones的推导过程就不适用了。因为他们的方法是为了估计密度函数而提出的,此时可以通过期望的经验形式来得到调整因子,而在回归情况下却没有相应的经验形式,为此我们采用了一种积分逼近的方法来确定调整因子。 在本章中,我们也将此方法推广到了随机设计的情况。 在第5章,我们给出了倒向随机微分方程的生成元的估计方法。自Pardoux&Peng(1990)解决了一般情况下的存在唯一性之后,倒向随机微分方程(简称为BSDEs)的研究取得了迅猛发展,不管是在自身的发展方面还是在其它相关领域如随机控制、金融数学、随机对策以及经济管理等等,倒向随机微分方程都是一个强有力的工具。在倒向随机微分方程中,生成元起着非常重要的作用,而对于一般的倒向随机微分方程生成元的估计乃至其统计性质的分析,至今仍然存在空白。 我们考虑如下的一类具有马尔可夫性的正倒向随机微分方程(参见EL Karoui,Peng&Quenez,1997):假设在离散的时间点t_0…t_n,我们有观测数据{(X_(t_i),Y_(t_i)),i=0,…,n}。为简单起见,假设时间间隔相等,令△=t_(i+1)-t_i, 我们从具体实例和理论分析出发,提出了在很多情况下,倒向随机微分方程的生成元具有可加结构,而对于此可加结构,可以应用统计中经典的可加模型的处理方法。 可加模型的估计方法有很多,例如backfitting,边际积分估计,Horowitz&Mani-men的两阶段估计以及Lin,Cui&Zhu的具有适应性的两阶段估计。本章中,我们所用的方法类似于前面所提的具有适应性的两阶段估计,但是也有一些不同。第一个不同在于,为确定第二阶段的估计,我们采用了局部多项式拟合的方法,这是由于局部多项式具有许多优良的性质,这不同于Lin,Cui&Zhu(2006)所用的局部L_2拟合准则;另一个不同在于,对于倒向随机微分方程,我们观测到的是时间序列数据,而Lin,Cui&Zhu(2006)所提的方法是基于独立同分布的观测,所以在推导估计的渐近性质时,我们必须考虑相依性造成的影响。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孙海燕;测量平差函数模型的若干讨论[J];武汉大学学报(信息科学版);2003年S1期
2 何春;莫志良;;单参数指数模型在医药数据分析中的应用研究[J];中国卫生统计;2011年04期
3 成平;;关于半参数模型中自适应估计的几点注记[J];应用概率统计;1985年02期
4 丁士俊;姜卫平;;补偿最小二乘半参数模型解及估计量的统计性质[J];大地测量与地球动力学;2010年06期
5 陈文静;何刚;;电力消费及其影响因素:基于非参数模型的研究[J];系统工程理论与实践;2009年05期
6 陈文静;何刚;;石油消费及其影响因素:基于非参数模型的研究[J];管理工程学报;2009年04期
7 张日权;相依数据非参数核估计的收敛速度[J];苏州科技学院学报(自然科学版);2003年01期
8 段斌;梁军;费正顺;杨敏;胡斌;;基于GA-ANN的非线性半参数建模方法[J];浙江大学学报(工学版);2011年06期
9 李元;张兴发;;基于半参数ARCH-M模型的风险厌恶度量[J];广州大学学报(自然科学版);2008年03期
10 徐业基;最近邻密度估计的收敛速度[J];数学年刊A辑(中文版);1983年01期
11 孙燕;;经济转型时期我国城镇居民消费与收入的长期均衡关系[J];系统工程;2007年04期
12 刘秋霞;姜爱平;;近期我国城镇居民消费函数模型研究[J];消费导刊;2007年06期
13 孙春薇;王旭磊;辛永训;吴春妹;;几种关于时间序列季节调整方法的研究[J];青岛农业大学学报(自然科学版);2007年02期
14 潘雄;刘立龙;陈刚;田玉刚;;半参数平差模型估计量的精度评定[J];测绘工程;2008年06期
15 缪柏其;刀切最近邻密度估计的强收敛速度[J];应用数学学报;1985年02期
16 郑一华;;基于支持向量回归的国际贸易发展趋势的预测研究[J];科技资讯;2006年09期
17 赖德旺;张前勇;;测量平差函数模型的检验及精化[J];湖北民族学院学报(自然科学版);2009年03期
18 胡蓉;;多输出支持向量回归算法[J];华东交通大学学报;2007年01期
19 秦宏;序贯最近邻密度估计[J];应用数学学报;1989年04期
20 洪圣岩;近邻型密度估计的重对数律[J];数学学报;1990年01期
中国重要会议论文全文数据库 前10条
1 吴炎;杜栋;;改进BP神经网络及其对江苏省粮食产量的仿真预测[A];决策科学与评价——中国系统工程学会决策科学专业委员会第八届学术年会论文集[C];2009年
2 张玉峰;贾成刚;张文喜;;应用时间序列评估人工增雨效果[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年
3 王有良;周文国;;基于时间序列的基坑水平变形预测模型[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
4 王玉涛;程国辉;周建常;王师;;神经网络在高炉铁水硅含量预报中的应用[A];1998中国控制与决策学术年会论文集[C];1998年
5 王永忠;曾昭磐;;混沌时间序列点预测方法研究[A];1999中国控制与决策学术年会论文集[C];1999年
6 许伦辉;傅惠;徐建闽;;基于分形维数的交通流预测模型及算法研究[A];2003年中国智能自动化会议论文集(下册)[C];2003年
7 胡坤;刘思峰;;时间序列灰色定权聚类模型[A];2004年中国管理科学学术会议论文集[C];2004年
8 蒋斌松;韩立军;贺永年;;时间序列Lyapunov指数的估算及预测[A];矿山建设工程新进展——2005全国矿山建设学术会议文集(下册)[C];2005年
9 王波;张斌;;一种基于云模型的时间序列特征表示方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
10 何全军;曹静;张月维;;基于MODIS的广东省植被指数序列构建与应用[A];中国气象学会2007年年会生态气象业务建设与农业气象灾害预警分会场论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 王凯平;对独立及相依数据的非参和半参模型的半参调整[D];山东大学;2008年
2 杨正瓴;时间序列中的混沌判定、预报及其在电力系统中的应用[D];天津大学;2003年
3 张晓伟;水文动力系统自记忆特性及其应用研究[D];西安理工大学;2009年
4 倪丽萍;基于分形技术的金融数据分析方法研究[D];合肥工业大学;2010年
5 刘大同;基于Online SVR的在线时间序列预测方法及其应用研究[D];哈尔滨工业大学;2010年
6 张永林;车辆道路数值模拟与仿真研究[D];华中科技大学;2010年
7 崔亚强;沪深300股指内在复杂性分析及预测研究[D];天津大学;2010年
8 杨谈;网络混沌行为及其控制的研究[D];北京邮电大学;2009年
9 李星毅;基于相似性的交通流分析方法[D];北京交通大学;2010年
10 肖辉;时间序列的相似性查询与异常检测[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 姚婷;带有鞅差误差的半参数模型的推广性质和应用[D];南京大学;2013年
2 王芳;铁路客运量短期预测方法的研究[D];北京交通大学;2007年
3 王利兵;半参数模型的异方差检验[D];重庆理工大学;2013年
4 Ashraf Fetoh Eata;[D];厦门大学;2001年
5 王丽敏;两类模糊随机时间序列预测方法[D];河北大学;2001年
6 张雷;多层次分布式智能决策支持系统及应用研究[D];西北工业大学;2006年
7 王琦;时间序列在油田效益审计中的应用[D];吉林大学;2009年
8 王金翠;基于实测数据的风电场风速和风功率短期预测研究[D];东北电力大学;2010年
9 赵松雷;基于频谱仪的无线自动测试系统与信号特性分析[D];北京邮电大学;2010年
10 韩冬梅;基于P2P的教学信息资源负载均衡调度算法的研究[D];哈尔滨工程大学;2010年
中国重要报纸全文数据库 前10条
1 福建 张旭煌;彩电TA7681的AFC调整方法[N];电子报;2002年
2 湖南 段爱民;TCL 2101C彩电I^2C总线的调整方法[N];电子报;2000年
3 湖南 欧小立;三星CS-2166VX彩电I~2C总线调整方法与数据[N];电子报;2002年
4 重庆 叶兆利;创维21ND9000A彩电I~(2)C总线的调整方法[N];电子报;2004年
5 ;《时间序列与金融数据分析》[N];中国信息报;2004年
6 河南 赵理科;三星7277P彩电I~2C总线调整方法[N];电子报;2002年
7 南京 薛春波;十种熊猫I~(2)C总线彩电的调整方法[N];电子报;2005年
8 赵政红;调整方法 适应学平险营销新形势[N];中国保险报;2003年
9 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年
10 云南 洪贤林;创维数码系列彩电I~(2)C总线的调整方法[N];电子报;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978