收藏本站
《山东大学》 2010年
收藏 | 手机打开
二维码
手机客户端打开本文

非参和半参回归模型的稳健和截面推断

李锋  
【摘要】: 在识别响应变量和预测变量的回归结构问题中,非参和半参回归模型因其良好的灵活性和(或)较好的可解释能力已经得到了深入的研究和广泛的应用。半参模型中部分线性模型是为一类常用的模型,它既保持了非参数模型的灵活性同时有具有参数模型良好的可解释性,特别的它还有效的避免了纯非参回归的“维数灾难”问题(curse of dimcnsionality)。近年来,在实际的医疗数据分析中,协变调整模型和变量选择问题已成为热点问题,引起了人们的极大关注。然而,非参回归模型中,普通核估计方法对窗宽选择敏感并且收敛速度也不尽如人意;协变调整的部分线性模型未有研究;如Fan和Li(2004)指出的部分线性模型的变量选择问题也少有研究。本篇论文中我们就针对这些非参和半参回归模型的相关问题进行研究。具体的,本篇论文的基本思想如下。 已有的研究成果表明非参回归函数的普通核估计量可以近似的表示为,从上面的表达式我们发现了一种新的回归关系,r(χ)可以看做(?)hj(x)对hj回归的截距项,因此我们可以重构线性回归模型并通过加权最小二乘法得到r(χ)的估计。新的估计量结构简单并且尽管不使用高阶核仍然具有较小的均方误差。结果如下,最优窗宽的阶数为O(n-1/9)。进而我们发现虽然采用的窗宽hj不是最优的,但在满足条件hj=O(n-α)且有1/10α1/5成立时,新估计量(?)(χ)仍具有比普通核估计量更小的均方误差。由此说明新估计量对窗宽选择稳健。此外,在一些正则条件下,我们还得到了新估计量的渐近正态性,因此,论文第二章中通过联合非参回归和参数回归提出的两步估计(三步估计)能够就窗宽选择和收敛速度的意义上改进非参数估计。更一般的,我们的方法可以推广到一般的非参估计以及非参数回归模型,例如我们还把此方法推广到了多元非参回归模型,可加模型。 受Senturk and Muller (2005)提出的协变量调整回归(covariatc-adjusted regres-sion (CAR))问题和另一实际问题(在研究钙缺乏的问题中,需要研究钙吸收量和钙摄取量之间的关系,同时还要考虑体征指标(body mass index)和年龄因素的影响)的启发,在第三章我们介绍并深入研究了协变量调整部分线性模型(covariate-adjusted partially linear models (CAPLM)),其中真实的响应变量Y和预测向量X是观测不到的,我们只能观测到它们被乘子φ(U)和φr(U)污染以后的变量(?)和(?),同时还考虑了时间T的影响。虽然我们的模型看起来像是Senturk (2006)提出的协变调整变系数模型(covariate-adjusted varying coefficient models (CAVCM))的特例,但实际上CAPLM和CAVCM所处理数据的类型有着本质的不同。在某一固定观测时刻有来自多个个体的观测是Senturk (2006)第一步估计方法的关键,而我们所研究的数据在固定观测时刻则可能仅有一个观测。因此,两种模型的推断方法是不同的。如Cui et al (2008)指出,由此我们可以给出(?)(U)和φ(U)的非参估计,并近似恢复真实的不可观测的Y和X。接下来,用恢复的数据来替换不可观测的真实数据,通过截面最小二乘法可以给出参数β的估计。并且,在一些温和的条件下我们还得到了参数估计量的渐近正态性,细节可参看3.3节。此外,我们还给出了回归系数的置信域。 随着科技的发展,人们获取和存储高维数据集(即变量的个数p相当或者远大于样本容量n)变得更加方便。变量选择在高维数据分析中发挥着至关重要的作用,Dantzig selector是线性和广义线性模型变量选择方法中的一种。在第四章我们将研究部分线性模型的Dantzig selector变量选择问题,它的定义如下,其中(?)和(?)分别为中心化的设计阵和中心化的响应观测矩阵。我们得到了Dantzig selector的大样本性质。即n趋于无穷,p固定时,在合适的条件下有(?),其中β0为优化问题的解。我们还注意到Dantzig selector并不一定是相合的。为了克服此不足,我们采用Dicker和Lin(手稿)提出的adaptive Dantzig selector变量选择方法.部分线性模型adaptive Dantzig selector定义为, 进而,我们得到在合适的条件下部分线性模型adaptive Dantzig selector参数估计量具有oracle性质.即n趋于无穷,p固定时,在特定条件下有adaptive Dantzig selector估计量是模型相合的,并且有Adaptive Dantzig selector作为Dantzig selector的一般形式,它们都可以采用James et al. (2009)提出的DASSO算法来解决最优化问题。文章还讨论了调整参数和窗宽的选择方法。 综上所述,本篇论文进一步研究了非参和半参回归模型的相关问题。首先,对非参回归模型,我们提出了一种稳健的纠偏估计方法,新的两步(三步)估计量对窗宽选择稳健,并且不用高阶核就具有比普通核估计更快的收敛速度,均方误差阶数为O(n-8/9)。其次,我们研究了协变量调整的部分线性模型,给出了模型的推断方法,并且得到了参数部分估计量的渐近正态性和置信域。最后我们研究了高维部分线性模型的变量选择和参数估计问题。当样本容量n趋于无穷,变量个数p固定时我们研究了Dantzig selector参数估计量的大样本性质,并得到了adaptive Dantzig selector参数估计量的oracle性质。 模拟实验和实际数据的应用进一步阐释了文中介绍的各种方法。
【学位授予单位】:山东大学
【学位级别】:博士
【学位授予年份】:2010
【分类号】:O212.1

【参考文献】
中国期刊全文数据库 前1条
1 高集体,陈希孺,赵林城;部分线性模型中估计的渐近正态性[J];数学学报;1994年02期
【共引文献】
中国期刊全文数据库 前10条
1 薛留根,田萍;固定设计下半参数回归模型中的随机加权逼近[J];北京工业大学学报;2004年02期
2 李志强;薛留根;;协变量随机缺失的广义半参数模型[J];北京工业大学学报;2007年07期
3 赵俊龙;赵秀丽;;利用样条函数建立季节性时间序列的预测模型[J];北京理工大学学报;2007年04期
4 赵选民,刘丙杰;随机截断下部分线性模型中参数估计的渐近性质[J];纯粹数学与应用数学;2003年02期
5 周兴才;胡舒合;;NA样本半参数回归模型估计的矩相合性[J];纯粹数学与应用数学;2010年02期
6 赵治栋;陈裕泉;;广义小波收缩消噪阈值选择及应用研究[J];传感技术学报;2007年03期
7 陶华学,刘国林;顾及多因素影响的变形监测数据处理[J];测绘学报;1993年03期
8 吴富梅;杨元喜;;基于小波阈值消噪自适应滤波的GPS/INS组合导航[J];测绘学报;2007年02期
9 胡伍生;孙璐;;基于神经网络方法的模型误差补偿(英文)[J];Journal of Southeast University(English Edition);2009年03期
10 赵德勇;王正明;;卫星联合定轨的参数化融合模型[J];电子学报;2008年12期
中国重要会议论文全文数据库 前2条
1 ;The GCV Method in Optimal B-spline Surface Fairness[A];第二十九届中国控制会议论文集[C];2010年
2 ;Estimation of Semiparametric Model with Censored Data[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
中国博士学位论文全文数据库 前10条
1 毛虎平;基于仿真模型的动态响应优化算法研究[D];华中科技大学;2011年
2 张日权;函数系数和部分线性模型中的估计问题[D];华东师范大学;2003年
3 曾林蕊;半参数广义线性模型若干问题的研究[D];华东师范大学;2004年
4 彭小令;变量选择方法及其在量化的构效关系(QSPR)中的应用[D];四川大学;2005年
5 丁士俊;测量数据的建模与半参数估计[D];武汉大学;2005年
6 潘雄;半参数模型的估计理论及其应用[D];武汉大学;2005年
7 胡宏昌;半参数模型的估计方法及其应用[D];武汉大学;2004年
8 成忠;PLSR用于化学化工建模的几个关键问题的研究[D];浙江大学;2005年
9 孙勇杰;相对论重离子实验中的MRPC/TOF研制[D];中国科学技术大学;2006年
10 王四春;GP技术及应用研究[D];中南大学;2006年
中国硕士学位论文全文数据库 前10条
1 周荣旺;SCAD方法的调整参数选择[D];大连理工大学;2010年
2 伍琪琳;边坡变形监测数据的小波降噪和粗糙惩罚平滑[D];浙江大学;2011年
3 杨泉;基于GCV正则化维纳滤波的地震信号去噪研究[D];吉林大学;2011年
4 朱琳琳;m-相依误差下非线性半参数模型的经验似然推断[D];辽宁师范大学;2011年
5 陈中威;删失场合回归模型的若干问题研究[D];解放军信息工程大学;2010年
6 刘立芳;基于半参数方法的西曲江新区商品住宅特征价格研究[D];西安建筑科技大学;2011年
7 李蓉一;基于核主元分析的故障检测与诊断研究[D];南京师范大学;2011年
8 刘新乐;缺失纵向数据下半参数回归模型的分析研究[D];昆明理工大学;2010年
9 岳超;基因表达谱数据聚类分析方法比较与大豆疫霉基因的网络构建[D];南京农业大学;2011年
10 肖兵;一列非线性模型的LS估计及非线性度量[D];湖南大学;2002年
【相似文献】
中国期刊全文数据库 前10条
1 朱力行,安鸿志;一种回归模型非线性性的检验方法[J];数学杂志;1992年04期
2 薛留根,廖靖宇;删失数据下一类回归模型的参数估计(英文)[J];工程数学学报;2005年04期
3 涂汉生;;回归函数导数的非参数估计[J];西南交通大学学报;1993年01期
4 欧阳光;变系数回归模型的参数估计[J];湘南学院学报;2005年02期
5 刘永强;;我国居民储蓄和投资总额对GDP的实证分析[J];商场现代化;2006年17期
6 彭伟;陈圣滔;;回归模型中异方差的检验方法[J];钦州学院学报;2007年06期
7 张良勇;宋向东;董晓芳;郭照庄;;非参回归函数递归核估计的相合性[J];沧州师范专科学校学报;2006年04期
8 周玲;误差为NA序列的回归模型估计的r阶矩相合性[J];合肥工业大学学报(自然科学版);2005年04期
9 洪圣岩,成平;半参数回归模型参数估计的收敛速度[J];应用概率统计;1994年01期
10 胡舒合;一类新的半参数回归模型中的相合估计[J];数学学报;1997年04期
中国重要会议论文全文数据库 前10条
1 王宝书;;支持向量机方法在预报白山流域夏季定量降水中的应用[A];第26届中国气象学会年会灾害天气事件的预警、预报及防灾减灾分会场论文集[C];2009年
2 蔡成静;王海光;安虎;史延春;黄文江;马占鸿;;小麦条锈病高光谱遥感监测技术研究[A];中国植物病理学第七届青年学术讨论会论文集[C];2005年
3 王雪荣;董威;;中国上市公司机构投资者对公司绩效影响的实证分析新论[A];第三届(2008)中国管理学年会论文集[C];2008年
4 孟超;秦俊;胡永红;;单株截顶香樟树冠生物量及其分配格局[A];中国观赏园艺研究进展(2010)[C];2010年
5 王继民;彭波;孟涛;;基于搜索引擎日志发现相近Web查询[A];2005年信息与通信领域博士后学术会议论文集[C];2005年
6 武锡环;朱珊珊;;影响学生数学成绩的人格因素[A];全国高师会数学教育研究会2006年学术年会论文集[C];2006年
7 杨杰;陈平志;陈尧隆;;库区滑坡体变形监测与安全性态分析评价[A];中国岩石力学与工程实例第一届学术会议论文集[C];2007年
8 钱仲威;;1990~2000年中国粮食产量预测[A];管理科学与系统科学进展——全国青年管理科学与系统科学论文集(第4卷)[C];1997年
9 刘跃;张道伟;;重庆市信息化与电子商务发展水平的实证研究[A];信息经济学与电子商务:第十三届中国信息经济学会学术年会论文集[C];2008年
10 陈飞;戈若愚;左仁广;罗庆;;长大下坡路段重型车辆刹车毂温度预测模型研究[A];自主创新与持续增长第十一届中国科协年会论文集(3)[C];2009年
中国重要报纸全文数据库 前10条
1 龙博;DCE大豆、豆粕期价的数理统计和回归模型[N];期货日报;2005年
2 吴一福;我国建成人动脉血pH值与地理因素回归模型[N];中国医药报;2007年
3 龙博;DCE玉米与相关商品比价关系的实证研究[N];期货日报;2005年
4 通讯员 支勇平记者 韩富斌;我省粉壳蛋鸡选育生产技术获突破[N];陕西日报;2008年
5 平安期货研究部 侯书锋;β值在股指期货投资中的应用[N];证券时报;2007年
6 ;陕西 粉壳蛋鸡选育生产技术通过成果鉴定[N];中国畜牧兽医报;2008年
7 国泰君安证券 蒋瑛琨 彭艳 博士 国泰君安期货研究负责人 马忠强;期指到期日效应实证成果综述及经典实证检验方法[N];期货日报;2007年
8 姚新;龙之利爪[N];计算机世界;2001年
9 广发证券 杨景辉 章早立;全流通背景下的长江电力价值中枢[N];中国证券报;2005年
10 国都证券 姚小军 童冬雷 张生;特殊情形下封闭式基金的选择[N];证券日报;2007年
中国博士学位论文全文数据库 前10条
1 李锋;非参和半参回归模型的稳健和截面推断[D];山东大学;2010年
2 盖玉洁;若干高维模型变量选择和模型重建问题的研究[D];山东大学;2011年
3 赵培信;半参数变系数部分线性模型的统计推断[D];北京工业大学;2010年
4 孟瑞锋;基于不同超声信号变换的食品溶液浓度检测研究[D];浙江大学;2012年
5 刘锋;部分线性模型的序列相关检验与异方差检验[D];中南大学;2006年
6 施三支;部分线性模型中的广义似然比检验[D];吉林大学;2007年
7 申琦;定量结构活性相关性研究中的新型化学计量学算法研究[D];湖南大学;2005年
8 徐涛;零频数过多资料的统计学模型应用研究[D];北京协和医学院;2011年
9 陈永伟;似无关回归模型及其应用研究[D];华中科技大学;2008年
10 程靖;随机系数回归模型的最优设计[D];上海师范大学;2010年
中国硕士学位论文全文数据库 前10条
1 倪伟才;半参数回归模型的相合性[D];浙江大学;2002年
2 肖金花;函数系数部分线性模型的变量选择[D];湖南师范大学;2012年
3 张凌云;缺失数据下函数系数部分线性模型的估计[D];湖南师范大学;2012年
4 白美利;部分线性回归模型的估计[D];西北大学;2010年
5 王晓荣;复杂抽样下的截取回归模型在医学研究中的应用[D];山西医科大学;2010年
6 王稳;我国中小企业的生存与发展[D];天津大学;2003年
7 金永强;BP神经网络在大坝观测数据处理中的应用[D];合肥工业大学;2005年
8 王学江;垃圾堆肥及其复合肥对小麦、玉米生物与环境效应的影响[D];首都师范大学;2005年
9 段振颖;变系数部分线性模型的参数估计与统计诊断[D];湖南大学;2010年
10 李毅;转基因抗虫杂交棉高产高效栽培模型的研究[D];湖南农业大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026