收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

变系数模型变量选择的稳健方法

赵为华  
【摘要】:变系数模型是一类非常重要的非参数回归模型,由于它考虑了指标变量与协变量之间的交互效应,与常规的线性模型相比具有更强的适应性和建模能力,不仅避免了“维数祸根”问题,而且具有适应性和解释性强的特点。同时,变系数模型可以拓展出其他许多有用的模型,如部分变系数模型、部分线性模型,可加模型以及部分可加模型等,并且在计量经济、生物统计和社会科学中有着广泛的应用,它已成为处理多元非参数、半参数回归问题的有力工具。 目前,关于变系数及部分变系数模型的估计和变量选择方法大多基于最小二乘或似然函数方法。然而,当数据中含有异常值或存在明显的异方差等情形,此时基于最小二乘的估计和变量选择方法将不再具有优良性,稳健性较差且估计效率大大下降。在这种情况下,可以从不同角度寻找多种稳健的估计和变量选择方法。本文对变系数及部分变系数模型稳健的估计和变量选择方法展开若干研究,主要工作和结论如下: (1)基于核光滑方法和自适应LASSO惩罚,在分位数框架下为变系数模型提供了一种新的变量选择方法,拓展了Wang和Xia(2009)的KLASSO方法,同时证明了所构造的QKLASSO方法具有变量选择的相合性,且变系数函数的估计量达到了相同光滑条件下的最优收敛速度。数值模拟和实际数据分析进一步验证了其有限样本性质。 (2)基于核光滑方法和双重自适应LASSO型惩罚,在分位数框架下构造了变系数模型变量选择的统一方法,即在没有任何关于变量的先验信息下,提出的方法不仅能选择出重要的变量,而且可以区分出系数为变系数效应和常数效应的变量。在适当的条件下,证明了惩罚估计量在重要变量选择方面和常系数、变系数效应的区分上都是相合的,同时,得到的变系数函数估计量达到了相同光滑条件下的最优收敛速度。数值模拟和实例分析进一步验证了所提方法的有限样本性质。 (3)借鉴众数回归估计思想(Yao等,2012),利用局部多项式逼近方法研究了部分变系数模型的稳健估计,基于回切技术的两步估计方法,分别得到了参数分量和非参数分量的最优估计,并证明了所得的估计量达到了各自最优的收敛速度。基于EM算法,给出了估计算法的实施步骤。此外,我们在获得变系数函数估计的基础上,利用惩罚函数的正则化估计方法研究了参数部分的变量选择问题,证明了惩罚估计的Oracle性质。大量的数值模拟分析和实例应用都验证了所提方法的不仅具有稳健性而且具有有效性。 (4)基于B-样条逼近技术和双重自适应SCAD惩罚,在众数回归框架下研究了部分变系数模型参数部分和非参数部分同时变量选择问题,证明了所得的惩罚估计量在参数分量选择方面和非参数分量选择方面都是相合的,同时得到的估计量均达到了相同光滑条件下各自的最优收敛速度。大量的数值模拟和实例分析均表明所构造的估计量非常稳定且与其他方法相比具有很强的竞争性。 (5)在分位数回归框架下,我们探讨了具有分类属性效应变系数模型的模型识别和变量选择问题。基于自适应LASSO和自适应Fused LASSO双惩罚,提出了重要属性水平的选择和不同属性之间识别的正则化估计方法,证明了所构造的方法具有模型选择的相合性。大量的数值模拟和实例分析进一步证实了所提方法的优良性质。 (6)基于层次LASSO型惩罚,为分位数回归构造了组间和组内重要变量的同时选择方法,并证明了层次LASSO方法具有组间变量选择的相合性,但是不能保证组内变量选择的相合性。为此,我们进一步基于自适应层次LASSO方法研究了组间和组内重要变量的同时选择,在变量个数是发散维的情形下,证明了组间和组内变量选择结果同时具有Oracle'性质。随机模拟和实例分析进一步证实了理论性质。 本文的创新之处在于:一、在分位数回归下,利用核光滑方法研究了变系数模型重要变量的选择以及变量选择的统一方法,进一步丰富了变系数模型的变量选择方法;二、在众数回归框架下,首次研究了部分变系数模型的稳健估计和变量选择问题,所提到方法不受异常值点的影响,具有很好的稳健性,为变系数模型提供了一个简单、稳健和有效的估计和变量选择方法;三、在分位数框架下,探讨了组间和组内重要变量的同时选择问题,并提出了具有分类属性效应变系数模型的模型识别和变量选择方法。 本文的结论和方法丰富了变系数模型以及部分变系数模型的稳健估计和变量选择方法,将有助于计量经济、生物统计等各个领域中重要变量的选取,达到精简模型、提高预测精度的目的。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 孙道德;再论线性模型自变元选择的BIC方法相容性条件[J];高校应用数学学报A辑(中文版);1995年01期
2 戴伯新;;回归变量选择中的数据诊断[J];应用概率统计;1992年04期
3 张大仁,赵立新;遗传算法对QSAR研究中变量选择的应用[J];环境化学;2000年03期
4 严于鲜;;层次分析法在线性回归方程中的应用[J];四川理工学院学报(自然科学版);2006年05期
5 罗英姿,张洁洋;用人工神经网络研究地方经济指标[J];河南广播电视大学学报;2005年02期
6 杨璐,高自友;用神经网络进行变量选择[J];北方交通大学学报;1999年03期
7 王今,韩文秀;财务危机预警中财务比率的选择研究[J];数学的实践与认识;2003年08期
8 韩敏,林云,孙燕楠,齐东海;基于神经网络的建筑行业投标报价研究[J];系统工程学报;2003年04期
9 陈战波;耿志林;杨珂玲;;城市日用水量预测的部分线性自回归模型[J];武汉工业学院学报;2009年02期
10 温忠麟;回归变量的一种选择方法及其应用[J];云南教育学院学报;1994年05期
11 张小亚;申琦;;基因表达式编程在环氧酶抑制剂定量构效关系中的应用[J];计算机与应用化学;2009年10期
12 杨宜平;薛留根;;高维部分线性模型的变量选择和估计(英文)[J];应用概率统计;2011年02期
13 田益祥;GMDH建模中变量选择的方法研究[J];安康师专学报;2001年04期
14 周一星,陈彦光;城市地理研究的几个基本问题[J];经济地理;2004年03期
15 孙道德;;随机回归模型选择的简单方法及其相合性[J];应用数学;2006年01期
16 徐慧;;资本结构的变量选择[J];沿海企业与科技;2006年11期
17 赵培信;;带有缺失数据线性回归模型的变量选择[J];河池学院学报;2009年02期
18 张海;王尧;常象宇;徐宗本;;L_(1/2)正则化[J];中国科学:信息科学;2010年03期
19 王占锋;吴耀华;赵林城;;删失回归模型中一个LASSO型变量选择和估计方法(英文)[J];应用概率统计;2010年01期
20 钟登华,刘豹,张世英,张维;非线性计量经济建模变量选择[J];天津大学学报;1993年03期
中国重要会议论文全文数据库 前10条
1 胡军华;蒋志刚;;环境变量选择与尺度变化对物种适宜栖息地模拟的影响:以普氏原羚为例[A];四川省动物学会第九次会员代表大会暨第十届学术研讨会论文集[C];2011年
2 李洪东;梁逸曾;;高维数据变量选择新方法研究[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
3 李慷;席裕庚;;带有输出反馈的多变量控制系统中变量的选择[A];1994中国控制与决策学术年会论文集[C];1994年
4 刁宁;张永清;;改进蚁群算法在麻痹性贝毒素的QSAR中变量选择的研究[A];第五届全国环境化学大会摘要集[C];2009年
5 韩敏;林云;;用神经网络的方法进行投标报价中的变量选择[A];第二十届中国控制会议论文集(下)[C];2001年
6 黄蓉;乔园园;;指示向量选择法在QSAR研究中的应用[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
7 张俊华;方伟武;;调查表数据分析中变量选择和判别分析的一些方法及简单比较[A];面向复杂系统的管理理论与信息系统技术学术会议专辑[C];2000年
8 张永清;费红琳;丁凯;;修正CP_EA-PLS用于多环芳烃光解半衰期QSAR的研究[A];第九届全国计算(机)化学学术会议论文摘要集[C];2007年
9 梁逸曾;李洪东;许青松;曹东升;张志敏;;灰色化学建模与模型集群分析——兼论过拟合、稳健估计、变量选择与模型评价[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
10 刘咸姝;潘日芳;;满意控制结构综合的专家系统[A];1996年中国智能自动化学术会议论文集(上册)[C];1996年
中国博士学位论文全文数据库 前10条
1 赵为华;变系数模型变量选择的稳健方法[D];华东师范大学;2013年
2 王明秋;高维数据下若干回归模型的变量选择问题研究[D];大连理工大学;2012年
3 盖玉洁;若干高维模型变量选择和模型重建问题的研究[D];山东大学;2011年
4 任允文;基于处罚经验似然和跳惩罚最小二乘的变量选择[D];复旦大学;2010年
5 李腾飞;似然自适应惩罚变量选择方法研究[D];复旦大学;2012年
6 王树云;基于Bayes方法和图限制下正规化方法的变量选择问题及其在基因组数据中的应用[D];山东大学;2010年
7 陈雪蓉;复杂数据下分位数回归建模及其应用[D];云南大学;2012年
8 陶凤梅;对应分析的数学模型[D];吉林大学;2005年
9 章文军;小波变换和神经网络在化学中的应用[D];中国科学院研究生院(长春应用化学研究所);2001年
10 刘旭;在完全和缺失数据下基于非光滑估计方程的统计推断与变量选择问题[D];云南大学;2010年
中国硕士学位论文全文数据库 前10条
1 肖金花;函数系数部分线性模型的变量选择[D];湖南师范大学;2012年
2 李玲玲;高维线性模型的变量选择[D];广西师范大学;2010年
3 闫闯;多元回归模型中变量选择问题研究[D];黑龙江大学;2011年
4 鞠思秋;半参数变系数部分线性模型的变量选择方法[D];华东师范大学;2012年
5 刘存银;基于修正经验似然的变量选择方法及其应用研究[D];华东理工大学;2011年
6 梁爱;半参数变系数部分线性测量误差模型的变量选择[D];华东师范大学;2011年
7 满敬銮;生存数据模型的变量选择[D];中南大学;2009年
8 唐琥珀;单纯形分布模型变量选择及其应用研究[D];贵州财经大学;2013年
9 周玮;变量选择中的LARS算法及其在国民经济中的应用[D];山东大学;2011年
10 王琴;DNA微阵列数据的变量选择方法研究[D];中南大学;2011年
中国重要报纸全文数据库 前5条
1 葛新权 北京信息科技大学经济管理学院;经济统计模型的建模原则与创新[N];中国社会科学报;2010年
2 海通股指期货联合研究中心 李子婧;基于BIRR模型的宏观因子套利策略[N];期货日报;2010年
3 范超;浅谈如何备战统计建模大赛[N];中国信息报;2011年
4 中研博峰咨询有限公司咨询顾问 高荣霞;六步骤锁定细分市场[N];通信产业报;2009年
5 本报记者 马薪婷;光大保德信基金公司董事长林昌:打造综合性资产管理公司[N];证券日报;2009年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978