收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

含指标项半参数回归模型的分位数回归与变量选择

吕亚召  
【摘要】:含指标项的半参数模型是高维半参数统计模型中一类非常重要的模型,主要包括单指标模型,部分线性单指标模型,单指标变系数模型和变系数单指标模型等。这类模型的的一个重要特征是将高维协变量通过降维技术转化为一元的指标变量(Index),可以有效地避免了“维数祸根(Curse of Dimensionality)"问题,在保持良好的可解释性的同时,又具有非参数建模的弹性,可以有效地揭示响应变量和高维协变量之间的关系。由于含指标项的半参数模型具有上述优点,此类模型的统计分析问题仍是当前统计界研究的重点和热点。 现有的关于此类模型的估计方法大多关注其均值回归,基于最小二乘方法和似然方法以及剖面似然方法。这些方法对于异常点非常敏感,误差偏离正态分布时,估计效率大大下降。相对于均值回归只描述响应变量的平均水平,Koenker and Basset [29]提出的分位数回归可以对响应变量的分布给出更好的描述,提供更有价值的信息,并且可以有效避免离群点的影响。鉴于分位数回归的估计效率受到特定的分位数取值的影响,Zou and Yuan [72]提出综合多处分位数回归估计的信息的复合分位数回归,有效克服了单个分位数回归效率下降的缺陷。复合分位数回归己被证实可以克服非正态误差的干扰并显著提高估计效率。 关于含指标项半参数模型的分位数回归和复合分位数回归的研究已经有了初步的研究。其中Wu et al.[55]考虑了单指标模型的分位数回归,Jiang et al.[23]考虑了单指标模型的复合分位数回归估计问题,Jiang et al.[24]提出了一个两步估计方法实现了单指标模型的复合分位数回归。对于含指标项半参数模型中的其他两个模型的分位数回归,至今尚没有文献记载。本文着重研究了此类模型中单指标模型,部分线性单指标模型以及单指标变系数模型的分位数回归、复合分位数回归的估计问题及其中的变量选择问题。本文的研究工作填补了当前含指标项半参数模型的分位数回归、复合分位数回归及变量选择问题研究的空白。 首先考虑单指标模型(Single-index Model, SIM),形式为 Y=g(XTθ)+ε,其中Y∈R为响应变量,X=(X1,…,Xp)T∈Rp为协变量,£为模型误差,g(·)为未知的指标函数,也称为联系函数,θ=(θ1,…,θp)T∈Rp为未知的指标参数,为模型的可识别性,设||θ||=1且θ10。 我们提出了一个新的估计方法实现SIM的分位数回归和复合分位数回归,证明了算法的收敛性,得出了可达最优收敛素的估计量,建立了所得估计量的渐近性质,并比较了复合分位数回归估计相应于最小二乘估计的相对渐进效率。进一步地,通过结合所提估计方法和Zou[71]中的自适应LASSO方法,我们提出了两个变量选择方法分别用于单指标模型的分位数回归及复合分位数回归估计中指标协变量的变量选择问题,并建立了所提变量选择方法的Oracle性质。数值模拟和实例分析进一步证实了所提方法的优良性质。 其次我们考虑了部分线性单指标模型(Partial linear single-index model, PLSIM)的分位数回归和复合分位数回归。部分线性单指标模型的标准形式为 Y=g(XTθ)+ZTβ+θZ=(Z1,…,Zd)T∈Rd为协变量,β为未知的线性参数,其他条件同上述的单指标模型。关于单指标部分线性模型的分位数回归尚无文献记载。关于单指标部分线性模型的分位数回归,我们提出了最小平均分位数损失估计的方法,在避免半参数模型中为达到参数最优收敛素的而对非参数函数进行“欠拟合”估计的同时得出了模型参数(θ,β)和未知非参数函数g(·)的最优收敛速度的分位数回归估计,建立了所得估计量的渐近性质。进一步地,通过结合MACLE方法和自适应LASSO方法,实现了部分线性单指标模型的分位数回归的变量选择问题,建立了模型选择的Oracle性质。鉴于单个分位点的分位数回归的效率会随分位点的取值波动,只捕捉了响应变量单个分位点的性质,结合多处分位点的信息可以得出参数和非参数函数的更为有效的估计,我们考虑了PLSIM的复合分位数回归。我们将MACLE方法推广至刂PLSIM的复合分位数回归中,提出了复合最小化平均分位数损失估计的方法,实现部分线性单指标模型的复合分位数回归估计,得出了未知知参数和未知函数的可达最优收敛速度的估计量。我们证明了所提算法的收敛性,建立了所得估计量的渐近性质,并深入比较了所得估计量相对于最小二乘估计的相对渐近效率。进一步地,我们考虑了PLSIM的复合分位数回归的变量选择问题,建立了变量选择方法的Oracle性质。数据模拟和实例分析证实了我们的理论结果。 最后我们考虑了单指标系数模型(Single-Index Coefficient Model,SICM)的分位数回归和复合分位数回归及变量选择问题。单指标系数模型形式如下: Y=g(XTθ)TZ+θZ=(Z0,…,Zd-1)T∈Rd为协变量,g(·)=(90(·),g1(·),…,gd-1(·))T为未知的系数函数,其他条件同上述单指标模型。不失一般性,可设Z0=1。关于单指标系数模型的分位数回归还未见有文献记载。我们将上面所提的最小化平均分位数损失估计方法和复合最小化平均分位数损失估计方法推广SICM中,得出了可达最优收敛速度的估计,证明了算法的收敛性,建立了所得估计量的渐近性质,特别地对于SICM的复合分位数回归,我们比较了所得估计量相对于Lu et al.[36]提出的剖面似然估计的相对渐近效率。此外我们考虑了SICM的分位数和复合分位数回归的变量选择问题,并建立了所提变量选择方法的Oracle性质。随机模拟和实例分析进一步证实了我们所提估计方法和变量选择方法的有效性。


知网文化
【相似文献】
中国期刊全文数据库 前15条
1 王江荣;袁维红;赵睿;任泰明;;基于贝叶斯复合分位数回归的参数估计及应用[J];工业仪表与自动化装置;2016年05期
2 刘昕明;李志强;;复合分位数下的国债利率期限结构研究[J];北京化工大学学报(自然科学版);2013年03期
3 吕亚召;张日权;赵为华;刘吉彩;;部分线性单指标模型的复合分位数回归及变量选择[J];中国科学:数学;2014年12期
4 袁晓惠;赵雪冬;;缺失数据下基于经验似然的加权复合分位数回归推断[J];吉林大学学报(理学版);2016年05期
5 肖桂姣;;分位数回归下的指标设计与实现[J];当代经济;2019年02期
6 周少甫;范兆媛;;年龄对医疗费用增长的影响:基于分位数回归模型的分析[J];中国卫生经济;2016年06期
7 陈子亮;卿清;;影响波士顿不同社区房价水平的因素分析——基于分位数回归方法[J];商;2015年30期
8 施鹏;;分位数回归对资产定价模型的比较分析[J];商业故事;2016年34期
9 吴卫星;魏晓璇;吴锟;;金融素养与金融满意度[J];金融科学;2017年01期
10 李涛;王健俊;;国产电影票房绩效的影响因素研究——基于分位数回归及门限效应的分析[J];文化产业研究;2017年02期
11 姜励卿;钱文荣;;公共部门与非公共部门工资差异的分位数回归分析[J];统计研究;2012年01期
12 朱平芳;张征宇;;无条件分位数回归:文献综述与应用实例[J];统计研究;2012年03期
13 吴建南;马伟;;分位数回归与显著加权分析技术的比较研究[J];统计与决策;2006年07期
14 谭治国;蔡乙萍;;分位数回归在风险管理中的应用[J];统计与决策;2006年17期
15 季莘,陈峰,吴先萍;用百分位数回归制订正常人群血压参考值的研究[J];数理医药学杂志;1999年04期
中国重要会议论文全文数据库 前7条
1 夏宁;;中国上市公司高管人员薪酬的影响因素与成因分解——一个基于分位数回归模型的实证研究[A];中国会计学会财务管理专业委员会2009年学术年会论文集[C];2009年
2 李坤明;;空间滞后分位数回归模型的截面估计法[A];21世纪数量经济学(第18卷)[C];2017年
3 朱高培;吴学森;;基于分位数回归制定HbA1c的医学参考值范围[A];2017年中国卫生统计学学术年会论文集[C];2017年
4 张晗希;许志梦;曾澄波;蔡卫平;郭艳;;基于分位数回归模型探索社会支持对HIV/AIDS患者应对方式的影响[A];2017年中国卫生统计学学术年会论文集[C];2017年
5 陈磊;;股灾期间沪深300股指期货的量价关系——基于联立方程和分位数回归的实证研究[A];21世纪数量经济学(第17卷)[C];2016年
6 李唐;李飞;;民航客机最佳燃油携带量推荐[A];第八届中国航空学会青年科技论坛论文集[C];2018年
7 姚欲清;邢星;吕冰;闵捷;;应用分位数回归分析中国成年居民蛋白质摄入量与体质指数及腰围的关系[A];达能营养中心青年科学工作者论坛优秀论文集2017年第5期[C];2017年
中国博士学位论文全文数据库 前6条
1 吕亚召;含指标项半参数回归模型的分位数回归与变量选择[D];华东师范大学;2013年
2 刘惠篮;基于复合分位数回归方法的统计模型的相关研究[D];重庆大学;2016年
3 周小英;逐段连续线性分位数回归模型的统计推断及其应用[D];湖南大学;2018年
4 蔡超;基于大规模数据的分位数回归方法及应用[D];合肥工业大学;2017年
5 黄振生;含指标项半参数回归模型的估计与检验[D];华东师范大学;2010年
6 周小双;若干复杂数据模型的经验似然和复合推断方法[D];山东大学;2013年
中国硕士学位论文全文数据库 前10条
1 史建波;复合分位数回归及其在时间序列上的应用[D];鲁东大学;2015年
2 杨雅兰;电力市场短期电价预测算法及应用研究[D];华北电力大学(北京);2018年
3 开璇;基于多重共线性的修正方法下分位数回归方法的应用[D];新疆财经大学;2017年
4 丁翰煜;基于近似贝叶斯的分位数回归VaR模型[D];苏州大学;2018年
5 刘凌辉;两种分位数回归及实证研究[D];东北师范大学;2018年
6 李海燕;基于数据挖掘与非线性分位数回归的风电功率概率密度预测方法[D];合肥工业大学;2018年
7 杨航;有序纵向数据下的贝叶斯分位数回归方法[D];中国科学技术大学;2018年
8 胡中立;中印金融发展对收入不平等影响效应的比较研究[D];山西财经大学;2018年
9 苗亭亭;中国城乡居民收入差距影响因素研究[D];山西财经大学;2018年
10 王玉丹;基于分位数回归方法的人力资本减贫效应研究[D];山西财经大学;2018年
中国重要报纸全文数据库 前3条
1 曹雪峰;技术指标参数的设置[N];财经时报;2000年
2 北京首证 云清泉;巧改指标参数[N];财经时报;2001年
3 本报记者 王莉;行业标准缺位 指标参数乱象多[N];政府采购信息报;2015年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978