收藏本站
《浙江财经大学》 2018年
收藏 | 手机打开
二维码
手机客户端打开本文

基于分位数的部分线性单指标可加模型的变量选择

冯秀珍  
【摘要】:半参数模型由于同时具有非参数模型的变通性和参数模型的可解释性,近年来,在统计学研究中日益流行。其中,部分线性可加模型(partial linear additive model,PLAM)是半参数模型中较为常见的一类模型,因此对该模型的研究也越来越多。另外,自分位数回归和变量选择方法提出以来,由于其估计的稳定性和优良的估计效率,得到了迅速的发展。分位数回归是从不同的角度分析数据,能够有效解决数据中存在的异方差问题,变量选择则是在模型稀疏假设下,寻找系数有显著效应的变量。所以,本文将分位数回归和变量选择应用到部分线性可加模型当中,用来分析各个因素对医疗费用数据的影响,并适当的提出建议及解决方案。对医疗费用数据的研究一直以来是卫生医疗行业研究的重点,医疗费用关乎最基本的民生问题,对其进行研究也是保障社会医疗体系公平的重要举措。实际中,由于医疗数据的不完整性以及其自身的复杂相关性,使得对它的研究存在一定的困难。医疗费用数据通常具有严重右偏,异方差,非正态等特点,通常情况下,收集到的医疗费用数据具有一定的稀疏性,所以传统的模型和方法不再适用该类数据。本文提出用部分线性单指标可加模型对医疗费用数据进行建模,再结合分位数回归和变量选择的方法对其进行分析,可以有效地解决医疗费用数据中存在的异方差性和稀疏性等问题。在对医疗费用数据的分析中,本文分为两部分对其进行分位数回归以及变量选择的分析,具体如下:第一部分:本文提出了用最小化平均分位数损失估计的方法来实现部分线性单指标可加模型的分位数回归,首先提出基于核函数构造参数部分的分位数回归意义下的相合估计以及非参数的渐近估计,在此相合估计和渐近估计的基础上,采用局部多项式回归通过迭代的方式进一步得到另一参数和非参数函数的估计,该估计可达最优收敛速率。第二部分:基于第一部分分位数回归该部分进一步地提出对部分线性单指标可加模型进行变量选择,模型采用自适应LASSO惩罚项进行系数压缩,算法则是采用最小角回归算法(LARS),并且证明了自适应LASSO惩罚项变量选择的Oracle性质,Oracle性质主要包含两个方面,一是变量选择的相合性,即当样本量n趋于无穷时,选择出真实模型的概率趋近于1,二是参数估计结果具有渐近正态性。另外,本文对上述所提方法和模型给出了相应的数值模拟以及渐近性质,一方面,从估计结果来看,通过模拟实验发现文中给出的估计方法都具有良好的性质,分位数回归方法得到了良好的估计结果,同时得出自适应LASSO的变量选择方法对于处理稀疏性变量数据具有一定的优越性。另一方面,从计算效率来看,分位数回归方法中的局部多项式求解最终转化为对相关线性模型的求解问题,极大的提高了运算效率。实例分析部分,我们提出将部分线性单指标可加模型运用到慢性心力衰竭(CHF)患者的临床医疗研究中,该数据记录了患者每次到医院就医的情况,研究对象年龄都超过60岁,通过对该数据分位数变量选择我们发现非患病服务情况在各个分位水平下效果都十分显著,种族因素也随着分位水平的提高影响效果逐渐显著,年龄和死亡情况在一定分为水平下有影响效果,而性别和追踪时间在任何分位数水平下对医疗费用基本没有影响。综上所述,本文提出将分位数回归和变量选择的方法应用于部分线性单指标可加模型中能够有效的对医疗费用数据进行统计分析。
【学位授予单位】:浙江财经大学
【学位级别】:硕士
【学位授予年份】:2018
【分类号】:O212.7

【相似文献】
中国期刊全文数据库 前10条
1 陈淙洁;朱仲义;;广义单指标模型的方差成分检验[J];复旦学报(自然科学版);2011年01期
2 党安荣;;单指标专题要素图解分级方法试验研究[J];陕西师大学报(自然科学版);1990年01期
3 汤光华;一种综合评价新方法──单指标排序综合法[J];山西统计;1997年07期
4 林江;建立单指标群制作天气预报的探讨[J];贵州气象;1999年05期
5 刘锋;乔静然;李飞;;部分线性单指标模型的序列相关性检验[J];重庆理工大学学报(自然科学);2012年03期
6 张雨;夏传笑;曾林蕊;;变系数单指标模型的B-样条估计(英文)[J];应用概率统计;2013年04期
7 张霞峰;朱仲义;;单指标回归模型的若干检验问题[J];高校应用数学学报A辑;2007年04期
8 薛留根;;单指标模型的统计推断[J];数理统计与管理;2012年01期
9 陈培德;n指标过程投影理论及其应用[J];应用数学学报;1993年01期
10 邹清明;朱仲义;;部分线性单指标模型的两步M-估计的大样本性质[J];应用数学学报;2014年02期
中国重要会议论文全文数据库 前9条
1 林艺圃;;中国股市价量关系的实证分析分位数回归模型[A];中国社会科学院第三届中国经济论坛论文集(下)[C];2007年
2 陈娟;林龙;叶阿忠;;基于分位数回归的中国居民消费研究[A];中国社会科学院第三届中国经济论坛论文集(下)[C];2007年
3 夏宁;;中国上市公司高管人员薪酬的影响因素与成因分解——一个基于分位数回归模型的实证研究[A];中国会计学会财务管理专业委员会2009年学术年会论文集[C];2009年
4 宋马林;吴杰;高玉强;张琳玲;宋峰;;中国入世以来的对外贸易与环保效率——基于分省面板数据的实证分析[A];中国贸易救济与产业安全论丛(2012)——第七届中国贸易救济与产业安全研究奖获奖论文集[C];2013年
5 张俊华;方伟武;;调查表分析中变量选择的一些方法(英文)[A];中国运筹学会第六届学术交流会论文集(下卷)[C];2000年
6 唐古生;柳敏;龚胜蓝;程辉;王健民;;CD66c单指标在B-ALL微小残留病灶中诊断性能研究[A];第一次全国中西医结合检验医学学术会议暨中国中西医结合学会检验医学专业委员会成立大会论文汇编[C];2014年
7 李洪东;梁逸曾;;高维数据变量选择新方法研究[A];中国化学会第27届学术年会第15分会场摘要集[C];2010年
8 武新乾;田铮;田萍;;一类部分线性自回归模型中的样条估计[A];中国现场统计研究会第12届学术年会论文集[C];2005年
9 任声策;;创新和出口的互动关系:基于中国制造业企业的实证[A];第八届(2013)中国管理学年会——技术与创新管理分会场论文集[C];2013年
中国博士学位论文全文数据库 前10条
1 齐芯;几类数据下部分线性单指标模型的统计推断[D];吉林大学;2016年
2 李蔚郁;若干单指标模型的统计推断[D];山东大学;2017年
3 邹清明;单指标模型的几个统计推断问题的研究[D];华东师范大学;2008年
4 李婷婷;半变系数模型和单指标模型的相关研究[D];重庆大学;2012年
5 康宁;分位数回归模型及在金融经济中的应用[D];合肥工业大学;2016年
6 刘惠篮;基于复合分位数回归方法的统计模型的相关研究[D];重庆大学;2016年
7 Muhammad Amin;高维惩罚分位数回归建模及其应用[D];大连理工大学;2015年
8 杨丰凯;基于偏拉普拉斯分布的若干分位数回归模型的统计推断[D];山东大学;2017年
9 王娜;面板数据分位数回归模型求解及应用研究[D];山东大学;2017年
10 韩月丽;极值统计与分位数回归理论及其应用[D];天津大学;2009年
中国硕士学位论文全文数据库 前10条
1 冯秀珍;基于分位数的部分线性单指标可加模型的变量选择[D];浙江财经大学;2018年
2 赵玉环;纵向数据下部分线性单指标模型的若干问题研究[D];兰州理工大学;2017年
3 金波;基于经验似然的单指标模型的统计诊断[D];南京理工大学;2015年
4 张超;基于Lasso方法的部分线性单指标模型的变量选择[D];西安建筑科技大学;2016年
5 曹明;变系数单指标模型理论研究[D];深圳大学;2016年
6 乔静然;单指标模型的诊断技术[D];重庆理工大学;2012年
7 李治寰;基于函数型时间序列数据的单指标模型条件密度估计的相合性[D];合肥工业大学;2012年
8 王武;部分线性单指标模型变量选择问题的研究[D];复旦大学;2011年
9 陈淙洁;广义单指标混合模型的方差成分检验[D];复旦大学;2009年
10 张霞峰;单指标模型的异方差检验[D];华东师范大学;2005年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026