收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

缺失数据模型的估计与变量选择

丁先文  
【摘要】:缺失数据的统计分析一直都是统计学研究的热点课题.当数据的缺失机制为随机缺失时,已有很多统计方法可处理和分析这类缺失数据.然而,在实际应用中,常常遇到不可忽略缺失数据.这样,基于随机缺失的统计分析方法将不再适用于处理不可忽略缺失数据.同时,在计量经济学、生物医学和社会学等领域常常遇见大量的高维不可忽略缺失数据,如何处理和分析这类数据尚未见有报道,因此该课题值得研究.本文在不可忽略缺失数据下,研究了超高维分位数回归模型的估计与变量选择问题,并研究了响应变量的分布函数和分位数的估计问题以及非线性回归模型的经验似然推断问题.同时,在随机缺失数据下,研究了乘性回归模型的估计与变量选择问题.具体地,本文的主要研究工作概括如下.1.研究了响应变量不可忽略缺失下超高维分位数回归模型的惩罚估计问题.通过运用惩罚函数SCAD和MCP,提出了基于逆概率加权的惩罚分位数回归估计方法.在倾向得分函数存在稀疏性的情况下,提出了估计倾向得分函数的两步方法:第一步通过构造Pearson卡方检验统计量筛选倾向得分函数中的重要变量;第二步通过运用调整经验似然方法估计筛选后的倾向得分函数中的未知参数.在一些正则条件下,证明了参数估计量的Oracle性质.模拟计算和实例分析验证了所提出方法的有效性和可行性.2.研究了带有不可忽略缺失数据的分布函数和分位数的估计问题.首先,在倾向得分模型为指数倾斜模型的情况下,提出了估计模型参数的调整经验似然方法.该方法的一个显著优点是能够保证校准条件中倾斜参数解的存在性.进一步地,在响应变量不可忽略缺失下,提出了估计响应变量的分布函数和分位数的三种方法:逆概率加权方法、回归插补方法和增广的逆概率加权方法.其次,在一些正则条件下,证明了三个估计量的渐近性质,并得到了一个重要的理论结果:这三个估计量具有相同的渐近方差.同时,提出了估计渐近方差的刀切法.最后,模拟计算和实例分析验证了所提出方法的有效性和可行性.3.研究了响应变量不可忽略缺失下非线性回归模型的经验似然推断问题.在倾向得分模型为全参数模型的情况下,提出了估计倾向得分模型中未知参数的半参数经验似然方法.在倾向得分模型存在稀疏性的情况下,提出了同时估计模型参数和选择稀疏变量的惩罚半参数经验似然方法.在一些正则条件下,证明了稀疏估计量的Oracle性质.进一步地,在响应变量不可忽略缺失下,构造了基于逆概率加权和增广的逆概率加权的两类估计方程,并在一定的正则条件下证明了经验似然估计量的相合性和渐近正态性.同时,在一定的正则条件下,研究了经验对数似然比函数的渐近分布.研究表明:当倾向得分模型中的参数已知时,经验对数似然比函数的渐近分布为标准卡方分布;当倾向得分模型中的参数未知且采用半参数经验似然方法或惩罚的半参数经验似然方法进行估计时,经验对数似然比函数的渐近分布为加权卡方分布.模拟研究和实例分析验证了方法的有效性和可行性.4.研究了协变量随机缺失下乘性回归模型的变量选择问题.为了避免由缺失数据引起的估计偏差,基于相对误差准则提出了逆概率加权目标函数.通过对该目标函数加上自适应的Lasso惩罚项,研究了乘性回归模型参数的压缩估计问题,并在倾向得分模型存在稀疏性的情况下,证明了当协变量维数为固定维或发散维时参数估计量的Oracle性质.同时,给出了计算参数估计的一种有效的快速的算法.模拟研究验证了方法的有效性.本文研究了缺失数据模型的估计与变量选择问题,将完全数据的统计分析方法推广到了缺失数据情形,为缺失数据分析提供了理论和方法支持,具有广泛的应用前景.


知网文化
【相似文献】
中国期刊全文数据库 前17条
1 康春花;孙金玲;孙小坚;曾平飞;;缺失数据比率和处理方法对非随机缺失数据能力参数估计准确性的影响[J];江西师范大学学报(自然科学版);2017年03期
2 董学思;林丽娟;赵杨;魏永越;戴俊程;陈峰;;多组学联合缺失数据填补方法的评价[J];中国卫生统计;2017年04期
3 杨金英;崔朝杰;;图模型方法用于二值变量相关性分析中缺失数据的估计[J];中国卫生统计;2012年05期
4 许凯;何道江;;有缺失数据的条件独立正态母体中参数的最优同变估计[J];数学学报(中文版);2016年06期
5 王军;李建勋;韩山;王兴;;一种效能评估中缺失数据的填充方法[J];上海交通大学学报;2017年02期
6 吴洁琼;吕小纳;党志军;;网络高并发信息的缺失数据修复方法仿真[J];信息通信;2017年11期
7 喻成林;黄强;李钢;;观测站缺失数据修复的神经网络模型研究[J];矿山测量;2014年01期
8 帅平;李晓松;周晓华;刘玉萍;;缺失数据统计处理方法的研究进展[J];中国卫生统计;2013年01期
9 张伟;冯萍;赵永红;袁佳英;李梅;;加权估计方程用于缺失数据的处理[J];中国卫生统计;2013年03期
10 詹棠森;;缺失数据调整修正优化磨光法研究及陶瓷中的应用[J];中国陶瓷;2012年06期
11 刘海军;柳征;姜文利;周一宇;;基于缺失数据填补的辐射源识别方法[J];宇航学报;2010年05期
12 庞新生;;缺失数据处理方法的比较[J];统计与决策;2010年24期
13 李开灿;黄学维;;有缺失数据的正态母体参数的后验分布及其抽样算法[J];应用数学学报;2009年02期
14 苏毅娟;钟智;;代价敏感的缺失数据有序填充算法[J];计算机工程;2009年17期
15 金勇进;处理缺失数据中辅助信息的利用[J];统计研究;1998年01期
16 肖庆宪,李俊德;市场预测中的缺失数据问题[J];河南师范大学学报(自然科学版);1994年03期
17 李保东;亢金轩;;结构方程建模缺失数据填补方法研究[J];统计与咨询;2011年01期
中国重要会议论文全文数据库 前10条
1 印明辉;秦婷婷;伏振;严明明;尹平;;贝叶斯累加回归树模型处理缺失数据研究[A];2017年中国卫生统计学学术年会论文集[C];2017年
2 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
3 刘红云;;追踪研究中非随机缺失数据的处理:基于模型的方法及其应用[A];第十五届全国心理学学术会议论文摘要集[C];2012年
4 管河山;姜青山;Steven X.Wei;;一种处理缺失数据的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 肖悦;刘红云;;密集型追踪数据中数据的缺失机制及缺失比例对时变效应模型估计精度的影响[A];第二十届全国心理学学术会议--心理学与国民心理健康摘要集[C];2017年
6 孙金玲;;混合测验中非随机缺失数据的缺失比率与处理方法对IRT参数估计的影响[A];第十八届全国心理学学术会议摘要集——心理学与社会发展[C];2015年
7 李晓煦;侯杰泰;;结构方程中缺失数据的处理:FIML,EM与MI[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年
8 周晓东;汤银才;费鹤良;;定数转换步加试验缺失数据场合下的参数估计[A];中国现场统计研究会第十三届学术年会论文集[C];2007年
9 叶素静;唐文清;张敏强;;追踪研究中缺失数据的处理方法述评[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
10 雷蕾;吴乃君;刘鹏;刘兰娟;;灵敏度分析:分类器中的缺失数据[A];第11届海峡两岸信息管理发展策略研讨会论文集[C];2005年
中国博士学位论文全文数据库 前10条
1 丁先文;缺失数据模型的估计与变量选择[D];云南大学;2018年
2 高航;面向缺失数据的机器学习算法研究[D];国防科学技术大学;2016年
3 唐琳;带有不可忽略缺失数据的广义半参数非线性模型的统计推断[D];云南大学;2017年
4 龚奇源;面向数据发布的数据匿名技术研究[D];东南大学;2016年
5 陆福忠;数据缺失下的分布函数估计问题[D];复旦大学;2007年
6 骆汝九;多指标综合评价的非参数方法和缺失数据的聚类方法研究[D];扬州大学;2011年
7 郭东林;缺失数据下几类回归模型的估计方法与理论[D];北京工业大学;2017年
8 马友;基于QoS缺失数据预测的个性化Web服务推荐方法研究[D];北京邮电大学;2015年
9 罗显贵;带缺失数据列联表与半参数非线性动态因子模型的统计推断[D];云南大学;2015年
10 祝丽萍;几种缺失数据和高维数据模型的统计分析[D];山东大学;2012年
中国硕士学位论文全文数据库 前10条
1 许天歌;缺失数据下的P2P借贷违约风险评价方法研究[D];合肥工业大学;2019年
2 宋雅婷;缺失数据处理方法及其在临床试验中的应用[D];华中科技大学;2019年
3 石章波;缺失数据下众数线性模型的统计诊断[D];云南大学;2018年
4 陈婉娇;缺失数据插补方法及其在医学领域的应用研究[D];华南理工大学;2019年
5 王玉梅;缺失数据下基于众数回归两类半参数模型估计与变量选择[D];兰州理工大学;2019年
6 仝倩;带缺失数据的半参数非线性模型基于经验似然的统计诊断[D];南京理工大学;2018年
7 张文佳;缺失数据下变系数部分非线性模型的参数估计[D];南京理工大学;2018年
8 李佳妮;缺失数据统计方法及其敏感性的研究[D];哈尔滨工业大学;2018年
9 杜丽媛;含有缺失和不可适用数据的古生物谱系树构建方法研究[D];西北大学;2018年
10 陈琨;边坡自动化监测数据缺失填补算法研究[D];重庆交通大学;2018年
中国重要报纸全文数据库 前1条
1 刘若帆宋林;诗邦金A6+1:凭借其质提高其量[N];农资导报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978