收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

缺失数据下几类回归模型的估计方法与理论

郭东林  
【摘要】:在实际问题中常常会遇到缺失数据和测量误差数据.已有的处理完全观测数据的统计理论和方法将不再适用,因此需要寻求新的方法来对这些数据进行统计分析.逆概率加权方法和借补方法是分析缺失数据最常用的方法.但是当选择概率被错误指定时,两种方法得到的估计量会有很大的偏差.因此,本论文的主要研究目的是:在缺失数据和测量误差数据下,研究线性回归模型、非线性回归模型以及部分线性模型中兴趣参数的估计问题.具体地,本文的研究内容有以下几个方面.对响应变量随机缺失下线性回归模型,首先基于协变量平衡倾向得分以及广义矩方法得到了选择概率的估计;然后借助于此估计并利用逆概率加权借补最小二乘方法和经验似然方法,构造了模型中回归系数和响应变量均值的估计.在适当的条件下,证明了所得估计量的渐近性质.通过模拟研究比较了基于协变量平衡倾向得分方法和基于广义线性模型方法得到的估计量的有限样本表现.对响应变量随机缺失下非线性回归模型,首先基于协变量平衡倾向得分和经验似然方法得到了选择概率中未知参数的估计量,然后利用逆概率加权借补方法,分别构造了模型中回归系数和响应均值的估计,证明了它们的渐近性质.通过数值模拟研究说明了所构造的估计量的可行性和有效性.对响应变量随机缺失下部分线性模型中参数分量和响应均值估计问题,首先,利用协变量平衡得分得到了选择概率中未知参数的估计;然后,利用此估计及逆概率加权借补方法,分别构造了部分线性模型中参数分量和响应均值的估计.通过数值模拟研究验证了所提出方法的有限样本表现.对协变量随机缺失下的线性模型,首先,借助于响应变量平衡倾向得分并利用经验似然方法得到了选择概率中未知参数的估计,得到了估计量的渐近性质;然后利用逆概率加权方法和经验似然方法,构造了模型中回归系数的估计和经验似然比,证明了它们的渐近性质.模拟研究验证了所提出方法的可行性.对响应变量缺失和非参数分量具有测量误差下部分线性模型的统计推断问题,首先基于逆卷积方法得到了缺失数据下非参数测量误差模型的估计,从而在完全数据下构造了参数分量的估计,并证明了其渐近正态性;其次,基于逆边际概率加权借补方法得到了响应均值的估计,并得到了估计量的渐近性质.最后,通过模拟说明所提出的方法是可行的.


知网文化
【相似文献】
中国期刊全文数据库 前17条
1 郑明;杜玮;;含有截断和缺失数据的经验似然推断(英文)[J];应用概率统计;2008年04期
2 钱永江;秦永松;;缺失数据下均值的经验似然置信区间[J];统计与决策;2009年15期
3 张亚;安佰玲;;缺失数据情形下概率密度函数的统计应用研究[J];宿州学院学报;2018年05期
4 黎玲;秦永松;;缺失数据情形总体差异的经验似然置信区间[J];广西师范大学学报(自然科学版);2008年02期
5 康春花;孙金玲;孙小坚;曾平飞;;缺失数据比率和处理方法对非随机缺失数据能力参数估计准确性的影响[J];江西师范大学学报(自然科学版);2017年03期
6 董学思;林丽娟;赵杨;魏永越;戴俊程;陈峰;;多组学联合缺失数据填补方法的评价[J];中国卫生统计;2017年04期
7 张伟;冯萍;赵永红;袁佳英;李梅;;加权估计方程用于缺失数据的处理[J];中国卫生统计;2013年03期
8 杨金英;崔朝杰;;图模型方法用于二值变量相关性分析中缺失数据的估计[J];中国卫生统计;2012年05期
9 黎玲;秦永松;;分数填补下两非参数总体一般差异的经验似然置信区间[J];高校应用数学学报A辑;2010年01期
10 许凯;何道江;;有缺失数据的条件独立正态母体中参数的最优同变估计[J];数学学报(中文版);2016年06期
11 王军;李建勋;韩山;王兴;;一种效能评估中缺失数据的填充方法[J];上海交通大学学报;2017年02期
12 吴洁琼;吕小纳;党志军;;网络高并发信息的缺失数据修复方法仿真[J];信息通信;2017年11期
13 喻成林;黄强;李钢;;观测站缺失数据修复的神经网络模型研究[J];矿山测量;2014年01期
14 帅平;李晓松;周晓华;刘玉萍;;缺失数据统计处理方法的研究进展[J];中国卫生统计;2013年01期
15 詹棠森;;缺失数据调整修正优化磨光法研究及陶瓷中的应用[J];中国陶瓷;2012年06期
16 刘海军;柳征;姜文利;周一宇;;基于缺失数据填补的辐射源识别方法[J];宇航学报;2010年05期
17 庞新生;;缺失数据处理方法的比较[J];统计与决策;2010年24期
中国重要会议论文全文数据库 前10条
1 印明辉;秦婷婷;伏振;严明明;尹平;;贝叶斯累加回归树模型处理缺失数据研究[A];2017年中国卫生统计学学术年会论文集[C];2017年
2 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
3 刘红云;;追踪研究中非随机缺失数据的处理:基于模型的方法及其应用[A];第十五届全国心理学学术会议论文摘要集[C];2012年
4 管河山;姜青山;Steven X.Wei;;一种处理缺失数据的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
5 肖悦;刘红云;;密集型追踪数据中数据的缺失机制及缺失比例对时变效应模型估计精度的影响[A];第二十届全国心理学学术会议--心理学与国民心理健康摘要集[C];2017年
6 孙金玲;;混合测验中非随机缺失数据的缺失比率与处理方法对IRT参数估计的影响[A];第十八届全国心理学学术会议摘要集——心理学与社会发展[C];2015年
7 李晓煦;侯杰泰;;结构方程中缺失数据的处理:FIML,EM与MI[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年
8 叶素静;唐文清;张敏强;;追踪研究中缺失数据的处理方法述评[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
9 周晓东;汤银才;费鹤良;;定数转换步加试验缺失数据场合下的参数估计[A];中国现场统计研究会第十三届学术年会论文集[C];2007年
10 管河山;姜青山;谭忠;;一种处理缺失数据的回归模型[A];第二十二届中国数据库学术会议论文集(技术报告篇)[C];2005年
中国博士学位论文全文数据库 前10条
1 郭东林;缺失数据下几类回归模型的估计方法与理论[D];北京工业大学;2017年
2 丁先文;缺失数据模型的估计与变量选择[D];云南大学;2018年
3 高航;面向缺失数据的机器学习算法研究[D];国防科学技术大学;2016年
4 唐琳;带有不可忽略缺失数据的广义半参数非线性模型的统计推断[D];云南大学;2017年
5 龚奇源;面向数据发布的数据匿名技术研究[D];东南大学;2016年
6 陆福忠;数据缺失下的分布函数估计问题[D];复旦大学;2007年
7 骆汝九;多指标综合评价的非参数方法和缺失数据的聚类方法研究[D];扬州大学;2011年
8 彭清艳;广义函数型回归模型及缺失数据模型[D];云南大学;2016年
9 刘娟芳;复杂数据的统计分析与建模[D];北京工业大学;2017年
10 闫莉;基于复杂数据的两类统计模型的研究[D];陕西师范大学;2014年
中国硕士学位论文全文数据库 前10条
1 雷伟;带有不可忽略缺失数据的混合线性模型的贝叶斯统计推断[D];云南大学;2016年
2 张燕;带有时间相依协变量的纵向缺失数据的一种压缩经验似然推断方法[D];中国科学技术大学;2016年
3 石章波;缺失数据下众数线性模型的统计诊断[D];云南大学;2018年
4 王玉梅;缺失数据下基于众数回归两类半参数模型估计与变量选择[D];兰州理工大学;2019年
5 仝倩;带缺失数据的半参数非线性模型基于经验似然的统计诊断[D];南京理工大学;2018年
6 张文佳;缺失数据下变系数部分非线性模型的参数估计[D];南京理工大学;2018年
7 李佳妮;缺失数据统计方法及其敏感性的研究[D];哈尔滨工业大学;2018年
8 杜丽媛;含有缺失和不可适用数据的古生物谱系树构建方法研究[D];西北大学;2018年
9 陈琨;边坡自动化监测数据缺失填补算法研究[D];重庆交通大学;2018年
10 孙梦娇;客运数据质量检测与缺失数据修补研究[D];重庆交通大学;2018年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978