收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

复杂数据的统计分析与建模

刘娟芳  
【摘要】:在统计研究中,复杂数据的分析与建模得到了广泛关注.本文所考虑的复杂数据包括纵向数据、缺失数据和测量误差数据.纵向数据分析的关键在于建模时如何考虑个体内部不同测量之间的相关性,广义估计方程常常用来作为分析纵向数据的工具.纵向数据受各种主客观原因常常会出现缺失的情形,当缺失观测的概率依赖于观测数据时,估计方程通常是有偏的且得到的估计不相合.逆概率加权的思想是通过对观测到数据的加权调整,进而可以得到参数的相合估计.在实践中,一些协变量可能会因为变量本身的性质或测量机制而含有测量误差,对测量误差数据进行统计分析也很有必要.具体地,本文的研究内容有以下四个方面.对响应变量单调缺失下的纵向线性模型,基于二次推断函数和逆概率加权广义估计方程提出了回归系数的估计方法.该方法有效处理了纵向数据的组内相关性,并且不需要估计工作相关矩阵中的讨厌参数.在一定的正则条件下,证明了所得估计量的相合性和渐近正态性.通过模拟研究和实例分析验证了所提出方法在有限样本下的实际表现.对协变量含有测量误差的纵向部分线性模型,基于偏差校正和二次推断函数提出了一种广义经验似然的方法来估计模型中的参数分量和非参数分量.给出了回归参数的广义经验对数似然比统计量和非参数分量的残差调整的经验对数似然比统计量,证明了给出的经验对数似然比依分布收敛于卡方分布,并构造了相应的置信域.与基于正态逼近方法构造置信域相比较,经验似然方法构造置信域不需要估计渐近方差和偏差.模拟研究也显示所提方法具有更好的有限样本性质.对响应变量缺失协变量有测量误差下的纵向部分线性模型,假定基于测量误差数据的缺失机制,缺失机制的调整更加合理并且对模型参数也有更明确的解释.该方法建立了 Logistic缺失机制模型,考虑了纵向数据的组内相关性及其对测量误差的纠偏项的影响,给出了回归参数的广义经验似然比,并证明了该统计量是渐近服从中心卡方分布.对非参数分量,利用借补的方法提出了借补的经验对数似然比统计量,证明渐近服从非中心卡方分布.为此,给出了残差校正的借补的经验对数似然比,这样避免了欠光滑而且偏差项也消失了.同时分别构造了兴趣参数和非参数分量的置信域和逐点置信区间.经验似然方法构造置信域不需要渐近方差和渐近偏差的相合估计,往往精度更高.模拟和实例分析结果可以看到这一点.对纵向单调缺失数据下的部分线性模型,提出了光滑阈的变量选择方法.该方法是基于逆概率加权广义估计方程提出的,因此称之为光滑阈逆概率加权广义估计方程方法.所提出的方法可以自动地将不显著变量的系数压缩为零,同时通过光滑阈逆概率加权广义估计方程给出重要变量系数的估计值.该方法有光滑阈估计方程方法的优点,即它避免了惩罚函数的凸优化问题而便于计算.在一定的正则条件下,证明了变量选择的相合性和估计的Oracle性质.模拟研究结果表明所提出的变量选择方法是有效的.


知网文化
【相似文献】
中国期刊全文数据库 前12条
1 吴成鑫;;缺失数据下部分函数线性模型的经验似然推断[J];安徽工程大学学报;2017年05期
2 于卓熙;李梦丽;;纵向数据下部分线性模型基于经验似然的变量选择[J];吉林大学学报(理学版);2018年04期
3 周小双;张明峰;赵培信;;纵向数据下变系数部分非线性模型的经验似然推断[J];系统科学与数学;2017年03期
4 张涛;朱仲义;;纵向部分线性模型的分块经验似然的有效推断(英文)[J];应用概率统计;2010年03期
5 于卓熙;王德辉;;m-相依误差下部分线性模型的经验似然统计推断(英文)[J];应用概率统计;2011年05期
6 王启华,Wolfgang Hardle;核实数据帮助下误差在反映线性模型经验似然降维推断[J];中国科学(A辑:数学);2004年05期
7 梁薇;何书元;;平均经验似然方法[J];数学进展;2018年02期
8 谭晓燕;陈夏;闫莉;;纵向数据下部分线性EV模型中的经验似然[J];纺织高校基础科学学报;2018年02期
9 秦永松;杨翠莲;;负相协样本多维边际密度的经验似然推断[J];广西师范大学学报(自然科学版);2012年03期
10 齐化富;秦永松;;缺失数据下线性模型中反映变量均值的经验似然置信区间[J];大学数学;2010年02期
11 王启华;经验似然统计推断方法发展综述[J];数学进展;2004年02期
12 钱永江;秦永松;;缺失数据下均值的经验似然置信区间[J];统计与决策;2009年15期
中国重要会议论文全文数据库 前10条
1 宋秋月;易东;伍亚舟;;不同作业相关结构的纵向数据GEE分析[A];2017年中国卫生统计学学术年会论文集[C];2017年
2 邱佳琰;赵春华;孙宏鹏;;多重填补法合并广义估计方程应用于纵向数据的模拟研究[A];2017年中国卫生统计学学术年会论文集[C];2017年
3 印明辉;秦婷婷;伏振;严明明;尹平;;贝叶斯累加回归树模型处理缺失数据研究[A];2017年中国卫生统计学学术年会论文集[C];2017年
4 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
5 刘红云;;追踪研究中非随机缺失数据的处理:基于模型的方法及其应用[A];第十五届全国心理学学术会议论文摘要集[C];2012年
6 刘玄鹤;向晓峰;高南;;背向台阶流动的线性模型[A];中国力学大会——2013论文摘要集[C];2013年
7 岳珠;;奇异线性模型的交互影响分析[A];中国现场统计研究会第九届学术年会论文集[C];1999年
8 张健;徐杰;包秀国;周若华;颜永红;;应用于语种识别的加权音素对数似然比特征[A];第十三届全国人机语音通讯学术会议(NCMMSC2015)论文集[C];2015年
9 管河山;姜青山;Steven X.Wei;;一种处理缺失数据的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
10 肖悦;刘红云;;密集型追踪数据中数据的缺失机制及缺失比例对时变效应模型估计精度的影响[A];第二十届全国心理学学术会议--心理学与国民心理健康摘要集[C];2017年
中国博士学位论文全文数据库 前10条
1 刘娟芳;复杂数据的统计分析与建模[D];北京工业大学;2017年
2 张涛;含有测量误差的纵向数据的统计推断[D];复旦大学;2011年
3 王然;半参模型的经验似然推断[D];浙江大学;2013年
4 彭毳鑫;基于经验似然方法的异方差时间序列模型的估计与检验[D];吉林大学;2018年
5 李华鹏;经验似然在密度比模型和小域估计中的若干研究[D];华东师范大学;2018年
6 黄晓薇;关于一类β-ARCH模型参数估计的研究[D];吉林大学;2004年
7 田瑞琴;纵向数据下半参数回归模型的统计推断[D];北京工业大学;2014年
8 熊贤祝;经验似然推断的若干研究[D];浙江大学;2012年
9 李昊;广义经验似然方法及其应用[D];华中科技大学;2011年
10 张艳青;估计方程及结构方程模型的统计推断[D];云南大学;2016年
中国硕士学位论文全文数据库 前10条
1 张燕;带有时间相依协变量的纵向缺失数据的一种压缩经验似然推断方法[D];中国科学技术大学;2016年
2 胡书文;稳健的经验似然推断方法在纵向数据中的应用[D];重庆大学;2017年
3 陈小艺;缺失数据下带散布的泊松回归模型的经验似然推断[D];湖南师范大学;2017年
4 张彦;φ-混合样本下线性模型的经验似然推断[D];广西师范大学;2012年
5 陈晓英;随机设计情形线性回归模型中误差方差的经验似然推断[D];广西师范大学;2019年
6 王伟;基于半参数回归模型的Jackknife经验似然估计及其应用[D];安徽工程大学;2019年
7 赵艺;固定设计情形线性回归模型中误差方差的经验似然推断[D];广西师范大学;2019年
8 刘斌霞;区间删失数据的贝叶斯经验似然统计分析[D];长春工业大学;2019年
9 邹丽莎;协变量有数据缺失的变系数模型的经验似然推断[D];湖南师范大学;2018年
10 杨柳;聚类数据的比例风险混合效应模型的经验似然推断[D];湖南师范大学;2018年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978