收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

缺失数据下的有限混合计数数据模型的统计推断研究

褚培肖  
【摘要】:计数数据(Count data)是一类十分常见的离散型数据,其数值只能是0,1,2,…等非负整数,它所描述的是单位时间或空间内某事件出现的频数。如不合格品数、缺陷数、交通事故数、医院挂号数和森林火灾数等不能连续取值只能用自然数来表示的一类数据,这类数据就被称为计数数据。它广泛存在于金融保险、生物医学、遗传学、临床诊断以及心理学等多个研究领域中。正是因为事件数的特殊取值,所以对于计数数据的研究,最常见的是使用Poisson模型或负二项分布模型来进行回归分析。Poisson回归模型是计数数据分析的基本模型,被广泛的应用到不同领域的研究中,是以事件发生相互独立为前提,发生率保持一致性,即要求先前发生的事件对以后事件的发生没有影响,且条件均值等于条件方差,这一假设在实际应用中往往得不到满足,而负二项回归就是在这种情况下对Poisson回归的一种扩展。然而在现实情境中,所研究的计数数据往往会出现较大的变异——方差的变化大于其均值的变化,则称这类计数数据是散度偏大的(over-dispersion)。导致计数数据出现散度偏大的原因有很多,可能是计数数据中包含了过多的零观测,当零观测的比例远远超过Poisson回归或负二项回归的预测能力时,就会表现出零膨胀现象(zero-inflated)。如果仍然采用Poisson回归或负二项回归分析计数数据,就有可能得到错误的推断结果。除了零膨胀的原因外,也有可能是因为观测数据存在缺失的影响,缺失数据不仅会导致统计推断中估计量出现偏差,还会导致估计方差的增大。还有可能是因为总体来源的“异质性”以及上述因素的综合作用等。根据不同的原因建立不同的模型,使得对数据的分析变得复杂,如果不能对其进行合理的解释,可能会导致有偏差的统计推断。本文在上述背景下研究了计数数据模型的统计推断,并进一步提出了带有缺失数据的Poisson-Hurdle有限混合模型,对模型参数和混合比例的极大似然估计提出了随机EM算法。具体来说,缺失数据重点考虑了随机缺失(MAR)和非随机缺失(MNAR),为了加速收敛以及方便抽样,采用了基于数据添加的probit回归建立起缺失数据模型。对于有限混合的参数估计而言,传统的EM算法常常会收敛到局部极大而非全局极大上,为了解决这一难题,本文提出了一类有效的随机EM算法,事实上,该算法可以视为多重插补程序的一部分,在实际应用中,该算法由于随机步的驱动,能够有效避免落入局部极大的陷阱而成功找到全局极大。在模型选择方面,本文采用了基于Q函数的BIC信息准则以选择混合成份的个数。我们的模型是建立在广义模型框架下,捕获了计数数据分析的重要特征,如零膨胀或零聚集、异质性、缺失等,在数据特征上提供给我们更多的见解,允许更全面和更正确地研究散度,为合理研究计数数据提供了技术上的参考。文章的最后用模拟研究和实例说明我们方法的实用性和有效性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 金勇进;缺失数据的加权调整(系列之Ⅳ)[J];数理统计与管理;2001年05期
2 杨金英;崔朝杰;;图模型方法用于二值变量相关性分析中缺失数据的估计[J];中国卫生统计;2012年05期
3 金勇进;缺失数据的偏差校正(系列三)[J];数理统计与管理;2001年04期
4 张朝雄;沈旻;张慧;;缺失数据插补方法比较研究[J];市场研究;2007年09期
5 周伟萍;张德然;杨兴琼;;具有部分缺失数据时两个几何总体的估计[J];长春大学学报;2008年02期
6 赵蒙成;张玲;;论量化研究中缺失数据的处理方法[J];教育测量与评价(理论版);2012年07期
7 孙瑜玲;;数学建模中的缺失数据[J];中国科教创新导刊;2013年10期
8 田俊;含有缺失数据的非降重复测量资料的W检验方法[J];数理统计与管理;2000年06期
9 庞新生;缺失数据处理中相关问题的探讨[J];统计与信息论坛;2004年05期
10 李云仙;王学仁;;带有缺失数据的结构方程模型中的模型选择问题[J];数理统计与管理;2012年06期
11 金勇进;;统计调查中的缺失数据及补救[J];统计研究;1996年01期
12 王学丽,耿直;借助优势比信息识别不可忽略缺失数据的模型参数[J];数理统计与管理;2005年03期
13 李建丽;;两个0-1总体具有部分缺失数据时的估计和检验[J];长治学院学报;2011年05期
14 金勇进;处理缺失数据中辅助信息的利用[J];统计研究;1998年01期
15 金勇进;缺失数据的插补调整[J];数理统计与管理;2001年06期
16 赵书祥,邢尚杰,周星宇;关于抽样调查中“缺失数据”问题的讨论及处理方法[J];北京体育大学学报;2002年06期
17 李开灿;有缺失数据的2×2×2列联表的参数估计[J];数理统计与管理;2003年02期
18 陈春华;;部分缺失数据两个特殊指数总体的估计和检验[J];长春大学学报;2007年02期
19 李薇;统计调查中的数据缺失及处理[J];商业研究;2003年06期
20 王天营;样本数据缺失的模型拟合[J];山西统计;2003年11期
中国重要会议论文全文数据库 前8条
1 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 管河山;姜青山;Steven X.Wei;;一种处理缺失数据的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 陈楠;刘红云;;基于增长模型的缺失数据处理方法之比较[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
4 肖进;贺昌政;;面向缺失数据的客户价值区分集成模型研究[A];中国企业运筹学[2010(1)][C];2010年
5 曾莉;张淑梅;辛涛;;IRT模型中缺失数据处理方法比较[A];第十一届全国心理学学术会议论文摘要集[C];2007年
6 孙玲;刘浩;袁长亮;;北京市城市快速路微波检测缺失数据分析[A];2008第四届中国智能交通年会论文集[C];2008年
7 张香云;;基于EM算法缺失数据下混合模型的参数估计[A];第十三届中国管理科学学术年会论文集[C];2011年
8 李晓煦;侯杰泰;;结构方程中缺失数据的处理:FIML,EM与MI[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年
中国博士学位论文全文数据库 前8条
1 骆汝九;多指标综合评价的非参数方法和缺失数据的聚类方法研究[D];扬州大学;2011年
2 祝丽萍;几种缺失数据和高维数据模型的统计分析[D];山东大学;2012年
3 贾博婷;缺失数据下一类整值时间序列的统计推断[D];吉林大学;2014年
4 刘旭;在完全和缺失数据下基于非光滑估计方程的统计推断与变量选择问题[D];云南大学;2010年
5 赵鹏飞;混沌数据恢复与非线性系统的模型参考控制[D];吉林大学;2010年
6 陆福忠;数据缺失下的分布函数估计问题[D];复旦大学;2007年
7 赵慧秀;可交换的两值数据的统计分析[D];东北师范大学;2009年
8 付志慧;多维项目反应模型的参数估计[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨利华;缺失数据的处理方法研究及应用[D];景德镇陶瓷学院;2011年
2 袁中萸;多元线性回归模型中缺失数据填补方法的效果比较[D];中南大学;2008年
3 褚培肖;缺失数据下的有限混合计数数据模型的统计推断研究[D];昆明理工大学;2015年
4 申宁宁;纵向研究缺失数据多重填补及混合效应模型分析[D];山西医科大学;2015年
5 李少琼;纵向研究二分类缺失数据处理及加权估计方程的应用[D];山西医科大学;2015年
6 高宇钊;比值缺失数据的多重估算与心脏康复二级预防干预效果评价及应用[D];山西医科大学;2015年
7 李顺静;基于EM算法的缺失数据的统计分析及应用[D];重庆工商大学;2015年
8 崔朝杰;含有缺失数据的两值吸毒数据分析[D];东北师范大学;2009年
9 岳春柳;缺失数据的概率主成分分析[D];东北师范大学;2010年
10 齐丹丹;对含缺失数据的非参可加模型进行成分选取[D];东北师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978