收藏本站
《南方医科大学》 2019年
收藏 | 手机打开
二维码
手机客户端打开本文

一种新的单样本率的置信区间估计方法

徐莹  
【摘要】:背景:在医学研究领域,以二分类数据为结局的资料类型十分常见。对于此类数据的分析,应用中通常会给出效应量及效应量的置信区间,其中最常用的效应量包括:率、率差、率比、优势比等。单样本率的置信区间估计方法较多,以Wilson Score法的应用最为广泛,但均存在极端率情形下(接近0%或100%)置信区间覆盖率急剧下降的情况,即“downward spikes”现象。此外,不同方法还有着自身的局限,如Agresti-Coull提出的对于样本成功例数和失败例数分别加2的Agresti and Coull add 4 CI以及于样本成功例数和失败例数分别加z2的Agresti and Coull add z2 CI,Guan提出的广义Score法(Generalized Score CI),以及Yu提出的基于中点校正的Score法(Improved Score interval with a Modified Midpoint)等,虽然从不同的方面对Wilson Score CI有所改善,但是仍存在覆盖率不稳定、区间宽度过大等问题。在精确法中,Clopper-Pearson CI可以保证区间覆盖率不低于所设定的检验水准,但是该方法过于保守,Mid-P CI相对于Clopper-Pearson CI有所改善,但是结果仍较保守,而且精确法的计算量大,在应用上受到了一定的限制;Rubin和Schenke基于贝叶斯理论提出了Jeffrey CI,该方法能够解决在极端率的情况下区间覆盖率急剧下降的问题,但是其区间估计的结果过于保守,而且当事件发生率不接近0或者1时同样会出现“downwardspikes”现象。因此,目前并没有一种公认较好的单样本率的置信区间估计方法。两独立样本率差置信区间的构建相对于单样本率的情况更加复杂,虽然当前已有数十种方法被提出,但是这些方法自身均存在一定的不足。目前最常用的是Newcombe与1998年提出的Newcombe-Wilson Score CI,这种方法也受到了美国临床实验室标准化协会以及FDA指南的推荐。但是,当率接近0或100%的时候,Newcombe-Wilson Score CI较为保守。目的:本研究旨在基于Cornish-Fisher展开式结合Score法思想提出一种新的单样本率置信区间构建方法,并进一步将新方法推广到两独立样本率差置信区间的构建中,以期较现有方法的统计性能有明显改善。方法:(1)新方法的提出Comish-Fisher展开式是一种用于估计概率分布分位数的渐近展开方法,由Cornish和Fisher两位著名统计学家于1960年提出。其主要思想是通过概率分布的前n阶累积量和标准正态分布的分位数来近似估计概率分布的分位数。Wilson Score CI在极端率的条件下可能会出现覆盖率急剧下降的问题,其主要原因是当事件发生率接近0或1时,二项分布并非近似服从正态分布。因此,本研究考虑提出一种新的置信区间构建思想,在构建单样本率的置信区间时,舍弃传统的正态近似法,直接采用Cornish-Fisher展开式估计二项分布的分位数,希望以此避免近似正态分布时产生误差,提高结果的精确性。本研究将基于这种新思想构建的单样本率的置信区间命名为Cornish-Fisher CI。MOVER法(Method of Variance Estimate Recovery)是一种常用的率差/率比置信区间的构建策略,其主要思想是通过方差重估计(Variance Estimate Recovery)的方法将单样本率的置信区间“杂交”成两样本率差/率比的置信区间。我们将本研究提出的置信区间构建思想结合MOVER法构建出一种新的两独立样本率差的置信区间,并命名为Cornish-Fisher hybrid CI。(2)模拟研究在比较各种置信区间估计方法的优劣时,采用的评价指标包括置信区间的区间覆盖率、置信区间宽度、尾侧不覆盖率及其比值、最小区间覆盖率、均方误、平均置信区间宽度以及方法的计算复杂程度。对于单样本率的置信区间估计,本研究共纳入8种常见的方法包括:Wilson Score CI、Wald CI、Modified Midpoint CI、Generalized Score Cl、Agresti-Coull add z2 CI、Jeffrey CI、Mid-P CI、Randomized Plausible Interval,与新方法Cornish-Fisher CI进行模拟比较。对于两独立样本率差的置信区间估计,本研究重点考察当前使用最广泛的方法Newcombe-Wilson Score CI与新方法Cornish-Fisher hybrid CI 的优劣。结果:对于单样本率的置信区间估计,本研究提出的新方法在平均置信区间覆盖率、均方误及平均置信区间宽度等方面均表现最优,即在纳入比较的几种方法中,新方法在保证平均置信区间覆盖率的情况下,它的均方误及平均置信区间宽度是最小的。对于两独立样本率差的置信区间估计,当两事件发生率π1和π2接近0或1,即在(0,0.2](?)[0.8,1)范围内时,当前广泛推荐使用的Newcombe-Wilson Score CI存在过保守的问题,本研究新提出的Cornish-Fisherhybrid CI平均置信区间宽度小于Newcombe-Wilson Score CI,同时新方法的平均置信区间覆盖率更优,更接近置信水准1-α,故推荐使用新方法。结论:当事件发生率小于20%或大于80%时,本研究提出的置信区间估计新方法较常用的估计置信区间的Wilson Score CI方法有更优的统计性能。
【学位授予单位】:南方医科大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:R195.1;O212.1

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 张彦;彭华;;基于变化稀疏表示的单样本人脸识别[J];信息工程大学学报;2017年02期
2 王梅花;班锦;;基于镜像奇异值分解的单样本人脸识别[J];微型机与应用;2010年16期
3 吴朋;周激流;李晓华;丁晓莲;;基于虚拟信息的单样本分块人脸识别[J];计算机工程与应用;2009年19期
4 张彦;彭华;;基于深度自编码器的单样本人脸识别[J];模式识别与人工智能;2017年04期
5 蔡珺;陈靖;梁杏;;人脸面部变化字典学习的单样本人脸识别问题[J];小型微型计算机系统;2015年09期
6 单桂军;;基于虚拟样本扩张法的单样本人脸识别算法研究[J];科学技术与工程;2013年14期
7 王斌;刘允才;茅红伟;;一种基于产生式分数空间的单样本人脸识别方法[J];上海交通大学学报;2017年02期
8 谢琼裕;戴群;;单样本人脸识别线性回归分类[J];计算机工程与设计;2014年12期
9 许汝福;沈渝菊;肖瑞卿;;单样本重复测量资料的混合线性模型及其应用[J];第三军医大学学报;2006年07期
10 梁胜浴;黄建军;黄敬雄;刘显;;一种雷达信号的单样本压缩采样方法[J];信号处理;2019年06期
中国重要会议论文全文数据库 前1条
1 王科俊;邹国锋;阎涛;;融合全局与局部特征的单样本人脸识别[A];2011年中国智能自动化学术会议论文集(第一分册)[C];2011年
中国重要报纸全文数据库 前4条
1 张军;有“心意”才能求满意[N];中国国门时报;2013年
2 李开鹏 温德成;SPSS统计软件:帮你试验和检验[N];中国质量报;2005年
3 ;上海出台无船承运业务准入条件[N];国际商报;2002年
4 通讯员 姚红梅 李晓宏 记者 邱霞;人性化做法感化大批违法停车司机[N];杭州日报;2005年
中国博士学位论文全文数据库 前7条
1 张延强;单样本条件手部特征识别算法研究[D];北京交通大学;2012年
2 陈龙;非受控场景下单样本人耳识别研究[D];北京科技大学;2017年
3 胡峰松;单样本下可变姿态与光照人脸识别研究[D];湖南大学;2010年
4 于祥田;基于多阶信息的复杂疾病分子网络研究[D];山东大学;2015年
5 唐亮;面向人脸识别的子空间分析和分类方法研究[D];浙江大学;2009年
6 孔万增;基于学习的人脸识别研究[D];浙江大学;2008年
7 刘凡;人脸识别中基于图像局部结构的特征提取与分类研究[D];南京理工大学;2015年
中国硕士学位论文全文数据库 前10条
1 丁一;基于复杂条件下的单样本人脸识别[D];郑州大学;2019年
2 王高星;基于单样本的人脸识别算法研究[D];郑州大学;2019年
3 徐莹;一种新的单样本率的置信区间估计方法[D];南方医科大学;2019年
4 刘文培;单样本条件下的人脸特征提取与人脸识别方法研究[D];太原理工大学;2018年
5 沈韬;基于稀疏表示和低秩表示的单样本人脸识别算法研究[D];中国矿业大学;2017年
6 赵汝哲;基于单样本训练集的人脸识别研究[D];重庆大学;2012年
7 段胜利;基于主分量分析的单样本人脸识别方法研究[D];哈尔滨工程大学;2008年
8 张琦;基于迁移学习的单样本人脸识别[D];哈尔滨工程大学;2016年
9 岳新启;单样本人脸识别算法研究[D];哈尔滨工程大学;2014年
10 张辉;单样本人脸识别算法研究[D];湘潭大学;2017年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026