收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

纵向研究二分类缺失数据处理及加权估计方程的应用

李少琼  
【摘要】:目的:纵向研究是医学实验干预效果评价中常用的一种方法,由于其研究时间长,同一个体多次反复、连续检测,受试对象可能会因种种原因不能按时参与调查,引致分析资料出现数据缺失。基于似然估计(广义线性估计方程、非线性混合模型等)处理随机缺失机制的数据缺失方法,基于半参数估计的广义估计方程等,为处理完全随机缺失机制的数据缺失研究提供了更准确有效的方法。方法:本文针对纵向二分类数据缺失问题,在广义估计方程基础上引入权重,进一步阐明加权估计方程分析原理,通过小样本、渐进法模拟对比研究,阐明纵向二分类数据缺失处理方法的特点,为随机缺失数据分析提供了方法学参考依据。针对入住CCU的急性冠脉综合征患者,于术前、术中、术后实施心脏康复二级预防综合干预,同时收集患者症状自评量表(SCL-90)、焦虑自我评定量表(SAS)和抑郁自我评定量表(SDS)的测定结果,进行综合干预效果的评价。由于CCU监测中,急冠患者心理状况检测指标出现了数据缺失。本研究根据数据缺失机制,对比分析了加权估计方程(weighted estimating equations,WEE)与后观察单位替代法(Last Observation Carried Forward,LOCF)数据缺失处理方法的异同。通过模拟研究,对比分析了样本含量与数据缺失比例对模型参数估计结果的影响。结果:1、两种缺失数据填补方法与样本含量及数据缺失比例有关经对样本含量在50至300之间,数据缺失比例在5%-40%之间的多种情况的模拟研究表明,当样本含量一定时,随数据缺失比例加大(5%-40%),两种缺失数据处理方法参数估计值的标准误都越来越大,参数估计结果与模拟真值的偏差也越来越大。在缺失比例一定的情况下,样本含量越大,两种方法参数估计值的标准误都越来越小,当样本量大于150时,参数估计结果均趋于稳定。对协变量及时间协变量交互作用的偏差分析可知,LOCF法较WEE法大,而WEE法对截距参数的估计结果偏差较大。当样本含量在150以上时,不同缺失比例参数估计结果相差较小,与真值较接近,样本量越大,参数估计值的偏差越小,参数估计值也越稳定地接近模拟真值。总之,LOCF与WEE两种方法均需要保证有一定的样本量,分析结果才更稳健。当缺失比例在25%以下,样本含量大于150时,加权估计方程对纵向监测二分类随机缺失数据分析,可以得到更为稳健的参数估计结果。WEE法不仅考虑了条件模型、边际模型以及数据的相关结构,而且可通过加权思想把缺失单元的权数分解到非缺失单元上,通过增大样本观测值的权重,来减少由于数据缺失对估计量产生的偏差,较LOCF法处理更佳。2、WEE法处理急性冠脉综合征二分类缺失数据结果解释更稳健经对急性冠脉综合征入住CCU期间心脏康复二级预防综合干预实例加权估计方程分析,结果表明吸烟、施加心脏康复二级预防综合干预措施均对急冠患者早期心理状态的变化有影响,也即吸烟是影响急冠患者早期康复的危险因素,而二级预防综合干预有利于急冠患者的早期心理康复。有效使用MI与WEE法对缺失数据进行填补处理,可作为心脏康复个体化综合干预效果规范化管理与评价的新思路和新方法。3、二级预防综合干预模式有利于急冠患者心脏康复心脏康复二级预防综合干预效果评价中,急冠患者多次检测结果可能会受到多个协变量(如个体BMI、吸烟、既往病史、冠状动脉狭窄程度、治疗方法、是否施加干预等)的影响,对照组(n=67)采用常规治疗,试验组(n=77)在常规治疗基础上实施二级预防综合干预。通过干预后心理康复状况多种分析方法对比研究结果表明,两组急冠患者入住CCU后均可出现不同程度的焦虑、抑郁等心理问题。通过对试验患者施加有针对性的个体化干预,可见干预组比对照组SCL-90、SAS量表得分较入住CCU时均有明显好转。经对缺失数据多重填补处理,进行治疗前后得分的重复测量资料广义线性混合模型分析,两组SCL-90、SAS量表得分均P0.05,尚不能认为早期干预SCL-90、SAS量表得分均有改善,统计分析结果与实际干预效果解释相差较大。结论:为对干预后心理康复情况作出综合评判,本研究将一周内SCL-90、SAS及SDS量表得分重复检测结果,按各量表诊断评价标准(正常与否)进行整理,并对任意缺失模式数据缺失进行了多重填补等处理,采用急冠患者综合干预三次心理状况评判结果(正常与否)进行加权估计方程分析。结果表明,吸烟、治疗方式、是否施加心脏康复二级预防综合干预等是影响急冠患者早期心理康复的主要因素,吸烟不利于急性冠脉综合征患者的心理康复,施加二级预防综合干预,有利于急冠患者的心理康复,但无论药物治疗还是PCI手术治疗,综合干预对急冠患者心理康复效果尚不能认为有差别。总之,本文通过对纵向二分类任意缺失模式数据多重填补处理方法的对比研究,进一步证实了缺失数据比例与样本含量是影响缺失数据分析的两个关键问题。样本量适中,缺失比例在25%以下时,加权估计方程能有效考虑应变量与缺失时间之间的关系,充分利用缺失数据提供的信息,有效分解权重,使模型分析结果更稳健。基于急冠综合征患者心脏康复二级预防综合干预加权估计方程分析,进一步验证了纵向二分类数据缺失问题的多重填补及模型分析方法,为纵向研究缺失数据分析提供了新方法和分析新思路。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 帅平;李晓松;周晓华;刘玉萍;;缺失数据统计处理方法的研究进展[J];中国卫生统计;2013年01期
2 沈琳;陈千红;谭红专;;缺失数据的识别与处理[J];中南大学学报(医学版);2013年12期
3 张伟;冯萍;赵永红;袁佳英;李梅;;加权估计方程用于缺失数据的处理[J];中国卫生统计;2013年03期
4 张桥;李宁;张秋菊;刘美娜;;任意缺失模式缺失数据不同填补方法效果比较[J];中国卫生统计;2013年05期
5 赵景波;谭瀛;杨瑞璋;;缺失数据配伍组设计方差分析的回归分析方法[J];中国卫生统计;1990年06期
6 李清华,夏结来;有缺失数据的2×2交叉设计的多重填补与分析[J];中国卫生统计;2005年05期
7 周艺彪,姜庆五,赵根明;调查研究中数据缺失的机制及处理方法[J];中国卫生统计;2005年05期
8 沐守宽;周伟;;缺失数据处理的期望-极大化算法与马尔可夫蒙特卡洛方法[J];心理科学进展;2011年07期
9 廖慧敏;林燧恒;;数据缺失机制对逐步回归变量筛选的影响[J];中国卫生统计;2011年04期
10 尚磊;孙丽君;万毅;张玉海;;生长发育监测指标缺失数据插补方法比较[J];数理医药学杂志;2013年05期
11 陈长生,王彤,徐勇勇,尚磊;医学科研中缺失数据的EM估计[J];第四军医大学学报;2002年01期
12 王睿;马修强;陆健;赵艳芳;贺佳;;Epworth量表中缺失数据处理方法研究[J];中国卫生统计;2013年01期
13 伍亚舟;易东;;基因表达谱缺失数据填补估计方法的研究进展与探讨[J];重庆医学;2014年14期
14 李清华,夏结来,薛富波;多重填补处理有缺失数据的2×2交叉设计资料的计算机模拟[J];第四军医大学学报;2004年23期
15 戴雪梅;张佃中;;心率缺失数据插值方法探讨[J];中国医学物理学杂志;2013年01期
16 冯志兰,刘桂芬,刘力生,郝建生;缺失数据的多重估算[J];中国卫生统计;2005年05期
17 李树威;钟晓妮;;基于Markov Chain Monte Carlo模型对医院调查资料中缺失数据的多重估算[J];中国卫生统计;2013年06期
18 吴秋红;张裕青;李国平;张丕德;;不同模型处理纵向缺失数据的模拟研究及应用[J];中国卫生统计;2013年06期
19 岳勇;田考聪;;数据缺失及其填补方法综述[J];预防医学情报杂志;2005年06期
20 曹阳,谢万军,张罗漫;多重填补的方法及其统计推断原理[J];中国医院统计;2003年02期
中国重要会议论文全文数据库 前8条
1 耿直;葛丹丹;;纵向研究非随机缺失数据分析[A];中国现场统计研究会第12届学术年会论文集[C];2005年
2 管河山;姜青山;Steven X.Wei;;一种处理缺失数据的新方法[A];第二十一届中国数据库学术会议论文集(技术报告篇)[C];2004年
3 陈楠;刘红云;;基于增长模型的缺失数据处理方法之比较[A];心理学与创新能力提升——第十六届全国心理学学术会议论文集[C];2013年
4 肖进;贺昌政;;面向缺失数据的客户价值区分集成模型研究[A];中国企业运筹学[2010(1)][C];2010年
5 曾莉;张淑梅;辛涛;;IRT模型中缺失数据处理方法比较[A];第十一届全国心理学学术会议论文摘要集[C];2007年
6 孙玲;刘浩;袁长亮;;北京市城市快速路微波检测缺失数据分析[A];2008第四届中国智能交通年会论文集[C];2008年
7 张香云;;基于EM算法缺失数据下混合模型的参数估计[A];第十三届中国管理科学学术年会论文集[C];2011年
8 李晓煦;侯杰泰;;结构方程中缺失数据的处理:FIML,EM与MI[A];全国教育与心理统计测量学术年会论文摘要集[C];2006年
中国博士学位论文全文数据库 前8条
1 骆汝九;多指标综合评价的非参数方法和缺失数据的聚类方法研究[D];扬州大学;2011年
2 祝丽萍;几种缺失数据和高维数据模型的统计分析[D];山东大学;2012年
3 贾博婷;缺失数据下一类整值时间序列的统计推断[D];吉林大学;2014年
4 刘旭;在完全和缺失数据下基于非光滑估计方程的统计推断与变量选择问题[D];云南大学;2010年
5 赵鹏飞;混沌数据恢复与非线性系统的模型参考控制[D];吉林大学;2010年
6 陆福忠;数据缺失下的分布函数估计问题[D];复旦大学;2007年
7 赵慧秀;可交换的两值数据的统计分析[D];东北师范大学;2009年
8 付志慧;多维项目反应模型的参数估计[D];吉林大学;2010年
中国硕士学位论文全文数据库 前10条
1 杨利华;缺失数据的处理方法研究及应用[D];景德镇陶瓷学院;2011年
2 袁中萸;多元线性回归模型中缺失数据填补方法的效果比较[D];中南大学;2008年
3 褚培肖;缺失数据下的有限混合计数数据模型的统计推断研究[D];昆明理工大学;2015年
4 申宁宁;纵向研究缺失数据多重填补及混合效应模型分析[D];山西医科大学;2015年
5 李少琼;纵向研究二分类缺失数据处理及加权估计方程的应用[D];山西医科大学;2015年
6 高宇钊;比值缺失数据的多重估算与心脏康复二级预防干预效果评价及应用[D];山西医科大学;2015年
7 李顺静;基于EM算法的缺失数据的统计分析及应用[D];重庆工商大学;2015年
8 崔朝杰;含有缺失数据的两值吸毒数据分析[D];东北师范大学;2009年
9 岳春柳;缺失数据的概率主成分分析[D];东北师范大学;2010年
10 齐丹丹;对含缺失数据的非参可加模型进行成分选取[D];东北师范大学;2010年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978