收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

非正态及非线性重复测量资料分析模型及其医学应用

罗天娥  
【摘要】: 重复测量资料是指对同一受试对象的某个或某些指标进行多次观察或测量获得的数据,在医学研究领域极为多见,观测指标的类型也多种多样,表现为定量变量,分类变量及等级变量;例如,在Ⅱ期高血压病的疗效评价中,为患者定期检测血压(包括舒张压/收缩压等)值为定量变量资料;在乳腺增生患者的治疗中,定期记录患者治疗期间的变化,检测指标为是否有改善的二分类变量;在介入治疗冠心病患者出院随访研究中,分别检查并记录出院时、出院后3月、6月和9月的疗效,不同时段结局可以是痊愈、好转、有改善、变化较小或无改变等,表现为等级分类变量;在一些情况下,记录的反应变量为计数数据,如单位时间(年或月)内癫痫发作次数。 据反应变量与自变量参数之间的关系,又可分为线性重复测量资料模型和非线性重复测量资料模型;如定期监测高血压病患者的血压值,探讨患者血压与时间变量及其它解释变量间关系,可以用线性模型来拟合,称其为线性重复测量资料模型:在药动学研究中,个体口服一定剂量药物后连续采集检测血样中药物浓度,描述药物在体内吸收、分布、排泄的药动学过程,大多情况下表现为非线性特征,如Ⅱ室模型;在HⅣ病毒动力学研究中,血液里病毒粒浓度的定量分析是检测HⅣ感染者“病毒”路径,描述感染特征的一种常规手段,采用系列微分方程描述免疫细胞的繁殖、感染和凋亡以及病毒颗粒的繁殖和清除等特征的变化等,均可收集到非线性重复测量资料,要描述解释变量与反应变量参数间的非线性关系,可构建非线性重复测量资料模型。复发事件数据指同一个体在一段时间里多次经历同一事件,例如一名冠心病患者在一段时间内经历多次冠心病的发作,一名癌症患者在化、放疗后再一次次经历复发等,该资料具有重复测量和生存分析数据的特性。上面提及的资料均不满足经典线性模型分析要求的正态性和线性条件。 重复测量资料线性模型理论已经成熟,应用也较普及,线性混合效应模型被视为最理想的方法。它可假定方差-协方差具有某特定结构形式,用来说明异方差性和相关性,既不像单变量分析方法那样严格,也不如多变量方差分析那样对协方差完全无约束;分析观察时点可相等或不等,能充分利用含有完全随机缺失观察值的资料,建模灵活。但对于非正态及非线性重复测量资料模型分析理论及应用目前尚处于初级阶段,有待于进一步完善相关理论,在医学研究领域推广、普及和应用。线性混合效应模型允许反应变量来自指数家族任一分布,包括离散分布(如二项分布,泊松分布等)和连续分布(正态分布,beta分布和卡方分布等),用连接函数将反应变量的均数与个体的线性预测值联系起来,构建广义线性混合效应模型(当随机效应不存在时退化为广义线性模型)和非线性混合效应模型,用来处理非正态、非独立二分类,等级多分类及计数重复测量资料。脆弱模型是用以描述子组中个体“生存”情况与时间之间关联性的一种模型,将随机效应、变量间的联系及未观测到的异质性引入到生存分析模型中,为复发事件数据高效方便的分析提供了新思路。 重复测量资料类型广泛,医学应用非常多见。本文深入全面地从反应变量的类型(定性、定量、等级变量)来探讨相应的统计分析模型,并进行比较分析;从反应变量与解释变量参数之间的关系,系统探索线性模型和非线性模型。其主要内容分七部分: 第一部分介绍重复测量资料的特性及其方差协方差结构。 第二部分介绍线性混合效应模型重复测量资料统计分析基础理论。 第三部分介绍广义估计方程(GEE)理论及其在二分类、有序多分类变量和计数重复测量资料分析中的应用。广义估计方程是边际模型估计方法的一种,是在广义线性模型和纵向数据准似然估计的基础上发展起来的一种拟似然估计方法,可用于非独立重复测量数据分析:它是在未完全指明个体观测的联合分布,仅根据(单变量)边际分布似然和个体重复测量向量的“作业”相关矩阵进行参数估计的,是一种半参数方法。即便在时间依赖协方差矩阵误指时,GEE方法也可得出一致和渐近的正确估计,当反应变量表现为非连续型变量(如二分类、等级或计数资料)时,GEE方法是常用得最适方法之一。 第四部分阐述广义线性混合效应模型(GLMMs)理论及其在二分类、多分类等级变量及其计数重复测量资料分析中的应用。广义线性混合效应模型是线性混合效应模型的自然延伸,该类模型可用于解决连续型和分类变量的纵向研究问题,GLMMs是唯一具有随机效应指数分布族的回归方法,采用一个连接函数将反应变量的均数与个体的线性预测值联系起来;它可以用随机效应拟合各类型相关数据结构模型:当随机效应不存在时,广义线性混合效应模型就退化为广义线性模型。 第五部分介绍非线性混合效应模型(NLMEs)理论及其在药物代谢动力学、二分类、等级变量及其计数重复测量资料中的应用。非线性混合效应模型不仅能识别与估计个体间和个体内的变异,而且也考虑了解释变量与反应变量参数的非线性关系,允许固定效应和随机效应进入模型的非线性部分:反应变量可以服从正态分布、二项分布或泊松分布;常用于处理药代动力学、非线性生长曲线研究,也可以直接拟合二分类、等级及计数重复测量资料的非线性模型;近年在工农业、环境和医学界备受关注。 第六部分介绍条件脆弱模型理论及其在医学复发事件数据分析中的应用。脆弱模型是Cox比例风险模型的延伸,目的是解释由不能被观测的协变量引起的异质性,脆弱对基线风险函数有乘积效应,即以乘法算子对子组内每一个体的危险率产生影响。脆弱值大的子组比脆弱值值小的子组要在更短的时间内经历事件的发生。一般可认为同一子组内个体有相同的脆弱,因此也称为共享脆弱模型,生存时间被认为是在共享脆弱的条件下独立:脆弱被认为是服从某种分布的随机效应,常认为服从gamma分布。条件脆弱模型将解释观测异质性的随机效应和反映事件相依性的基本事件分层(变化的基线风险)联系起来,把复发事件数据过程的关键特征都包含在模型中,是复发事件数据拟合的理想模型。 第七部分通过对非正态、非独立和非线性资料分析方法的介绍,进一步阐述了广义估计方程、广义线性混合效应模型和非线性混合效应模型在医学研究二分类、有序多分类、计数变量以及非线性重复测量资料,脆弱模型对复发事件数据等方面的分析,探讨了SAS软件和R软件分析方法与软件实现,提出了实际应用中有关模型构建、参数估计、软件实现等方面的建议与评价,为非正态、非独立和非线性资料分析应用提供了新思路。 文中主要采用SAS9.1.3分析软件GENMOD、GLIMMIX和NLMIXED过程对医学分类及非线性重复测量资料进行了对比分析,采用免费软件R2.4.0实现了临床研究中复发事件数据的分析:运用模型理论与实例分析相结合、方法研究与软件实现相结合的思路,系统介绍了非正态、非线性重复测量资料在模型分析与软件中的应用,结合实例,摸索与总结出具体应用的技能与经验,系统阐述了非正态、非线性资料分析模型及原理,为医学资料的分析提供了方法学基础,也为理论模型与软件应用的结合提供了条件,尤其在淡化抽象的统计理论,以基于理论而又高于理论的思路,突出各种方法的实际应用方面打开了新局面,为正确运用广义估计方程、广义线性混合效应模型、非线性混合效应模型和脆弱模型提供可靠性高、准确性好、信息量大的、解决实际问题可行性强的多元统计方法提出了新观点。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 朱玉;王静;何倩;;广义估计方程在SPSS统计软件中的实现[J];中国卫生统计;2011年02期
2 刘祥;张菊英;;有序多分类重复测量资料的广义估计方程分析[J];四川大学学报(医学版);2006年05期
3 陈启光;;纵向研究中重复测量资料的广义估计方程分析[J];中国卫生统计;1995年01期
4 罗天娥;赵晋芳;刘桂芬;;GENMOD过程和GLIMMIX过程的比较[J];中国卫生统计;2010年02期
5 马金凤,薛茜;临床研究中重复测量资料的辨别与统计分析[J];新疆医科大学学报;2005年05期
6 金雪娟,葛均波;临床试验计量重复测量资料的统计[J];复旦学报(医学版);2003年06期
7 高燕宁,刘欣华,蔡文玮,周纪芗;广义估计方程GEE2与GEE1的比较[J];数理医药学杂志;1996年04期
8 华琳;阎岩;刘学宗;;用广义估计方程分析重复测量的定性资料[J];药物流行病学杂志;2006年01期
9 高燕宁,蔡文玮,刘湘云,周纪芗,沈泉珍,范萃娣,王小英;广义估计方程GEE1在婴儿生长监测回归分析中的应用[J];中国卫生统计;1994年05期
10 黄高明,周颖川,梁秋萍;临床研究中重复测量资料的统计分析方法[J];广西医科大学学报;2000年02期
11 张毓武,刘桂芬;重复测量资料的设计与分析[J];山西医药杂志;1999年02期
12 张文彤 ,田晓燕;基于广义估计方程的多重应答资料统计分析方法[J];中国卫生统计;2004年03期
13 高燕宁,蔡文玮,周纪芗;广义估计方程GEE1与纵向资料的回归分析[J];数理医药学杂志;1994年02期
14 陈峰,姚晨,孙高,任仕泉,何清波,苏炳华,陆守曾;新药临床试验中重复测量资料的混合效应模型[J];中国卫生统计;2000年06期
15 周琴,任艳,倪宗瓒,李秀钧,冯学山,田浩明;线粒体基因突变糖尿病家系资料及致病基因突变研究的统计模型探讨[J];中华医学遗传学杂志;2004年05期
16 熊林平,曹秀堂,徐勇勇,郭祖超;纵向观测计数数据的对数线性模型[J];中国卫生统计;1999年02期
17 黄坤,倪宗瓒,程薇波;混合线性模型在临床试验中重复测量资料的应用[J];现代预防医学;2005年11期
18 许汝福;沈渝菊;肖瑞卿;;单样本重复测量资料的混合线性模型及其应用[J];第三军医大学学报;2006年07期
19 罗天娥;刘桂芬;;重复测量资料非线性混合效应模型应用与实现[J];中国卫生统计;2006年02期
20 陈卫中;杜显刚;张果;;广义估计方程在交叉设计等级资料分析中的应用[J];现代预防医学;2006年07期
中国重要会议论文全文数据库 前10条
1 洪荣涛;曹卫华;欧剑鸣;赵玉敏;;多重应答资料统计分析及其SAS软件实现过程[A];华东地区第十次流行病学学术会议暨华东地区流行病学学术会议20周年庆典论文汇编[C];2010年
2 施红英;沈毅;;混合模型在临床试验重复测量资料中的应用[A];应对突发公共卫生事件论坛论文集[C];2005年
3 刘桂芬;李贤;赵晋芳;仇丽霞;冯志兰;罗天娥;李春梅;;重复测量资料的统计分析与设计研究报告[A];2005—2006山西省统计科研成果汇编[C];2006年
4 吴国华;刘兆俊;罗剑寒;罗伯华;;1989年9月20日嵩明5.1级地震的预报和重力变化[A];1990年中国地球物理学会第六届学术年会论文集[C];1990年
5 高鸿云;吴增强;邓伟;杨佐廷;朱大倩;黄玉梅;;中小学生自杀行为预防性干预的对照研究[A];2006(第三届)江浙沪儿科学术会议暨浙江省儿科学术年会论文汇编[C];2006年
6 母小真;;重复测量分析在治疗类风湿关节炎中的应用[A];海峡两岸中医药发展大会风湿论文集[C];2009年
7 章成国;王玉凯;邓其峻;孙炽津;张虹桥;黄才东;罗绍辉;王国福;李国德;邵燕;曾桄伦;谢坚;;10例急性基底动脉梗塞的动脉内溶栓疗效观察[A];第九次全国神经病学学术大会论文汇编[C];2006年
8 王玉凯;罗绍辉;章成国;邓其峻;孙炽津;张虹桥;黄才东;李国德;邵燕;;双向局部动脉内溶栓治疗急性基底动脉梗塞——附12例临床报告[A];第九次全国神经病学学术大会论文汇编[C];2006年
9 张林挺;李志敢;;重复测量资料方差分析在体育科学研究中的应用[A];第八届全国体育科学大会论文摘要汇编(二)[C];2007年
10 高鸿云;朱大倩;黄玉梅;吴增强;杨佐廷;邓伟;;中小学生自杀行为预防性干预的对照研究[A];中华医学会第十四次全国儿科学术会议论文汇编[C];2006年
中国博士学位论文全文数据库 前10条
1 罗天娥;非正态及非线性重复测量资料分析模型及其医学应用[D];山西医科大学;2007年
2 秦国友;半参数混合效应模型的稳健估计[D];华东师范大学;2007年
3 潘晓平;队列人群冠心病、脑卒中死亡的统计分析方法探讨[D];四川大学;2004年
4 毛杰;一类均值与协方差联合半参数回归模型的研究[D];复旦大学;2010年
5 杨芳;肥胖的遗传流行病学研究以及双变量关联定位的理论探讨和应用[D];湖南师范大学;2010年
6 刘颖;基于三型辨证理论体系的2型糖尿病交叉对照临床研究[D];中国中医科学院;2012年
7 夏娜;几类相关数据分析模型的研究[D];北京工业大学;2007年
8 张涛;含有测量误差的纵向数据的统计推断[D];复旦大学;2011年
9 吴义丽;中老年人老化表型的现况研究[D];青岛大学;2011年
10 郑雷;建筑工人伤害发生情况、影响因素及预防干预的效果评价[D];华中科技大学;2010年
中国硕士学位论文全文数据库 前10条
1 黄坤;新药临床试验中重复测量资料的几种统计分析方法及其应用[D];四川大学;2005年
2 高彩虹;基于广义估计方程和潜变量增长曲线模型的阿尔茨海默病健康相关生命质量动态变化研究[D];山西医科大学;2012年
3 高茂龙;分类重复测量资料广义估计方程应用[D];山西医科大学;2007年
4 闫莉;广义估计方程的渐近理论[D];广西大学;2012年
5 王小勇;基于广义非线性模型的重复测量数据的统计分析[D];华东师范大学;2004年
6 马金凤;重复测量资料内部相关系数的抽样分布[D];新疆医科大学;2005年
7 柏杨;基于二次推断函数的纵向数据半参数模型的估计[D];华东师范大学;2005年
8 王军;Kappa系数在一致性评价中的应用研究[D];四川大学;2006年
9 刘丽涛;黄芪注射液配伍血塞通注射液治疗冠心病心绞痛的临床研究[D];山西医科大学;2007年
10 成俊;以家庭为单位的整群抽样资料总体参数的GEE估计[D];南京医科大学;2008年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978