收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

山西省HIV/AIDS结核感染监测资料预测方法研究

赵晋芳  
【摘要】: 目的 为有效利用中国疾病预防控制中心(CDC)结核病管理信息系统、山西省结核病网络监测数据库和运城地区5个项目防治县已收集的TB/HIV双重感染者监测随访数据(第五轮中国全球基金TB/HIV双重感染项目)的信息,设计、修订并完善能反映山西省结核感染、结核患病和TB/HIV双重感染流行病学监测信息库;对运城地区5个项目防治县HIV/AIDS结核感染数据进行稀有事件logistic回归分析及贝叶斯估计,以进一步揭示运城地区HIV/AIDS结核感染的现状及其影响因素,并与常规分析方法进行对比研究,为制定有针对性的双向预防和防治措施提供参考;同时对传染性最强的涂阳结核病发生、流行及其变化趋势进行预测,为政府及相关部门及时采取有效措施提供依据。 方法 本课题结合山西省结核病发生特点,在利用中国疾病预防控制中心结核病信息管理系统监测数据库基础上,进一步完善、修订和编制山西省TB/HIV双重感染流行病学监测随访记录表,对山西省运城市第五轮中国全球基金结核病项目芮城、夏县、新绛、绛县、稷山5个项目防治县TB/HIV双重感染者进行监测,为山西省TB/ HIV双重感染的严重程度及影响因素评价提供基础数据。根据TB/ HIV双重感染监测数据特点,采用稀有事件logistic回归、随机效应logistic回归、贝叶斯估计等方法对HIV/AIDS结核感染概率进行估计,并对监测数据评价方法进行对比研究,全部过程采用SAS9.1.3、Stata10.0软件编程实现。利用中国疾病预防控制中心结核病信息管理系统数据,建立山西省2005年-2008年涂阳结核病例时间序列分析ARMA模型和ARIMA模型,Microsoft SQL Server Analysis Services数据挖掘模型-(Microsoft时序算法),对山西省结核病发病趋势进行预测,并对两种模型预测结果进行对比分析。 结果 1、目前国家结核病信息管理系统运转良好,信息搜集全面。结核病监测信息是进行结核病预防与控制及干预评价的基础数据,其数据质量直接影响评价效果。国家结核病监测信息系统运转良好,但结合山西工作特点,根据省结核病防治办公室工作需求,欲将结核感染,结核患病以及HIV感染等防治信息融合为统一的互联信息。本课题在现有的国家结核病管理信息系统的基础上,完善TB/HIV双重感染防治的内容,在了解山西省多年的疫情监测资料基础上,增加了TB/HIV双重感染随访及死亡登记相关调查内容,进一步完善与修订了基线调查条目,增加了结核病人的收入水平、营养状况、治疗过程记录及其副反应等,并能在监测系统中方便地提供信息整合后的TB/HIV双重感染统计分析数据库,为结核病与艾滋病防治监测数据管理与分析提供了一种模式。 2、探讨HIV/AIDS结核感染的影响因素,采用经典logistic回归分析,往往会由于反应变量的两类取值频率相差悬殊(HIV/AIDS结核感染表现为稀有医学事件),而引致不切实际的参数估计,低估稀有事件的发生概率。本课题探讨了稀有事件logistic回归校正参数和概率估计值的方法。通过原理阐述、软件编程,对监测数据分别拟合普通logistic回归、logistic回归先验校正、logistic回归MCN先验校正、logistic回归加权校正和logistic回归MCN加权校正模型,并根据Vuong检验原理编程实现非嵌套模型间的对比分析,结果显示logistic回归MCN加权校正拟合结核双重感染监测数据较好。针对稀有事件发生概率估计问题,采用最大似然估计、加权最大似然估计、近似无偏估计、近似Bayes估计方法,结果显示近似Bayes估计得到的结果最优。根据近似Bayes估计结果可知,山西省的HIV/AIDS结核感染概率约为5.0%。 3、由于五个项目监测县HIV/AIDS的结核感染率在地区之间存在组群效应,本课题采用广义线性混合效应模型进行分析,建立HIV/AIDS结核感染的随机效应logistic回归模型来解决同一地区结核感染非独立的问题。对山西省五个项目监测县HIV/AIDS结核感染实例分别采用随机效应logistic回归、稀有事件的随机效应logistic回归和稀有事件的随机效应logistic回归MCN加权校正模型进行分析,由模型拟合评价指标结果可见,稀有事件随机效应logistic回归MCN加权校正模型对数据拟合较好。CD4细胞计数水平可作为HIV/AIDS结核发病概率估计的一个预警因素, HIV/AIDSCD4计数对数值每增加一个单位,HIV/AIDS结核感染的危险性降低74.9%。 4、广义线性混合效应模型的参数估计常需要对联合似然函数数值积分或者对模型采用某种近似,限制伪似然估计方法就是对广义线性混合效应模型的一阶泰勒近似。本课题将贝叶斯估计方法引入广义线性混合效应模型的参数估计,结果显示在选取了无信息先验后,贝叶斯估计所得的后验均数与限制伪似然估计结果比较接近。 5、山西省2005年到2008年涂阳结核病例时间序列预测模型ARIMA(1,1,0)(1,1,0)12分析结果表明,2009年的新发涂阳病例数较往年会有大幅度降低,2009年3月到8月的涂阳结核病发病例数可能较高,4月份的病例数预计最多,提示结核病防治还应加大力度,重视及时防治。所建模型显示预测值和实际值平均绝对误差为136.64,平均相对误差为8.10%,拟合效果较好。Microsoft时序算法预测结果与ARIMA(1,1,0)(1,1,0)12模型预测趋势一致,各级防疫部门应根据预警信息,进一步加强2009年第二、三季度结核防治工作。 6、与ARIMA模型的拟合结果相比,2007年1月至2008年8月,Microsoft时序算法的预测平均绝对误差为116.7,平均相对误差为6.60%,而ARIMA模型的预测平均绝对误差为104.4,平均相对误差为5.90%。Microsoft时序算法的预测结果与ARIMA(1,1,0)(1,1,0)12模型基本一致,预测相对误差均较小,但Microsoft时序算法在2008年9月-12月的预测误差明显大于ARIMA(1,1,0)(1,1,0)12模型。可见在山西省涂阳结核病例预测中以ARIMA模型更好,它不仅可以通过差分运算提取序列中蕴含的季节效应和长期趋势效应等强劲的确定性信息,而且尚可利用随机信息,故其预测精度较高。 结论 1、经过修订完善的结核感染监测量表,增加了TB/HIV双重感染防治的内容,可以为结核感染与疾病的预防与治疗效果的评价提供更丰富的第一手材料,它是有效控制TB/HIV双重感染,降低HIV感染者中结核病的发病和死亡,减少结核病人中HIV的感染机会,共享结核病与艾滋病防治信息,进行资料联合评价的重要条件。 2、对稀有事件数据的分析,无论是模型的参数估计,还是预测预报,稀有事件logistic回归确实更优于普通logistic回归。因此,针对生物医学现象中发病、患病水平较低的很多疾病研究,稀有事件的logistic回归是一种值得推广的应用统计模型。然而实际应用中是否有必要对稀有事件的logistic回归进行参数和预测概率校正,也即是稀有事件logistic回归相对普通logistic回归的模型选择问题。由于两者之间不是嵌套的关系,而是竞争性的非嵌套非线性模型,所以本文首先提出将Vuong检验作为评价模型好坏的检验方法,其原理易于理解,可在SAS软件中编程实现,结果评价合理,能解决实际应用问题,是值得推崇的一种方法。 3、在贝叶斯假定下,对参数指定无信息先验,应用MCMC技术进行广义线性混合效应模型参数估计,得到了和限制伪似然估计一致的结果,为广义线性混合效应模型提供了另一种有效的分析途径。随机效应logistic回归的贝叶斯估计相对限制伪似然估计,结果更精确,解释更合理,尤其是在能执行贝叶斯分析的统计软件的支持下,贝叶斯估计更具优势。 4、时间序列模型(ARMA模型)可方便地处理平稳序列问题,而实际应用中许多非平稳序列经过差分运算后会表现出平稳序列的性质,ARIMA模型就是差分运算与ARMA模型的结合,对序列数据的拟合效果较好,是传染病尤其是结核病发病趋势预测中实用性较强的数学模型与预测工具。依据模型分析应用条件,选择恰当的分析模型是ARIMA模型保证预测效果的关键。 5、本研究首次将Microsoft时序算法引入医学时序资料的统计分析中,构建了山西省2005年1月至2008年12月CDC结核病管理信息涂阳结核病例数训练模型,作为一种新的预测算法,它将自回归和决策树技术结合在一起,丰富了医学时序资料的预测方法。虽然本例中Microsoft时序算法的预测误差略大于ARIMA模型,预测效果的稳健性尚有待继续探讨,但其原理简单易于理解,软件操作方便,便于基层监测数据快速分析,亦不失是一种值得推广学习的新方法。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 陈湘,申东球,李峻岭,陈曦,易映群;1998~2001年湖南省怀化市HIV/AIDS流行病学分析[J];华南预防医学;2002年01期
2 杨清,阿力拉曲,任宇祥,唐平,王琳琅,栾荣生,穆世惠,李佳圆,吉力日呷,罗小艳;少数民族农村贫困地区HIV/AIDS综合干预研究[J];预防医学情报杂志;2003年03期
3 ;HIV感染者和患者关怀支持模式[J];预防医学情报杂志;2003年S1期
4 顾奎兴;中医药在防治HIV/AIDS中大有作为[J];江苏药学与临床研究;2003年03期
5 王桂香;开远市艾滋病流行病学调查与预防控制研究[J];现代预防医学;2004年01期
6 刘颖;李燕燕;王健;;HIV/AIDS患者依从性现状与分析[J];中国中医基础医学杂志;2008年06期
7 严延生,陈舸,郑兆双,翁育伟,郑健,颜苹苹,王惠榕,陈亮;福建省艾滋病流行态势及影响因素的分析[J];海峡预防医学杂志;2000年04期
8 林矛,林鹏,李晖,曾常红,王晔,李艳;广东省HIV/AIDS流行病学研究[J];中国艾滋病性病;2001年01期
9 吴宝生,王桂香,王文忠;联合国儿童基金会/云南省HIV/AIDS预防控制与关怀项目在开远的进展[J];卫生软科学;2002年05期
10 黄奕标,钟金群;清远市HIV/AIDS流行现状及防控对策[J];现代预防医学;2002年05期
11 李松柏;某高校医学生艾滋病知识来源与态度调查分析[J];宜春学院学报;2002年06期
12 邱丽华;刘志敏;马欣;王学东;蒋雪玲;;HIV/AIDS人群预防性抗结核治疗研究现况[J];现代预防医学;2007年10期
13 刘淑贞,傅继华,苏生利,刘传新;对山东省艾滋病病毒感染者管理工作的探讨[J];中国艾滋病性病;1999年04期
14 王辉,唐蔚,杨桂林,张瑛,周伯平;应用流式细胞仪研究深圳地区健康成人及HIV/AIDS患者的免疫状况[J];岭南皮肤性病科杂志;2003年01期
15 王素芬,董仲莲,冯贤斌,张海楚,俞苗明,赵丽兵,刘年军;2264例海洛因依赖者HIV抗体检测结果分析[J];中国药物滥用防治杂志;2003年04期
16 王建平,蔺秀云,吴昊,汤宜朗,陈海勇,苏文亮,王珊珊;HIV/AIDS主要临床测查工具简评[J];中国临床心理学杂志;2004年02期
17 陈家学,汪渔镇;论AIDS高发区经输血传播HIV的防范措施[J];中国艾滋病性病;2001年06期
18 李化荣;焦作市不同人群HIV/AIDS流行情况分析[J];河南预防医学杂志;2003年01期
19 明永济,武有苍,瞿炳生,宋德清,康永然;盈江县农村HIV/AIDS关怀经验[J];卫生软科学;2002年05期
20 杨清,阿力拉曲,任宇祥,唐平,吉力日呷,罗小艳;少数民族农村地区结合扶贫的HIV/AIDS综合防制模式研究[J];预防医学情报杂志;2003年S1期
中国重要会议论文全文数据库 前10条
1 吴炎;杜栋;;改进BP神经网络及其对江苏省粮食产量的仿真预测[A];决策科学与评价——中国系统工程学会决策科学专业委员会第八届学术年会论文集[C];2009年
2 张玉峰;贾成刚;张文喜;;应用时间序列评估人工增雨效果[A];推进气象科技创新加快气象事业发展——中国气象学会2004年年会论文集(下册)[C];2004年
3 王永忠;曾昭磐;;混沌时间序列点预测方法研究[A];1999中国控制与决策学术年会论文集[C];1999年
4 王波;张斌;;一种基于云模型的时间序列特征表示方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
5 王有良;周文国;;基于时间序列的基坑水平变形预测模型[A];《测绘通报》测绘科学前沿技术论坛摘要集[C];2008年
6 王玉涛;程国辉;周建常;王师;;神经网络在高炉铁水硅含量预报中的应用[A];1998中国控制与决策学术年会论文集[C];1998年
7 许伦辉;傅惠;徐建闽;;基于分形维数的交通流预测模型及算法研究[A];2003年中国智能自动化会议论文集(下册)[C];2003年
8 胡坤;刘思峰;;时间序列灰色定权聚类模型[A];2004年中国管理科学学术会议论文集[C];2004年
9 蒋斌松;韩立军;贺永年;;时间序列Lyapunov指数的估算及预测[A];矿山建设工程新进展——2005全国矿山建设学术会议文集(下册)[C];2005年
10 何全军;曹静;张月维;;基于MODIS的广东省植被指数序列构建与应用[A];中国气象学会2007年年会生态气象业务建设与农业气象灾害预警分会场论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 赵晋芳;山西省HIV/AIDS结核感染监测资料预测方法研究[D];山西医科大学;2009年
2 杨正瓴;时间序列中的混沌判定、预报及其在电力系统中的应用[D];天津大学;2003年
3 张晓伟;水文动力系统自记忆特性及其应用研究[D];西安理工大学;2009年
4 崔亚强;沪深300股指内在复杂性分析及预测研究[D];天津大学;2010年
5 倪丽萍;基于分形技术的金融数据分析方法研究[D];合肥工业大学;2010年
6 刘大同;基于Online SVR的在线时间序列预测方法及其应用研究[D];哈尔滨工业大学;2010年
7 张永林;车辆道路数值模拟与仿真研究[D];华中科技大学;2010年
8 杨谈;网络混沌行为及其控制的研究[D];北京邮电大学;2009年
9 李星毅;基于相似性的交通流分析方法[D];北京交通大学;2010年
10 肖辉;时间序列的相似性查询与异常检测[D];复旦大学;2005年
中国硕士学位论文全文数据库 前10条
1 Ashraf Fetoh Eata;[D];厦门大学;2001年
2 王丽敏;两类模糊随机时间序列预测方法[D];河北大学;2001年
3 王琦;时间序列在油田效益审计中的应用[D];吉林大学;2009年
4 韩冬梅;基于P2P的教学信息资源负载均衡调度算法的研究[D];哈尔滨工程大学;2010年
5 张雷;多层次分布式智能决策支持系统及应用研究[D];西北工业大学;2006年
6 王金翠;基于实测数据的风电场风速和风功率短期预测研究[D];东北电力大学;2010年
7 赵松雷;基于频谱仪的无线自动测试系统与信号特性分析[D];北京邮电大学;2010年
8 姚兰;中国民办高等教育市场空间研究[D];河南大学;2007年
9 吴烨清;时间序列理论在软件可靠性建模中的应用和研究[D];华中农业大学;2009年
10 曹晓琴;非线性优化的混合算法及其应用[D];燕山大学;2010年
中国重要报纸全文数据库 前10条
1 记者 陈青;结核感染防治新添潜在靶标[N];文汇报;2011年
2 ;《时间序列与金融数据分析》[N];中国信息报;2004年
3 记者 刘海英;一单克隆抗体可防肺结核感染[N];科技日报;2011年
4 东证期货 王爱华 杨卫东;两年涨跌轮回 秋季普遍下跌[N];期货日报;2009年
5 本报记者 刘松柏;“超级月球”引发地震不成立[N];经济日报;2011年
6 权证一级交易商 国信证券;正股走势及时间序列主导下半年权证市场运行结构[N];证券时报;2006年
7 房鹏;数码书信寄真情[N];中国电脑教育报;2005年
8 刘丽萍;时间序列季节调整描述经济活动的利器[N];中国信息报;2000年
9 西南证券高级研究员 董先安德圣基金研究中心 郭奔宇;预计6月CPI同比上涨7.2%[N];证券时报;2008年
10 桑雪玫;防治结核 坚持不懈[N];中国老年报;2006年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978