新型冠状病毒肺炎多时空尺度流行特征、影响因素及风险预测研究
【摘要】:研究背景自上世纪70年代以来,随着人类社会经济水平快速提升和全球化贸易日益增多,人类跨生态地理边界的频繁活动对环境造成了一定程度破坏,加剧了多种新发传染病的产生、暴发和流行,对人类健康已产生巨大威胁。开展新发传染病的流行特征、影响因素和传播风险研究,对完善疾病防控策略和措施具有重大公共卫生意义。2019年12月,中国武汉首次报告了由新型冠状病毒(Severe acute respiratory syndrome coronavirus 2,SARS-CoV-2)导致的新型冠状病毒肺炎(Coronavirusdisease2019,COVID-19,简称“新冠肺炎”),这种新发传染病传播力强,在短期内迅速波及至世界范围并造成了大流行。目前多个国家和地区对新冠肺炎的流行趋势、临床症状、病原学、免疫学、诊疗方法和防控措施等方面进行了描述性研究,但关于其分布特征的研究较少且结论不同,缺乏不同城市化水平地区新冠肺炎流行特征比较和流行模式划分。研究显示人口密集场所新冠肺炎暴发风险较高,其中医院因其特殊职能,若稍有疏忽便会成为病毒传播的枢纽,因此需重点关注医务人员(Healthcareworker,HCW)的新冠肺炎感染特征和影响因素,但这方面的调查多为单中心研究,难以整体认知疾病感染特征和因素,缺乏多中心、代表性好、可比性强的比较研究。明确新发传染病传播的影响因素是实现其预警和防控的前提,以往研究显示交通和气象可显著影响新型冠状病毒传播,但不同的交通方式如公路、铁路和航空的量化效应仍有待研究;以往关于气象效应的结论不一致,且缺乏气象因素间交互作用的探讨。目前对于新冠肺炎的传播风险预测多基于时间框架,较少基于空间框架,且研究尺度粗糙,缺少精度高、范围广、实用性强的预测预警技术。本研究以新冠肺炎作为结局变量,结合时空信息技术,基于中国大陆范围多时空尺度,描述不同城市化水平地区新冠肺炎的流行特征;揭示HCW新冠肺炎多中心感染特点和因素;探讨影响新冠肺炎广域传播和局域扩散的交通、气象因素及其交互作用;建立新冠肺炎传播风险高分辨率预测模型及其简化模式;以期在我国新冠肺炎防控的新常态阶段,为公共卫生政策措施的制定和实施提供科学依据和指导方案。研究目的1.描述新冠肺炎在我国大陆不同城市化水平地区的三间分布、时空聚集性、流行模式分区和阶段性政策措施带来的影响。2.比较武汉市HCW与非医务人员(non-HCW)新冠肺炎患者的基本特征、发病到诊断时间间隔和时空分布差异,探究HCW发病和恶化的影响因素。3.探究交通因素对于新冠肺炎广域传播的影响、气象因素对于新冠肺炎局域扩散的影响及其交互作用。4.利用以上研究识别的影响因素,纳入其他社会经济因素或夜间灯光数据,建立中国大陆新冠肺炎传播风险预测预警模型。研究方法1.数据收集(1)中国大陆新冠肺炎疫情病例数据:2019年12月8日至2020年2月27日的病例数据由国家法定传染病监测报告系统提供,2020年2月28日至4月14日的病例数据收集于各省市卫生健康委员会的官方网站(简称:卫健委官网)。2020年6月北京市新冠肺炎暴发数据收集于北京市卫健委官网,2021年1月河北省新冠肺炎暴发数据收集于河北省卫健委官网。(2)人口数据:全国县区级常住人口数据来自全国第六次人口普查资料,县区级人口密度数据由常住人口数除以县区面积计算得出。(3)武汉市医疗卫生数据:武汉市新冠肺炎定点医院名单来自湖北省卫健委官网。武汉市主要医院医务人员、护士、病床总数,医院级别和类型数据摘自《武汉市卫生统计年鉴》。(4)社会经济数据:铁路、高速公路和国道的地理信息数据来自国家地球系统科学数据中心,机场位置数据下载自OurAirports网站。全国超市和商场兴趣点地理定位数据提取自百度地图拾取坐标系统。(5)气象数据:疫情期间日均气温、温差、相对湿度、日照时数、风速和累积降水量数据来自中国气象数据共享服务系统。(6)夜间灯光数据:夜间灯光指数数据提取自中国科学院中国遥感卫星地面站。根据具体研究目标对以上数据进行核对、整理和清洗后,融合形成相应建模数据集。2.统计学分析(1)应用百度地理编码服务将新冠肺炎病例现居地地址定位至乡镇级,并依据人口数据划分标准,将其划分为街道、镇和乡三种城市化水平。比较新冠肺炎在不同省份和城市化水平地区的罹患率、重症率、病死率和三间分布。在县区水平进行时空分析,使用Space-time permutation model识别时空聚集区。计算每个省的新型冠状病毒有效再生数(Effectivereproductionnumber,Rt)以识别新冠肺炎流行模式,进而对Rt进行Q型分层聚类,进行省级流行模式分区。(2)比较武汉市HCW和non-HCW的新冠肺炎疾病特征,比较二者发病的时空聚集性和传播动力学特点。分别使用多元线性回归和逐步logistic回归探讨HCW发病和重症的影响因素。(3)使用逐步logistic回归在县区尺度探索交通因素对新冠肺炎广域传播的作用。构建广义加性模型(Generalized additive model,GAM)在县区尺度测量气象因素对新冠肺炎局域扩散的非线性效应,根据各自变量之间的相关性,使用“自下而上”策略与赤池信息准则进行模型选择,采用惩罚样条函数用于平滑和评价气象因素间两两交互作用,构造二元反应曲面进行交互作用可视化。使用线性混合效应模型(Linear mixed-effects model,LMM)根据GAM获得节点进行分段建模,量化气象因素影响。(4)使用最大熵生态位机器学习算法,纳入多社会经济因素(包含交通因素)与气象因素构建原始模型,对2019年末中国大陆新冠肺炎疫情数据进行训练和内外验证。使用2020年6月北京市新冠肺炎疫情和2021年1月河北省新冠肺炎疫情数据进行实证研究。模拟重点季节和地区新冠肺炎疫情暴发,进行全国范围0.1°×0.1°高分辨率传播风险预测。使用夜间灯光数据代替多社会经济因素构建简化模型,重复训练、验证、实证和模拟过程,评价简化模型的实用性。本研究应用的软件主要有:Microsofto ffice2016、ArcGIS 10.2、R 3.6.1、SaTScanv9.6、Maxent 3.3.3k、Adobe Illustrator CC 2015 等。研究结果1.从2019年12月8日至2020年2月27日,全国共报告了 78831名新冠肺炎病例,总体罹患率为59.2/百万人,罹患率从高到低为街道、镇和乡。全国新冠肺炎总体重症率为18.0%,重症率从高到低为街道、镇和乡。全国新冠肺炎总体病死率为4.0%,病死率从高到低为街道、乡和镇。湖北省报告的发病数、重症数和病死数均占全国总体的大部分。全国新冠肺炎总体罹患率男女性别比为0.94,但有18个省份性别比大于1,街道、镇和乡的罹患率男女性别比递增,分别为0.90、1.12和1.20。全国新冠肺炎患者中位年龄为52(四分位间距Interquartile range,IQR 39,64),街道患者中位年龄显著高于镇和乡。全国总体新冠肺炎患者职业占比前三位为离退人员、家务及待业和农民,街道患者的职业分布与全国总体相似,但镇和乡的农民约占半数。HCW街道病例数远远高于镇和乡。发病时间流行曲线结果显示,镇和乡的病例快速增长期晚于街道,但三者流行高峰出现时间基本一致。时空聚集分析结果显示,全国有24个省会城市存在聚集区。我国新冠肺炎流行模式按Rt的特点可分为五类。我国对新冠肺炎疫情的防控措施两周内控制了其暴发趋势,而复工复产等放宽措施并未引起疫情反弹。2.武汉市HCW的新冠肺炎罹患率比non-HCW高约4倍,HCW罹患率最高的医院其值高达11.9%,但HCW病例的重症率和病死率显著低于non-HCW。HCW和non-HCW病例从发病到诊断的时间间隔没有显著差异,中位数(IQR)为10(5,16),但从2020年1月中旬开始,HCW病例从发病到诊断的中位时间明显短于non-HCW。在non-HCW 病例较多地区的区级医院工作的 HCW 更容易感染新冠肺炎。与在感染科工作的HCW病例相比,在一般科室、眼科和呼吸科工作的HCW病例更易发展为重症。3.在调整人口密度和到武汉的距离后,有铁路、高速公路、国道穿过或有机场的县区新冠肺炎发病风险显著高于其他县区,调整后的比值比(oddsratio,OR)分别为1.40(95%CI 1.14-1.72),2.07(95%CI 1.61-2.67),1.31(95%CI 1.02-1.68),和 1.70(95%CI 1.31-2.22)。GAM和LMM的结果显示,新冠肺炎的发病与气象因素呈非线性关系,高罹患率与较低平均温度、中等累积降水和较高风速显著相关。上述三个气象因子之间存在显著两两交互作用,低温和中等降水的地区新冠肺炎发病风险较高;温暖地区新冠肺炎发病风险与风速呈正相关。4.内部验证结果显示,原始和简化模型的受试者工作特征曲线(Receiver operating characteristic,ROC)的曲线下面积(Area under the curve,AUC)均在 0.8 左右,模型表现佳。外部验证结果显示,原始模型和简化模型对较高以上风险地区预测准确率较高,达到了 70%以上,原始模型和简化模型分别对较高风险和高风险地区预测有优势。各种因素对于预测的贡献度差异显著,原始模型中贡献度高的因素为人口密度、到流行中心的距离、超市和商场总数,简化模型中贡献度高的因素为到流行中心的距离和夜间灯光指数。实证研究结果显示两种模型对新冠肺炎冬季疫情的外推性较好。模拟冬季重点地区的新冠肺炎疫情,发现两种模型对较高以上风险地区预测范围大体一致。研究结论1.2019年末至2020年初的中国大陆新冠肺炎疫情期间,街道地区中老年、女性和离退人员感染新冠肺炎的风险较高;镇和乡中年、男性和农民感染新冠肺炎的风险较高。HCW在街道的感染人数远远高于镇和乡。新冠肺炎可能从城市传播至农村。时空分析将全国省份分为了五种流行模式,并提示新冠肺炎可通过全国广域传播和局域扩散迅速造成大范围影响。2.武汉市HCW新冠肺炎罹患率高于non-HCW,高危地区的低级别医院应更注意新冠肺炎的院内传播防控。尽管综合医院配备了感染科和呼吸科,但普通科室(尤其是眼科)的HCW也应警惕新冠肺炎并做好防护。3.公共交通是新冠肺炎在中国大陆广域传播的危险因素,气温、降水和风速可以显著影响新冠肺炎的本地扩散。交通发达、低温和中等降水的地区新冠肺炎发病风险较高,风速较高的温暖地区发病风险也较高。因此,具备上述条件的国家和地区应注意采取有效措施遏制新冠肺炎的传播。4.本研究建立的最大熵生态位模型在预测中国大陆重点城市和季节新冠肺炎暴发初期的传播风险方面具备高精确性的独特优势。夜间灯光数据的应用可使模型的构建更加简便,方便一线公共卫生工作者使用,为其它传染病的预测预警提供了方法学参考。创新性1.本研究发现2019年末至2020年初中国大陆新冠肺炎疫情期间,街道的中老年、女性和离退人员新冠肺炎感染风险较高;镇和乡的中年、男性和农民新冠肺炎感染风险较高。此外,本研究对新冠肺炎的流行模式进行了省级划分,以上结果目前未见报道。2.本研究在县区尺度探讨了中国大陆交通和气象因素对于新冠肺炎传播的影响,并报道了温度、降水和风速对于新冠肺炎传播的两两交互作用。3.本研究建立了中国大陆范围高分辨率新冠肺炎传播风险预测预警模型,并使用夜间灯光数据代替传统多社会经济因素进行模型简化研究,为其它传染性疾病的预警提供了方法学参考。