基于数据挖掘技术的湖北省人类狂犬病分析预测与可视化平台搭建
【摘要】:现今,由于数据挖掘技术不断革新与完善,其已在生物医学领域中得到了较好应用。它借助统计、信息科学、可视化等多学科思想将复杂的生物医学数据转换成有用的信息,从而用于科学探索。其中,狂犬病对人类而言是一种感染其病毒后有致命伤害的人畜共患疾病,我国的发病率甚高,仅位居印度之后。因此,深入挖掘人类狂犬病流行特征,探索其发展规律,将对启发狂犬病防疫工作有着重要意义。根据现阶段人类狂犬病数据分析工作,提出以下三个科学问题:(1)如何探究狂犬病监测数据间的因果关系,并预测其未来发展趋势?(2)如何量化并探究关键因素对狂犬病发病人数的影响?(3)如何结合时间、空间及人群间三个维度调查湖北省人类狂犬病动态流行特征,并搭建一个可视化分析平台?针对以上问题,本文基于数据挖掘方法,选取湖北省人类狂犬病作为研究对象展开分析,工作内容总结如下:(1)基于湖北省狂犬病发病、狂犬病暴露和狂犬病疫苗接种的时间序列数据,利用修正的格兰杰因果检验方法挖掘三者序列间的因果关系,得到了狂犬病发病和狂犬病暴露是狂犬病疫苗接种的格兰杰原因,其余序列组合间不存在任何格兰杰因果关系的结果。然后,为预测当地狂犬病发病与狂犬病暴露的未来情况,基于二者的时序类型数据特征分别构建SARIMA预测模型。(2)从类型丰富的相关影响数据中,收集并提取与社会经济及气候相关的主要影响因素,通过构建面板回归模型得到当地常住人口数、GDP、气温、降水等因素对狂犬病发病情况的影响作用。同时,从来源复杂的湖北省遥感卫星图像和数字高程模型数据中采用地信处理方法量化提取与地理环境相关的主要影响因素,并经过差异显著性检验后发现海拔的高低程度和坡度的高低程度对狂犬病发病情况存在影响。(3)基于描述性分析和可视化技术,有机结合时间、空间和人群间三个维度,分别得到湖北省人类狂犬病发病与狂犬病暴露的季节特征、人类狂犬病发病时空动态分布特征以及人群间分布特征。此外,通过Web开发技术,搭建了一个省级人类狂犬病历史监测数据可视化分析平台以供研究人员对数据进行交互式查询与防控监管参考。