基于机器学习的住院心力衰竭患者恶性心律失常风险预测研究
【摘要】:研究目的1.通过区域多中心、前瞻性心力衰竭(心衰)队列研究,全面分析安徽地区住院心衰患者的流行病学特征和临床诊治现状,并与国内、外相关研究进行横向与纵向对比,为提升区域心衰诊疗水平和开展后续研究提供参考依据。2.调查安徽地区心衰患者院内恶性心律失常(Malignant arrhythmias,MA)事件的发生率,因MA事件死亡率,筛选心衰患者住院期间发生MA事件的重要风险因素。3.针对住院心衰患者MA风险评估的临床难题,探索应用机器学习方法构建MA风险预测模型的可行性,并验证预测模型性能。研究方法1.本研究的受试者来源于安徽省心力衰竭队列研究(注册号:ChiCTR-POC-16010100)。研究对象为2016年12月至2018年10月期间因心力衰竭于16家参研医院心内科接受住院治疗的患者。根据研究的纳入和排除标准,2794例心衰患者的临床资料被纳入最终的统计分析。详细采集患者的人口统计学特征、心衰病因与合并症、心脏手术史、入院时的生命体征、心电图与超声心动图检查指标、实验室检验指标和住院期间的药物治疗信息,记录院内MA事件和死亡事件。本研究中MA事件定义为住院期间需静脉应用抗心律失常药物或电复律/电除颤干预的持续性室性心动过速或心室颤动。2.根据院内MA事件终点将研究对象分为MA事件组和无MA事件组,分析两组间的基线特征差异,筛选心衰患者住院期间发生MA事件的潜在风险因素。将研究对象以7:3的比例随机分为训练集(1964例)和验证集(830例)。在训练集中分别运用最小绝对收缩和选择算子(Least absolute shrinkage and selection operator,Lasso)-Logistic 回归、多元自适应回归样条(Multivariate adaptive regression splines,MARS)、分类回归树(Classification and regression tree,CART)、随机森林(Random forest,RF)和极限梯度提升(eXtreme gradient boosting,XGBoost)5种机器学习算法构建MA风险预测模型,并根据临床特征对MA事件的贡献度对变量重要性进行排序。在训练集中初步评估预测模型性能,在验证集中进行验证。绘制受试者工作特征曲线(Receiver operating characteristic curve,ROC),计算曲线下面积AUC(Areaunderthecurve,AUC)评估预测模型的区分度。绘制校准图可视化评估预测模型的校准度,计算Brier分数进一步量化。此外,对于Lasso-Logistic 模型,采用临床决策曲线分析法(Decision Curve Analysis,DCA)评估其临床有效性。结果1.安徽地区住院心衰患者的年龄中位数为70(61,77)岁,以男性(60.5%)为主。NYHA心功能分级Ⅱ级-Ⅳ级的患者分别占18.2%,50.3%和31.6%。射血分数保留型心衰患者的比例(43.1%)高于射血分数降低型心衰(39.0%)和射血分数轻度降低型心衰(17.9%)。住院心衰患者最常见的病因与合并症是高血压病(51.5%),其次是冠心病(45.5%)、心房颤动或心房扑动(35.6%)和糖尿病(22.2%)。住院期间ARNI/ACEI/ARB、β受体阻滞剂和醛固酮受体拮抗剂的使用率分别为65.6%、64.1%和89.4%。患者住院时间中位数为9(7,12)天,117例患者住院期间发生了 MA事件(4.2%),49例患者发生院内死亡(1.8%)。其中,因MA事件死亡14例(0.5%,占总死亡人数的28.6%)。院内MA事件的单因素分析提示,56项临床特征是MA事件的潜在风险因素。2.本研究应用5种机器学习算法构建了 6个独立的MA风险预测模型。在训练集中,XGBoost 模型的 AUC 值最高(AUC:0.998[95%CI 0.997-1.000]),高于其他模型(P均0.001)。在验证集中,Lasso-Logistic 模型 1(AUC:0.867[95%CI 0.819-0.915])、Lasso-Logistic 模型 2(AUC:0.828[95%CI 0.764-0.892])、MARS 模型(AUC:0.852[95%CI 0.793-0.910])、RF 模型(AUC:0.804[95%CI 0.726-0.881])和XGBoost模型(AUC:0.864[95%CI 0.810-0.918])间的AUC值差异无统计学意义(P 均0.05),但是均高于 CART 模型(AUC:0.743[95%CI 0.661-0.824],P均0.05)。所有预测模型的Brier分数均远小于0.25。DC A结果显示Lasso-Logistic模型具有临床净获益,当阈值概率≤40%时,Lasso-Logistic模型1优于模型2。口服抗心律失常药物、完全性左束支传导阻滞(Left bundle branch block,LBBB)、血清镁、D-二聚体和随机血糖是半数及以上预测模型中的重要风险因素。结论1.本研究较为全面地描述了安徽地区住院心衰患者的流行病学特征和临床诊治现状,首次报告并分析了区域心衰患者院内MA事件的发生率及其风险因素,为公共卫生干预和进一步的研究提供了重要参考。2.基于Lasso-Logistic、MARS、RF和XGBoost算法的机器学习模型能够有效预测住院心衰患者的MA风险。其中,Lasso回归有效克服了传统统计分析方法在复杂数据处理和特征选择中的不足。与其他模型相比,Lasso-Logistic联合模型兼具预测准确性、临床可解释性和易用性。3.口服抗心律失常药物、LBBB、血清镁、D-二聚体和随机血糖是心衰患者住院期间发生MA事件的重要风险因素,临床工作中应加强关注。