2. 南昌大学公共卫生学院,江西 南昌 330000
2. School of Public Health, Nanchang University, Nanchang 330000, China
脑卒中是一种因大脑血液循环障碍而导致脑功能障碍的疾病,以高发病率、高致残率、高病死率、高复发率、高经济负担为共同临床特征[1]。脑卒中是成人致残、致死首位原因,年死亡人数约为150万,致残率约为75%[2-5]。目前,急性缺血性脑卒中患者医院感染已成为全球关注的公共卫生问题,其不仅会增加患者致残率、致死率,影响患者的预后,还会增加患者家庭以及社会的经济负担[6]。近年来,随着信息科技化的不断发展,国内外学者致力于利用机器学习算法辅助医疗诊断与疾病预测[7-11]。医院感染作为急性缺血性脑卒中常见并发症,其严重影响了患者的预后,早预测、早干预对改善患者预后意义重大[12]。本研究采用机器学习算法建立急性缺血性脑卒中患者医院感染预测模型,有效预测缺血性脑卒中患者发生医院感染情况,为临床决策提供数据支持。
1 对象与方法 1.1 研究对象选取2020年10月—2021年12月江西省某三甲医院神经内科收治的2 360例缺血性脑卒中患者。其中男性患者1 494例,女性患者866例,年龄18~100岁,平均(61.7±20.5)岁。纳入标准:经CT、MRI诊断为急性缺血性脑卒中,住院时长>48 h;排除标准:年龄<18岁,入院48 h内存在肺部感染、尿路感染、消化道感染等其他感染,合并肝、肾功能不全或者其他严重的系统性疾病,合并肿瘤,临床资料缺失者。
1.2 观测指标所有资料来自江西省医疗大数据工程技术研究中心,且检验、检查数据均为患者入院48 h以内,具体指标如下:(1)人口统计学信息,性别、年龄;(2)疾病相关因素,意识障碍、吞咽困难、入院NIHSS评分、侵入性操作;(3)合并症,高血压、糖尿病、高脂血症、冠状动脉疾病、房颤;(4)既往史,糖尿病史、高血压史、脑血管病史、慢性阻塞性肺疾病(COPD)史;(5)个人史,吸烟、饮酒;(6) 检验指标,血小板计数、糖化血红蛋白、血白细胞、血前白细胞、血中性粒细胞、血红细胞分布宽度、血清脂蛋白a、血清钠、血清钾等指标。
1.3 诊断标准参照中华人民共和国卫生部2001年颁布的《医院感染诊断标准(试行)》进行诊断[13]。
1.4 研究方法应用SPSS 22.0和python 3.7进行数据统计分析。符合正态分布的计量资料用均数±标准差(x±s)表示,组间比较采用t检验,偏态分布的计量资料采用中位数(四分位数间距)[M(QR)]表示,两组间比较采用非参数检验。计数资料采用频数和百分率(%)描述,组间比较采用χ2检验或者Fisher确切概率法,P≤0.05为差异存在统计学意义。将研究对象按照8 ∶2的比例随机拆分训练集与测试集。采用python 3.7作为模型开发工具,利用pandas库进行数据预处理,sklearn库进行logistics回归以及RandomForest、XGBoost、LightGBM算法模型的构建。采用5折交叉验证的方法训练模型和网格寻优搜索获取模型最优参数。采用准确率、灵敏度、特异度以及受试者工作特征曲线下面积(AUC)评价模型预测性能。利用SHAP对模型特征重要性进行量化以及个体特征影响进行归因分析。
2 结果 2.1 急性缺血性脑卒中患者医院感染情况2 360例急性缺血性脑卒中患者发生医院感染574例,医院感染发生率为24.32%。其中肺部感染396例,感染率为16.78%;呼吸道感染64例,感染率为2.71%;泌尿感染77例,感染率为3.26%;胃肠道感染27例,感染率为1.14%;其他感染(口腔、皮肤等)共33例,感染率为1.40%;两个部位感染共23例,感染率为0.97%。
2.2 医院感染危险单因素分析将患者以入院48 h后是否发生感染分为感染组与未感染组,单因素分析结果显示:脑血管病史、慢性阻塞性肺疾病(COPD)史、房颤、高脂血症、吸烟、饮酒、侵入性操作、意识障碍、吞咽困难、电解质紊乱、血清钠、血前白蛋白、血清蛋白、血总蛋白、血白细胞、血中性粒细胞、血红细胞分布宽度、血葡萄糖、入院NIHSS评分、年龄两组比较,差异均存在统计学意义(均P<0.05)。见表 1。
表 1 急性缺血性脑卒中患者医院感染组与未感染组患者基线资料 Table 1 Baseline data of AIS patients in HAI group and non-infected group |
![]() |
将上述单因素分析筛选出具有统计学意义的变量作为自变量纳入到多因素logistic回归分析模型中,以入院48 h后是否发生医院感染作为因变量,其中年龄(赋值:≤65岁=0,>65=1)、入院NIHSS评分(赋值:≤5=0,>5=1)、血白细胞(赋值:≤10=0,>10=1)、血清钠(赋值:>135=0,≤135=1),logistic回归分析显示,年龄>65岁、入院NIHSS评分>5分、血清钠≤135 mmol/L、血白细胞>10×109/L)、侵入性操作、吞咽困难均为急性缺血性脑卒中患者发生感染的独立危险因素(均P<0.05),见表 2。
表 2 脑卒中医院感染多因素logistics回归分析 Table 2 Multivariate logistic regression analysis on HAI in AIS patients |
![]() |
将单因素分析筛选出具有统计学意义的变量纳入至模型中,分别建立基于logistic回归、RandomForest、XGBoost、LightGBM的医院感染预测模型。计算模型的灵敏度、特异度以及AUC。结果显示,logistics回归、RandomForest、XGBoost、LightGBM模型预测阈值分别为0.137、0.117、0.114、0.129。在测试集集中,logistics回归、RandomForest、XGBoost、LightGBM模型预测医院感染的AUC值分别是0.854、0.850、0.881、0.870。LightGBM算法特异度最高;XGBoost模型AUC值、准确性、灵敏度均为最高。XGBoost的整体的预测效果优于其他三种模型,见表 3和图 1。校准曲线显示,4种机器学习模型均表现出良好的校准度,预测概率与实际概率之间没有明显的偏差。其中XGBboost与LightGBM模型具有较高的区分度,见图 2。
表 3 4种算法模型在测试集中预测效果比较 Table 3 Comparison of prediction efficacy of four algorithm models in test set |
![]() |
![]() |
图 1 4种算法模型的预测性能比较 Figure 1 Comparison of prediction performance of four algorithm models |
![]() |
图 2 4种算法模型的校准曲线 Figure 2 Calibration curves for four algorithmic models |
SHAP是由Shapley value启发的可加性解释模型。通过shap.summary_plot方法对特征进行整体的可视化。如图 3所示,模型前8贡献特征,每一行代表一个特征,横坐标为SHAP值。一个点代表一个样本,颜色越红说明特征本身数值越大,颜色越蓝说明特征本身数值越小。基于SHAP解释XGBoost模型的医院感染影响因子可以直观地看到年龄越大、血白细胞值越高、入院NIHSS评分越高、侵入性操作、意识障碍以及吞咽困难与医院感染呈正相关。血总蛋白、血清钠与医院感染呈负相关。
![]() |
图 3 XGBoost模型影响因子 Figure 3 Factors influencing XGBoost model |
对每个预测样本,模型都产生一个预测值,SHAP值就是该样本中每个特征所分配到的数值。如图 4所示:患者A的SHAP值为-2.02,小于模型预测基础值,模型预测该患者不会出现医院感染。患者A入院NIHSS评分<5分、未出现侵入性操作、血总蛋白为68.14 g/L、血白细胞<10×109/L及意识障碍为蓝色,象征着这些特征将患者A的SHAP值拉低,对结果起负向作用。此外,年龄>65岁为红条,象征着其对医院感染起正向作用。如图 5所示:患者B的SHAP值为-0.10,大于模型预测基础值,模型预测该患者会发生医院感染。患者B未出现侵入性操作以及血白细胞<10×109/L为蓝色,起保护作用,年龄>65岁、血总蛋白为71.17 g/L、入院NIHSS评分>5分及吞咽困难为红色,这些因素对患者B发生医院感染起正向作用,且吞咽困难最宽,影响作用最大,应注意防范,防止发生医院感染。
![]() |
图 4 患者A模型评估 Figure 4 Model evaluation for patient A |
![]() |
图 5 患者B模型评估 Figure 5 Model evaluation for patient |
医院感染是急性缺血性脑卒中患者主要的并发症, 其不仅延长住院时间,增加治疗费用,而且可以导致病情加重和病死率升高[14]。据统计,急性缺血性脑卒中患者医院感染发生率约为20%,主要有肺部感染、呼吸道感染、泌尿感染、胃肠道感染等[15]。本组2 360例急性缺血性脑卒中患者中574例发生医院感染,感染发生率为24.3%,与以往的研究[16]结果基本一致。
本研究采用logistic回归以及RandomForest、XGBoost、LightGBM三种机器学习算法将单因素筛选的20个具有统计学差异的特征纳入模型,构建急性缺血性脑卒中患者医院感染预测模型,结果显示, 在测试集中logistics回归、RandomForest、XGBoost、LightGBM模型预测医院感染的AUC值分别是0.854、0.850、0.881、0.870。XGBoost准确性、灵敏度、AUC值均最高为0.858、0.730、0.881。LightGBM回归特异度最高为0.905。XGBoost整体的预测效果优于其他三种模型,可为前瞻性研究提供相应支持。在后续研究中可开发应用于临床的预测软件,早期预测缺血性脑卒中患者医院感染。
基于XGBoost算法的急性缺血性脑卒中医院感染预测模型SHAP特征解释:年龄越大、血白细胞值越高、入院NIHSS评分越高、侵入性操作、意识障碍、吞咽困难、血总蛋白越低、血清钠越低是医院感染的影响因素,与多因素logistic回归分析中差异有统计学意义的变量具有高度的一致性。分析原因主要为:随着年龄的增长,高龄患者出现生理机能下降,抵抗力降低,易发生医院感染,与研究[17]报道一致。患者由于存在意识障碍、吞咽困难等原因易出现呛咳和误吸,且部分患者需要进行侵入性操作,该操作将导致病原体进入体内发生感染[18-19]。入院NIHSS评分越高,患者神经功能损伤越严重,神经功能的损伤会使免疫系统出现抑制,而免疫抑制将会明显增加患者感染的概率[20]。神经功能损伤越严重日常活动能力下降也越严重,吞咽困难以及尿潴留为常见症状,需进行侵入性操作进而导致医院感染[21]。卒中时下丘脑直接或间接受损, 一方面引起抗利尿激素分泌异常, 导致尿量减少, 水潴留, 细胞外液扩张, 血钠降低, 进而引起感染;同时低血清钠与步态障碍、认知障碍、骨质疏松、跌倒等有关,当患者出现步态障碍、认知障碍、骨质疏松等症状,往往需要对患者进行侵入性操作,该操作将易引起患者出现肺部、尿道等部位的感染[22]。血总蛋白降低,会导致营养不良,免疫状态异常,身体器官可能会有积水,这些都会增加感染的机会[23]。低蛋白血症会导致有效血容量减少,血液浓缩高凝,血栓栓塞的风险增高,低蛋白血症导致严重血容量不足、急性肾静脉血栓、肾间质水肿,这些都可以引起急性肾损伤。相关研究[24]表明,在缺血性脑卒中损伤中,炎症反应发挥着重要的作用。周静等[25]对3 000例缺血性脑卒中患者随访发现,不良预后的发生率提升67%~93%。高列花等[26]研究显示, 白细胞计数越高, 急性缺血性脑卒中患者住院期间的死亡风险就越高,表明白细胞计数为预测急性缺血性脑卒中患者预后的一个有效因素。本研究发现随着白细胞计数的增加,患者出现医院感染的概率也会随之增加。
综上所述,基于机器学习算法的急性缺血性脑卒中医院感染预测模型能有效地预测患者发生医院感染情况,能够为缺血性脑卒中住院患者医院感染的预防和干预提供一定的参考。患者发生医院感染与其年龄、血白细胞、侵入性操作、入院NIHSS评分、血清钠、血总蛋白、意识障碍、吞咽困难等多种因素相关,需要患者、医护人员、家属都尽力避免一切可能引起感染的因素,尽早干预。但本研究存在一定的局限性:(1)数据仅来自江西一家医疗机构,数据可能会存在一定偏倚。(2)数据样本量不够大,模型的泛化能力还有待验证。
利益冲突:所有作者均声明不存在利益冲突。
[1] |
Lindsay MP, Norrving B, Sacco RL, et al. World Stroke Organization (WSO): global stroke fact sheet 2019[J]. Int J Stroke, 2019, 14(8): 806-817. DOI:10.1177/1747493019881353 |
[2] |
Zhou MG, Wang HD, Zeng XY, et al. Mortality, morbidity, and risk factors in China and its provinces, 1990-2017:a systematic analysis for the global burden of disease study 2017[J]. Lancet, 2019, 394(10204): 1145-1158. DOI:10.1016/S0140-6736(19)30427-1 |
[3] |
Kim AS, Johnston SC. Temporal and geographic trends in the global stroke epidemic[J]. Stroke, 2013, 44(6 Suppl 1): S123-S125. |
[4] |
Ma QF, Li R, Wang LJ, et al. Temporal trend and attributable risk factors of stroke burden in China, 1990-2019:an analysis for the global burden of disease study 2019[J]. Lancet Public Health, 2021, 6(12): e897-e906. DOI:10.1016/S2468-2667(21)00228-0 |
[5] |
《中国脑卒中防治报告》编写组. 《中国脑卒中防治报告2019》概要[J]. 中国脑血管病杂志, 2020, 17(5): 272-281. Report on stroke prevention and treatment in China Writing Group. Brief report on Stroke prevention and treatment in China, 2019[J]. Chinese Journal of Cerebrovascular Diseases, 2020, 17(5): 272-281. DOI:10.3969/j.issn.1672-5921.2020.05.008 |
[6] |
Lv Y, Chen L, Yu JW, et al. Hospitalization costs due to healthcare-associated infections: an analysis of propensity score matching[J]. J Infect Public Health, 2019, 12(4): 568-575. DOI:10.1016/j.jiph.2019.01.069 |
[7] |
Iyer A, Jeyalatha S, Sumbaly R. Diagnosis of diabetes using classification mining techniques[J]. Int J Data Min Knowl Manag Process, 2015, 5(1): 1-14. DOI:10.5121/ijdkp.2015.5101 |
[8] |
王孟, 覃露, 王春娟, 等. 基于机器学习算法的脑出血相关肺炎预测模型研究[J]. 中国卒中杂志, 2020, 15(3): 243-249. Wang M, Qin L, Wang CJ, et al. Machine learning-based models for prediction of intracerebral hemorrhage associated pneumonia[J]. Chinese Journal of Stroke, 2020, 15(3): 243-249. DOI:10.3969/j.issn.1673-5765.2020.03.004 |
[9] |
陈思玎, 刘欢, 黄馨莹, 等. 基于机器学习算法构建缺血性卒中3个月死亡预测模型研究[J]. 中国卒中杂志, 2020, 15(6): 595-599. Chen SD, Liu H, Huang XY, et al. Machine learning-based model for prediction of 90-day death after ischemic stroke[J]. Chinese Journal of Stroke, 2020, 15(6): 595-599. DOI:10.3969/j.issn.1673-5765.2020.06.004 |
[10] |
Kim SH, Jeon ET, Yu S, et al. Interpretable machine lear-ning for early neurological deterioration prediction in atrial fibrillation-related stroke[J]. Sci Rep, 2021, 11(1): 20610. DOI:10.1038/s41598-021-99920-7 |
[11] |
Seo K, Chung B, Panchaseelan HP, et al. Forecasting the walking assistance rehabilitation level of stroke patients using artificial intelligence[J]. Diagnostics (Basel), 2021, 11(6): 1096. DOI:10.3390/diagnostics11061096 |
[12] |
Muramatsu K, Fujino Y, Kubo T, et al. Efficacy of antimicrobial catheters for prevention of catheter-associated urinary tract infection in acute cerebral infarction[J]. J Epidemiol, 2018, 28(1): 54-58. DOI:10.2188/jea.JE20170022 |
[13] |
中华人民共和国卫生部. 医院感染诊断标准(试行)[J]. 中华医学杂志, 2001, 81(5): 314-320. National Health Commission of the People's Republic of China. Diagnostic criteria for nosocomial infections(proposed)[J]. National Medical Journal of China, 2001, 81(5): 314-320. DOI:10.3760/j:issn:0376-2491.2001.05.027 |
[14] |
Zonneveld TP, Nederkoorn PJ, Westendorp WF, et al. Hyperglycemia predicts poststroke infections in acute ischemic stroke[J]. Neurology, 2017, 88(15): 1415-1421. DOI:10.1212/WNL.0000000000003811 |
[15] |
Wästfelt M, Cao Y, Ström JO. Predictors of post-stroke fever and infections: a systematic review and Meta-analysis[J]. BMC Neurol, 2018, 18(1): 49. DOI:10.1186/s12883-018-1046-z |
[16] |
Suda S, Aoki J, Shimoyama T, et al. Stroke-associated infection independently predicts 3-month poor functional outcome and mortality[J]. J Neurol, 2018, 265(2): 370-375. DOI:10.1007/s00415-017-8714-6 |
[17] |
李进领, 刘威, 彭睿, 等. 缺血性脑卒中医院感染的危险因素分析[J]. 中国实用神经疾病杂志, 2018, 21(24): 2714-2718. Li JL, Liu W, Peng R, et al. Analysis of risk factors for hospital infection in cerebral ischemic stroke[J]. Chinese Journal of Practical Nervous Diseases, 2018, 21(24): 2714-2718. DOI:10.12083/SYSJ.2018.24.566 |
[18] |
Ros L, García M, Prat J, et al. Predictors of nosocomial infection in acute stroke. Relation with morbimortality and outcome[J]. Med Clin (Barc), 2007, 128(12): 441-447. DOI:10.1157/13100582 |
[19] |
门中华. 急性脑卒中合并肺部感染相关因素及对预后的影响[J]. 中华医院感染学杂志, 2012, 22(10): 2053-2055. Men ZH. Risk factors for pulmonary infections in patients with acute cerebral apoplexy and influence on prognosis[J]. Chinese Journal of Nosocomiology, 2012, 22(10): 2053-2055. |
[20] |
Lascarrou JB, Lissonde F, Le Thuaut A, et al. Antibiotic therapy in comatose mechanically ventilated patients following aspiration: differentiating pneumonia from pneumonitis[J]. Crit Care Med, 2017, 45(8): 1268-1275. DOI:10.1097/CCM.0000000000002525 |
[21] |
陈明理. 急性脑梗死卒中相关性肺炎患者的危险因素和预后相关性研究[D]. 南宁: 广西医科大学, 2014. Chen ML. Risk factors for stroke in patients with acute cerebral infarction associated pneumonia and prognostic studies[D]. Nanning: Guangxi Medical University, 2014. |
[22] |
Liamis G, Barkas F, Megapanou E, et al. Hyponatremia in acute stroke patients: pathophysiology, clinical significance, and management options[J]. Eur Neurol, 2019, 82(1-3): 32-40. DOI:10.1159/000504475 |
[23] |
Jiang AM, Shi X, Zheng HR, et al. Establishment and validation of a nomogram to predict the in-hospital death risk of nosocomial infections in cancer patients[J]. Antimicrob Resist Infect Control, 2022, 11(1): 29. DOI:10.1186/s13756-022-01073-3 |
[24] |
陈慧, 郑晓梅, 夏晓, 等. PI3KAkt信号通路对脐血间充质干细胞减轻缺血性脑损伤和炎症反应的调节作用[J]. 中国免疫学杂志, 2021, 37(2): 155-160. Chen H, Zheng XM, Xia X, et al. Regulation effect of PI3KAkt signaling pathway on umbilical cord blood mesenchymal stem cells in alleviating ischemic brain injury and inflammatory response[J]. Chinese Journal of Immunology, 2021, 37(2): 155-160. DOI:10.3969/j.issn.1000-484X.2021.02.006 |
[25] |
周静, 罗勇, 姚珊, 等. 急性缺血性脑卒中患者血清HCY、GDF-15、GFAP水平与神经功能及预后的关系[J]. 山东医药, 2017, 57(18): 46-48. Zhou J, Luo Y, Yao S, et al. Relationship between serum HCY, GDF-15, GFAP levels and neurological function and prognosis in patients with sexual ischemic stroke[J]. Shandong Medical Journal, 2017, 57(18): 46-48. |
[26] |
高列花, 郑芳, 汪俊群, 等. 急性缺血性脑卒中患者脑源性神经营养因子基因多态性与预后的相关性[J]. 中国现代医学杂志, 2015, 25(20): 63-67. Gao LH, Zheng F, Wang JQ, et al. Correlation of brain-derived neurotrophic factor gene polymorphism with prognosis in patients with acute ischemic stroke[J]. China Journal of Mo-dern Medicine, 2015, 25(20): 63-67. DOI:10.3969/j.issn.1005-8982.2015.20.013 |