1. 引言
胃癌和结直肠癌是全球常见恶性肿瘤,据2020年全球癌症统计,胃癌、结肠癌和直肠癌的发病率和死亡率均位居前十位 [1] 。而我国作为癌症高发国家,每年新发的胃癌、结直肠癌患者总计超过80万人,二者在中国所有的癌症中发病率和死亡率中均居于前五位 [2] 。由此可见,胃癌、结直肠癌对人们的生命安全和身心健康造成严重威胁,因此建立有效、系统的治疗模式至关重要。而人工智能作为与医学新兴的交叉学科,以其优秀的学习能力和高度的预测准确性能,正在引起越来越多的关注 [3] [4] 。
人工智能(AI)是计算机专业的一个分支学科,成为近年来最迅猛发展的专业之一。它是一种利用计算机相关技术对人类思维和信息处理过程进行整合和模型,实现对未知预测事物或数据的认识、分析或决策的过程,具有高准确性、高复合性的综合特征 [5] 。目前,人工智能在医学领域也取得了巨大进展,其高准确性可以辅助临床医生在个体化疾病预防、诊断和预后转归等方面进行精准决策 [6] [7] 。而在人工智能领域中,机器学习(ML)算法作为其中的核心关键,一直占据不可动摇的地位。常见的机器学习算法,如随机森林(RF)、支持向量机(SVM)、人工神经网络(ANN)等,已广泛应用于临床数据挖掘和医学建模中 [8] 。
由于胃癌和结直肠癌均有较高的异质性,单一的化疗、放疗或免疫靶向治疗等并未取得良好的治疗效果。目前,以外科手术治疗为中心的综合治疗仍然是胃肠癌的标准且有积极效果的治疗模式 [9] [10] 。由于我国对内镜检查的普及和国民的筛查意识较低,多数癌症患者一经发现即处于进展期,目前规范和标准化的根治性肿瘤切除手术已经极大地改善这些患者的预后。但术后并发症的发生是阻碍患者术后恢复的最大障碍 [11] 。当并发症处理不当时,可能会导致患者的生活质量和术后的治疗恢复急速下降,进一步导致医疗负担的加重和死亡率的增加 [12] 。
据统计,胃癌、结直肠癌术后并发症的发生率约为20%~30%,且种类多样 [13] 。常见的术后并发症,包括外科性并发症,如切口感染、术后出血、肠梗阻、吻合口瘘等;非外科性并发症,如肺炎、胸腔积液、心功能不全等心肺并发症,泌尿系并发症,血栓性并发症,代谢产物和电解质紊乱等,严重并发症会导致患者休克,甚至死亡 [14] 。然而,多数胃肠道手术的术后并发症并不明显,在早期难以发现 [15] 。因此,早期识别并发症并对其进行干预对术后治疗至关重要。生命体征的波动或实验室检查的异常可以有效揭示术后并发症的早期征象 [16] ,然而,目前仅有少数研究能够有效整合这些临床数据,所以如何有效整合可用临床数据以预测并发症的发生并协助临床医生进行决策尤为关键。
应激是指机体在受到内外界环境刺激时所产生的非特异性全身反应,它是一种常见的病理生理反应,可以刺激机体产生相应的调节和保护机制 [17] 。手术、麻醉等常见围术期的刺激源,它们可以直接造成组织损伤,进而促使组织细胞释放肿瘤坏死因子α (TNF-α)、白介素-1 (IL-1)、白介素-6 (IL-6)等;此外它们还能够直接刺激中枢神经系统,进而激活下丘脑–垂体–肾上腺轴(HPA轴),促使皮质醇等被释放进入血液,这些都是常见的能够反映机体应激水平的指标。反之,应激指标的过度升高也会激活负反馈调节机制,进而促进机体的应激恢复 [18] 。术后的应激反应与并发症的发生密切相关,高应激状态可以通过多种途径诱发术后并发症的发生,如造成胃肠道运动障碍、改变肠屏障的渗透性、增加内脏敏感性、对胃肠道血流产生负面影响等;同时,术后并发症的发生也预示机体处于高水平的应激状态 [19] [20] 。所以,术后早期的高应激反应可能预示着术后并发症的发生,这为预测术后并发症提供了新的参考点。因此,本研究基于应激反应和病理生理机制的背景下,拟积极探讨这些易被忽视但易于监测的潜在特征与术后并发症发生的联系,并有效整合这些临床数据,为术后并发症的早期预测做出贡献。
随着当下医疗技术的不断进步,微创手术模式联合术后加速康复外科(ERAS)的迅猛发展,已经成为胃肠道肿瘤规范化管理的关键核心,大量临床试验表明它们能够有效改善短期结局和长期存活率 [21] [22] 。然而,术后并发症的发生仍然是一个亟待解决的临床问题。本研究在病理生理学背景下,基于应激反应与并发症发生的相关关系,利用临床常规监测特征和实验室指标,采用机器学算法确定与术后并发症的危险因素。进一步,利用确定的危险因素,开发并验证一种简便、快捷并具有较高准确性的列线图模型,旨在辅助临床医生对潜在的术后并发症高危人群进行预警,并对可能的术后并发症进行早期干预,最终目的是改善患者术后恢复,并节约医疗成本和减少经济负担。
2. 资料与方法
2.1. 一般资料
本研究为回顾性队列研究,纳入自2020年6月至2021年7月期间于青岛大学附属烟台毓璜顶医院就诊,行胃癌、结直肠癌手术的335例患者,按时间顺序将他们分为训练集和验证集。本研究已提交青岛大学附属烟台毓璜顶医院伦理委员会,并通过审批。
收集所有患者的基线特征和临床病理资料。基线特征,包括:年龄,性别,BMI,吸烟饮酒史等。临床病理资料分为术后短期结局、术后短期并发症、围术期液体出入量、实验室检验结果。其中,术后短期结局包括:临床相关结局的手术部位(胃或结直肠)、手术时间、住院天数等,以及病理结局的肿瘤最大径、淋巴结转移等。术后短期并发症,按照发生的时间分为7天内和30天内并发症,并依据国际制定的Clavien-Dindo并发症分级系统进行分级。围术期液体出入量,指每位患者的术后液体量,包括术后7天内的补液量、尿量、引流量等。实验室检验结果,包括:术前和术后第一天、四、七天的白细胞计数(WBC)、中性粒细胞百分比(N)、天门冬氨酸氨基转移酶(AST)、丙氨酸氨基转移酶(ALT)、空腹血糖(FBG);此外,我们还监测了部分患者的围术期应激指标情况,包括术前和术后第一天、四、七天的C反应蛋白(CRP)、白介素-6 (IL-6)和皮质醇水平。
2.2. 纳入和排除标准
纳入标准:1) 患者年龄 ≥ 18岁;2) 术前检查无明显手术禁忌症;3) 术前病理学诊断为胃癌或结直肠癌;4) ECOG评分(体力状况评分) ≤ 3分;5) 预期寿命 ≥ 6个月。
排除标准:1) 病情危重需行急诊手术;2) 术前检查发现继发性肿瘤或合并症;3) 除胃肠道肿瘤外,当前存在其他恶性肿瘤,或既往恶性肿瘤病史;4) 患有可能影响研究结果或无法控制的其他疾病;5) 临床数据缺失严重。
2.3. 围手术期的治疗和管理
本中心胃肠癌治疗模式参考国家加速康复外科治疗指南。
在术前对所有患者进行完善的检查和实验室检验,包括腹部增强CT、MRI、内镜检查、病理检查或会诊等,明确肿瘤类型并完成术前临床分期,以排除明确的肿瘤自身或其他疾病导致的手术禁忌症。所有手术均由经验丰富的胃肠外科专科教授进行,他们每年在青岛大学附属烟台毓璜顶医院进行80多次类似手术。
术后所有患者均常规接受预防性抗生素应用、静脉营养支持、止痛及其他对症治疗。术后每3天复查一次血常规和生化检查。密切关注患者的术后病情变化,对确诊或疑似术后并发症患者完善相关检查检验。
2.4. 液体量的计算
我们记录了每位患者术中及术后7天内的液体出入量,包括每日的输液量、引流量、尿量等。进一步使用以下公式计算每日液体出量和每日液体逆差(即每日液体出入量的差值):
其中,隐性的基础失水量设定为900 ml,并随体温升高而增加。我们依据监测的体温情况,当体温在37.3℃~37.7℃之间时增加200 ml,当体温在37.8℃~38.3℃之间时增加500 mL,当体温在38.3℃以上时增减800 mL。
2.5. 研究流程
本研究的研究流程如图1所示。
2.6. 统计方法
本研究采用IBMSPSS 26.0软件进行数据统计学分析。计数变量资料采用卡方检验和Fisher精确检验分析并用频率和百分率表示。对连续变量资料采用平均值和标准差标表示,其中正态分布的连续变量采用独立样本t检验进行组间差异分析,非正态分布的连续变量采用秩和检验进行组间差异分析。P < 0.05认为研究结果差异有显著统计学意义。
采用R语言4.2.1版本及Rstudio软件进行机器学习运算。本研究运用三种算法,分别为随机森林(RF),对应“randomForest”工具包;支持向量机(SVM),对应“e1071”工具包;人工神经网络,对应“neuralnet”工具包。分别利用三种算法将数据以4:1重复抽取数据作为训练集和验证集,而后利用训练集建立对应的算法模型,并进一步用验证集进行模型验证。比较三种模型的验证集ROC曲线的曲线下面积(AUC值),AUC值越大,证明算法模型的预测效能越好。选择AUC值最大的算法作为最优算法模型,由此模型继续进行变量权重比较,高权重变量证明为高影响因素的变量。
2.7. 列线图预测模型的构建和验证
基于机器学习算法确定的高权重变量分别进行预测模型的构建。
利用Hiplot软件训练训练集的数据,完成列线图模型可视化。利用Rstudio软件分别构建训练集和验证集的ROC曲线,观察模型的诊断价值为比较AUC值(ROC曲线与坐标轴围成的面积)的大小,AUC值越接近1,模型诊断的真实价值越高;越接近0.5,诊断价值越低。
3. 结果
3.1. 患者特征和短期结局
本研究纳入的335例患者按时间顺序分为训练集和验证集,如表1。其中,训练集共计268例,男性患者117人(66.0%),女性患者91人(34.0%);胃癌患者112人(41.8%),肠癌患者156人(50.7%);组内患者的平均年龄为65.44 ± 10.42岁。术后短期结局中,本组患者平均术后住院天数为8.63 ± 4.76天。验证集共计67例,男性患者47人(70.1%),女性患者20人(29.9%);胃癌患者34人(50.7%),肠癌患者33人(49.3%);组内患者的平均年龄为64.22 ± 11.01岁。术后短期结局中,本组患者术后住院天数为8.99 ± 5.09天。统计学分析所有特征组间均P > 0.05,显示二者无明显组间差异。
Table 1. Patient characteristics and short-term outcomes in the training and validation sets
表1. 训练集和验证集中的患者特征和短期结局
注:BMI,身体质量指数;Mean,平均数;SD,标准差。
3.2. 术后并发症的统计
本研究对纳入的335例患者术后并发症的发生情况进行汇总统计,其中术后7天内发生的并发症共计86例,术后30天内发生的并发症共计102例。如表2所示,训练集中共81例存在术后并发症的患者,验证集中共21例,两组间差异无明显统计学意义(P = 0.859)。在所有术后并发症中,我们发现其中概率较大的并发症包括外科性并发症,如吻合口瘘(15例)、切口感染(8例);心肺相关性并发症,如肺炎(12例)、胸腔积液(9例)以及频发房颤、室颤、心肺衰竭等的呼吸和循环功能障碍(11例)。
依据Clavien-Dindo并发症分级系统对所有并发症进行评级,其中严重并发症(Clavien-dindo评分III/IV/V级)共20例,其中训练集16例,验证集4例。
Table 2. Postoperative complications of patients in training set and verification set
表2. 训练集和验证集中患者的术后并发症
注:如果患者有两种或两种以上的合并症,我们重复计数。*术后胃轻瘫、残胃炎、肠梗阻、肠粘连和反复腹泻等。#术后心室颤动、频发心房颤动、心力衰竭、呼吸衰竭和不明原因的严重胸闷等。^血栓性肺栓塞、脑梗塞、严重静脉血栓形成等。*尿路感染、血尿、尿道瘘等。₤持续性低钾血症或高血糖、肝肾功能异常等。Ω瞬时温度超过38.5℃或温度超过37.5℃持续2天或以上。�/span >Clavien-dindo评分III/IV/V级。
3.3. 应激与术后并发症的相关性分析
本研究还监测训练集中168例患者术前及术后第一、四、七天的CRP、IL-6和皮质醇水平,并对有无术后并发症组组间的应激指标的变化情况进行统计学分析。根据表3所示,在术前有无并发症患者的CRP、IL-6及皮质醇水平并未表现出明显的组间差异性(P = 0.488, 0.412, 0.598)。但在术后的CRP、IL-6及皮质醇水平中,我们却发现有无术后并发症组间存在显著差异性,有术后并发症组的应激指标水平明显高于无并发症组,且在术后第四、七天差距更明显(P均 < 0.05)。综上结果证明,有术后并发症的患者通常比无术后并发症的患者具有更强的术后应激反应,术后早期出现的高应激状态同样可能反映了术后并发症的潜在发生。
Table 3. Perioperative stress levels in patients with and without complications
表3. 有无并发症患者的围术期应激水平
注:CRP,C反应蛋白;IL-6,白介素-6。
3.4. 液体出入量与术后并发症的相关性分析
本研究还分析了有无并发症组患者的围术期的液体出入量情况,如表4所示。在术后液体量计算时,经分析发现有并发症组患者自术后第二天起出现每日的液体逆差大于无并发症组(P均 < 0.05),且在术后第四天时差值明显增大,两组间的差距持续存在至统计的最后一天。考虑到术后短期并发症易发生在术后的3~6天内,因此我们认为这种差值的增加可能与术后并发症的出现有关。
在此基础上,我们设定了两个简易的研究变量。第一,评估每位患者在术后4天内是否出现液体出入量比 < 1,定义为在术后4天内出现连续2天的液体入量小于液体出量。其次,评估每位患者在术后液体出入量比 > 1最终的持续时间,定义为自术后第1天开始,连续两天出现每日液体入量小于液体出量的第一天为确定的持续时间;如果在术后七天内仍未出现连续两天出入量比 < 1,则当术后第7天的比 < 1,持续时间定为7天,当术后第7天的比仍 > 1,持续时间定为8天。
我们对设定的变量进行分析,结果显示有并发症组患者较无并发症组在术后4天内出现液体出入量比 <1的概率更低且具有统计学意义[9 (10.5%) vs 91 (36.5%), P < 0.001],而液体出入量比 > 1的最终持续时间更长(6.12 vs 3.86, P < 0.001)。经研究我们认为术后液体的差异变化可能与术后并发症的发生有关,并进一步讨论了它们是否可能是术后并发症发生的危险因素。
Table 4. Perioperative fluid volume in patients with and without complications
表4. 有无并发症患者围术期的液体量情况
注:每日液体逆差 = 每日液体入量 − 出量;存在出入量比 < 1,术后4天内液体出入量比 < 1的出现参与术后7天内并发症出现的分析;出入量比 > 1的持续时间,液体出入量比 > 1的最终持续时间。
3.5. 人工智能预测术后并发症的高权重变量
我们利用人工智能的机器学习算法进行高权重因素分析。本研究利用了三种人工智能的机器学习算法,包括随机森林(RF)、支持向量机(SVM)、人工神经网络(ANN),运用三种算法分别对术后7天内并发症和术后30天内并发症进行算法模型构建,并比较构建模型的验证集的预测性能,即对应的ROC曲线和AUC值。将AUC值最大者选为最优算法模型,并依据此算法进行高权重因素分析。
3.5.1. 随机森林(Random Forest, RF)
随机森林指通过集成的思路将多棵决策树集合到一起形成的算法,它由基本单元—决策树汇聚多棵并最终组成随机森林。决策树则是我们常用的监督学习方法之一,其原理是模拟人投票决策的过程,流程类似一棵倒置的树,由最上方的根节点开始,一级级向下划分至不同的中间节点并依据目标属性逐步分类,直至数据精确分类或得到所需的预测结果。随机森林在此基础上,对多棵决策树的结果进行投票并确定最终的结果。随机森林的模式图如图2所示。
Figure 2. Principle schematic diagram of random forest
图2. 随机森林原理示意图
3.5.2. 支持向量机(Support Vector Machine, SVM)
支持向量机也是常用的监督学习方法之一,该方法纳入了“间隔”的定义。该算法通过非线性的函数方法,可以将原始数据映射到多重维度空间,在这个空间中该算法可以将原始数据能够通过一条分隔线分开,数据集到这条线的距离代表了模型对于预测值的置信度,距离越远,证明模型对于预测值的概率越大。支持向量机就是将两类数据集到直线的距离之和可以最大化。间隔即为这个最大距离之和。支持向量机的模式图如图3所示。
Figure 3. Principle schematic diagram of support vector machine
图3. 支持向量机原理示意图
3.5.3. 人工神经网络(Artificial Neural Network, ANN)
人工神经网络的原理模仿了人脑神经元的构成和连接,它有输入层、一层或多层隐藏层及输出层组成,每层可由多个神经元构成。研究变量可由输入层接受,再传递至下一隐藏层,该隐藏层通过线性或非线性的函数计算和权重比例计算出结果,并再次传递至下一层,最后逐层递出至输出层并得到最终的结果。人工神经网络的模式图如图4所示。
Figure 4. Principle schematic diagram of artificial neural network
图4. 人工神经网络原理示意图
3.5.4. 术后7天并发症的高权重变量的确定
基于RF、SVM和ANN三种算法原理,利用R studio软件对原始数据处理,最终我们成功绘制三种算法模型中验证集的ROC曲线,如图5所示,分别对应的AUC值为AUCRF = 0.754,AUCSVM = 0.737,AUCANN = 0.688。
经比较我们确定随机森林作为最优算法模型,并基于此算法进行研究变量权重性排序。由于研究变量较多,仅罗列出权重比前十位的变量作为确定的与术后7天并发症相关的高权重变量,结果如图6。变量依次为:术后第四天空腹血糖、术后第四天中性粒细胞百分比、BMI、术后第四天体温、术后4天内存在出入量比 < 1、年龄、术后第一天白细胞计数、术后第四天白细胞计数、心血管疾病、术后第一天体温。
Figure 5. ROC plot and AUC values table for the 7-day postoperative complication verification set for the algorithmic model built based on the three algorithms
图5. 基于三种算法构建算法模型的术后7天并发症验证集ROC曲线图及AUC值表格
Figure 6. Ranking table of top ten high-weight factors for the 7-day postoperative complications
图6. 术后7天并发症的前十位高权重因素排序表
3.5.5. 术后30天并发症的高权重变量的确定
类同于术后7天并发症的机器学习运算流程,基于三种算法原理,利用R studio软件对原始数据处理,我们同样成功绘制三种算法模型中验证集的ROC曲线,如图7所示,分别对应的AUC值为AUCRF = 0.776,AUCSVM = 0.768,AUCANN = 0.737。
经比较我们确定随机森林作为最优算法模型,并基于此算法进行研究变量权重性排序。同样,由于研究的变量较多,仅罗列出权重比前十位的变量作为确定的与术后7天并发症相关的高权重变量,结果如图8。变量依次为:术后液体出入量 > 1的持续时间、术后第四天空腹血糖、术后第七天空腹血糖、术后第七天中性粒细胞百分比、术后第四天中性粒细胞百分比、BMI、术后第七天体温、年龄、心血管疾病、术后第一天空腹血糖。
3.6. 基于人工智能的列线图预测模型建立和验证
3.6.1. 基于人工智能的术后7天并发症的列线图模型建立和验证
通过三种机器学习算法的比较和变量权重排序,我们确定了与术后7天并发症相关性最强的前十位因素,如图6。我们选取其中前八位构建新的列线图模型,基于上述变量,我们利用训练集数据成功构建了预测术后7天内并发症发生的列线图模型Nomogram-A’,如图9所示。
利用训练集和验证集数据构建Nomogram-A’的ROC曲线及相应的灵敏度特异度等,ROC曲线对应图10。
Figure 7. ROC plot and AUC values table for the 30-day postoperative complication verification set for the algorithmic model built based on the three algorithms
图7. 基于三种算法构建算法模型的术后30天并发症验证集ROC曲线图及AUC值表格
在图10和表5中,我们得到Nomogram-A’在训练集中的AUC值为0.888 (95% CI: 0.844~0.933),灵敏度为0.879,特异度为0.797;验证集中的AUC为0.805 (95% CI: 0.676~0.934),灵敏度为0.860,特异度为0.821。模型在训练集和验证集的AUC值均超过0.8,表明模型有较好的预测准确性。
3.6.2. 基于人工智能的术后30天并发症的列线图模型建立和验证
通过三种机器学习算法的比较和变量权重排序,我们确定了与术后30天并发症相关性最强的前十位因素,如图8。我们选取其中前八位构建新的列线图模型,基于上述变量,我们利用训练集数据成功构建了预测术后30天内并发症发生的列线图模型Nomogram-B’,如图11所示。
利用训练集和验证集数据构建Nomogram-B’的ROC曲线及相应的灵敏度特异度等,ROC曲线对应图12。
在图12和表6中,我们得到Nomogram-B’在训练集中的AUC值为0.937 (95% CI: 0.909~0.966),灵敏度为0.909,特异度为0.840;验证集中的AUC为0.895 (95% CI: 0.816~0.975),灵敏度为0.857,特异度为0.925。模型在训练集和验证集的AUC值均超过0.8,表明模型有较好的预测准确性。
Figure 8. Ranking table of top ten high-weight factors for the 30-day postoperative complications
图8. 术后30天并发症的前十位高权重因素排序表
Figure 9. Nomogram predictive model for 7-day postoperative complications based on artificial intelligence, Nomogram-A’
图9. 基于人工智能的术后7天并发症的列线图预测模型Nomogram-A’
4. 讨论
在本研究中,我们成功开发并验证了能够预测胃肠道肿瘤患者术后7天内和术后30天内并发症发生的列线图模型。模型均基于临床上常见的临床数据或检验结果(包括体温、白细胞计数、中性粒细胞百分比、空腹血糖和术后7天内的液体量)开发。基于机器学习算法构建的Nomogram-A’和Nomogram-B’在训
Figure 10. ROC curves of training set and verification set of Nomogram-A’
图10. Nomogram-A’的训练集和验证集ROC曲线
Figure 11. Nomogram predictive model for 30-day postoperative complications based on artificial intelligence, Nomogram-B’
图11. 基于人工智能的术后30天并发症的列线图预测模型Nomogram-B’
Figure 12. ROC curves of training set and verification set of Nomogram-B’
图12. Nomogram-B’的训练集和验证集ROC曲线
Table 5. The AUC values, sensitivity, specificity, etc. of Nomogram-A’ in the training and validation sets
表5. Nomogram-A’在训练集和验证集中的AUC值、灵敏度、特异度等
Table 6. The AUC values, sensitivity, specificity, etc. of Nomogram-B’ in the training and validation sets
表6. Nomogram-B’在训练集和验证集中的AUC值、灵敏度、特异度等
练集和验证集中的受试者特征曲线对应的AUC值更高,且均大于0.75,校准曲线也显示良好的效能,这表明该模型在预测术后短期并发症的可能性方面表现出了较佳效果。综合而言,本研究中基于人工智能构建的模型可以用于识别术后并发症的高危人群,并降低它们对于术后患者恢复和生活质量的影响。该模型的最终目的是能够有效改善临床术后短期医疗疗效和患者生活治疗,节约医疗成本并减少经济负担。
我国是胃肠癌高发国家之一,其中多数一经发现即为进展期,目前以手术治疗为中心的综合治疗仍是治疗胃癌、结直肠癌的关键手段,但术后并发症的出现仍是困扰临床医生并影响患者预后及恢复的重要问题 [2] [11] 。所以,如何开发简便、快捷且具有准确性较高的预测术后并发症的手段,以便在术后并发症的早期出现做出预警并进行及早干预,是目前医疗工作者亟需解决的问题。
在本研究中,我们利用了人工智能中的机器学习算法进行预测模型的构建。随着近年来交叉学科的广泛兴起及人工智能技术的普及应用,机器学习算法作为其中的基础已成为医学中构建预测模型方法的关键 [8] 。机器学习为广义的多种计算机算法的综合,它们都能够实现对既往数据进行特征性总结或数据挖掘,并得到其中的线性或非线性的规律,以此来对新的数据进行分析和预测 [23] 。Benjamin等人利用人工智能中的深度神经网络(deep neural network, DNN)方法对手术后切口感染的发生及部位进行预测 [24] ,Yuming Jiang等人利用支持向量机(SVM)算法整合患者的病理特征及免疫组化结果来预测Ⅱ、Ⅲ期胃癌患者新辅助治疗的获益人群 [25] ,两模型均取得较好的预测效能。本研究也基于这种研究思路,整合了临床上常见的的数据和特征,而后在RF、SVM和ANN三种机器学习运算方法的支持下,分别确定了与术后7天内并发症、术后30天内并发症相关的危险因素,并成功构建预测模型。然而常规模型的使用往往也会受到限制,因为它们通常为选定患者人群或单中心创建,难以泛化。而随着更多可用数据的驱动和全国性临床试验的可行性,大数据变得可用,这可以有效消除模型泛化的限制。Kevin等人的研究就是利用了美国某数据库中275,152例患者的数据,通过传统统计方式及随机森林、人工神经网络等算法对患者术后的手术部位感染进行预测,其中机器学习算法的ROC曲线下面积都超过了0.7 [26] 。不论何种研究,都已经证明了人工智能技术在临床实践中的优越表现,例如辅助影像学的诊断、病理诊断等新兴的交叉学科和技术的发展也为临床医生进行决策提供了有效的支持。
既往文献记载,术后并发症的发生与应激反应的改变密切相关。术后并发挥正的早期出现通常表明患者有较强的机体应激反应,可以诱导机体进入高代谢状态 [27] 。在此阶段,体内的主要修复细胞和白细胞的数量及活性大幅度增加,主要是为满足身体恢复所需的葡萄糖等物质的供应 [28] 。同时,随着促炎性细胞因子和某些急性期蛋白的上调以及下丘脑–垂体–肾上腺轴(神经–内分泌HPA轴)的激活,在包括皮质醇、儿茶酚胺、胰岛素、胰高血糖素等在内的大量激素的水平升高或降低的作用下,肝脏及肌肉糖原被大量分解并促进了糖异生的过程,进而导致机体处于高血糖状态,这是为了满足组织修复所需要的“浓度梯度” [29] 。此外,在激素作用的影响下,体内毛细血管的通透性明显增加,尿液浓缩导致尿液的浓度增加,大量液体被储存在组织内的“第三间隙”中,进而导致组织水肿,临床上被称作“水钠潴留”。而随着机体的自我修复或在外界的干预作用下,高应激状态将逐渐稳定,糖代偿过程缓慢恢复正常,同时过多的组织内液体也被重新吸收入血,并最终以尿液的形式排出体外 [30] 。
我们的研究同时也验证了术后并发症与一些常规临床监测指标之间的相关性,如体温、白细胞计数、中性粒细胞百分比、空腹血糖等。单个或多个指标微小的改变经常被临床医生所忽略,这可能导致他们对早期的并发症识别失败。在应激反应的高代谢阶段,炎症细胞因子和激素的调节可能会影响到某些常规监测指标的波动和变化 [31] 。在本研究的结果中,我们同样发现应激水平的升高与某些常规监测指标呈正相关性,如体温、中性粒细胞百分比和空腹血糖水平等 [32] 。考虑到急性应激、病理生理学和术后并发症之间的相关性,这些常规监测指标可能成为能够体现术后并发症发生的潜在危险因素和有预测价值的候选指标。除此之外,一般认为围术期监测的某些指标也可以反映出机体的炎症水平 [33] ,这些指标的升高能够表明并发症患者有较高的炎症水平,因此在我们的研究中,我们也利用了急性期应激相关指标的改变来反映炎症水平的变化,从而为并发症的早期预警提供诊断工具。
在上述理论背景下,我们整合了临床上常见的、易被监测到的数据和特征,如体温、液体出入量、空腹血糖等,它们在日常医疗活动中可以被有效监测,但既往研究很少将它们进行整合,所以我们从病理生理学和应激反应发生的生理机制背景下,探讨了这些特征与术后并发症发生的潜在关系。而后,在三种机器学习运算方法的辅助下,分别确定了与术后7天、30天内并发症的高权重危险因素,并成功建立了列线图预测模型Nomogram-A’和Nomogram-B’。Nomogram-A’在训练集中和验证集的AUC值为0.888和0.805,Nomogram-B’在训练集中和验证集的AUC值为0.937和0.895。结果表明两模型的预测准确性良好。
总而言之,本研究基于人工智能的机器学习算法,探究了影响胃肠癌患者短期术后7天内、术后30天内并发症的危险因素,并整合危险因素构建预测列线图模型,模型中应用的因素均为围术期常见的临床特征,临床医生可以根据不同患者的情况进行个性化的风险预测,且该模型具有较好的准确性和效能,以便对高风险人群进行针对性干预。但本研究也具有一定的局限性。受限于研究时间和单中心研究的限制,本研究仅开展了回顾性研究,且由于数据缺失的情况,少部分患者的数据未被纳入研究中,也导致了研究内并发症人群的数量较多,这些有可能导致选择偏倚的出现。此外由于测量应激指标的成本教导,我们仅对训练集的部分患者收集了应激指标的数据。综上,我们仍需要多中心、大样本及结合前瞻性的临床数据进行进一步的临床研究。
5. 结论
有术后并发症的患者比无术后并发症的患者具有更强的术后应激反应,术后早期出现的高应激状态同样可能反映了术后并发症的潜在发生。基于病理生理学和应激反应背景下,证明了液体出入量可以成为潜在的与术后并发症相关的危险因素,也为后续预测术后并发症的研究提供新的思路。基于人工智能成功构建预测术后7天内并发症和术后30天内并发症发生的列线图模型Nomogram-A’和Nomogram-B’,ROC曲线显示两模型有良好的预测准确性。
利益冲突
所有作者均声明不存在利益冲突。
基金项目
本文章受到山东大学项目(项目编号:3460019005)支持。
NOTES
*通讯作者。