1. 前言
肺癌在全球范围内的发病率都偏高,且因肺癌死亡的患者占据癌症相关死亡的比例最高,国际癌症研究机构(the International Agency for Research on Cancer, IARC)提供的全球癌症数据中表明2022年肺癌占全球癌症死亡人数的18.7% [1] [2] 。肺癌病例中绝大部分属于非小细胞肺癌(Non-small cell lung cancer, NSCLC) [3] ,其中NSCLC最常见的驱动突变就是首次于2004年发现的表皮生长因子受体(epidermal growth factor receptor, EGFR)突变 [4] 。随着基因检测技术的迅速更迭,不仅在数量还有许多新型EGFR罕见突变不断被报道发现,更清楚地了解EGFR罕见突变的临床病理特征有着重要意义。然而,由于EGFR突变在现实环境中的检出率较低 [5] [6] ,这部分肺癌患者从靶向治疗中获益受限。因此,需要临床上易获取的检测方法来提前预测EGFR罕见突变状态,从而更多发现EGFR罕见突变的存在。以往的研究表明,血清肿瘤标志物(serum tumor markers, STMs)与EGFR突变的发生存在一定的联系,然而,这些研究结果并不相同甚至有些是矛盾的。目前临床上用于鉴别诊断原发性肺癌的血清肿瘤标志物也不尽相同,包括但不局限于癌胚抗原(carcinoembryonic antigen, CEA)、神经元特异性烯醇化酶(neuron-specific enolase, NSE)、细胞角蛋白19可溶性片段(soluble fragment of cytokeratin 19, CYFRA21-1)、胃泌素释放肽前体(progastrin-releasing peptide, proGRP)、鳞状细胞癌抗原(squamous cell carcinoma antigen, SCC-Ag)和碳水化合物抗原125 (carbohydrate antigen 125, CA125) [7] [8] [9] 。尽管单个肿瘤标志物在特异性和敏感性方面的单一效用仍然有些有限,但联合应用可以提高诊断或鉴别诊断的准确性。此外,STMs与临床分期之间的相关性值得关注,因为在诊断为早期NSCLC的患者中观察到较低的SCC、CEA、NSE和CYFRA21-1水平或阳性率 [10] 。既往许多研究揭示了不同血清肿瘤标志物对非小细胞肺癌患者EGFR突变状态的预测价值 [11] [12] [13] [14] 。然而,目前暂时缺乏EGFR罕见突变与STMs的关系的相关研究。因此,我们回顾性描述了非IA期NSCLC患者的血清肿瘤标志物和其他临床病理特征,并构建nomogram预测模型对EGFR罕见突变的诊断和治疗提供新的依据。
2. 方法
2.1. 临床资料和患者分组
回顾性收集了2016年11月至2020年11月期间在青岛市城阳区人民医院接受EGFR基因检测的547例NSCLC患者。使用基于国际抗癌联盟第8版分期系统的肿瘤–淋巴结–转移(TNM)分期系统确定肿瘤分期,筛选出非IA期NSCLC患者547例为试验组。另外,收集2020年11月至2022年11月期间在青岛市城阳区人民医院接受EGFR基因检测且肿瘤分期为非IA期的患者共219例构成验证组。从电子病历中收集患者的性别、年龄和吸烟史等人口统计学信息以及病理学等临床特征资料。本研究的纳入标准如下:(1) 患者接受过以下六种血清肿瘤标志物的检测,包括CEA、SCC-Ag、CYFRA21-1、NSE、proGRP和CA125,且检测前未进行任何肿瘤相关的治疗;(2) 患者人口统计学和临床特征的资料完整。患者既往有其他恶性肿瘤病史被排除在研究之外。本研究已通过青岛市城阳区人民医院伦理委员会批准(伦理审批号:2024040305)。由于该研究的回顾性,机构审查委员会放弃了知情同意。
2.2. STMs测量
收集患者外周静脉血样用于检测肺癌相关肿瘤标志物。使用商业化学发光免疫测定试剂盒(MAGLUMI 4000 Plus,中国)测量肿瘤标志物的血清浓度。所有参与者的血液样本都是在进行任何抗癌治疗之前通过外周静脉穿刺获得的。研究中使用基于受试者工作特征曲线的最佳临界值为阳性阈值,STMs的阳性阈值为:CEA:45.68 ng/mL、CA125:14.81 U/mL、CYFRA21-1:4.75 ng/mL、SCC:0.77 ng/mL、NSE:10.08 ng/mL、proGRP:35.01 pg/mL。
2.3. EGFR突变分析
收集原发肿瘤、转移性淋巴结或器官的组织学标本,以及胸腔积液或心包积液的细胞学标本进行EGFR基因检测。按照人EGFR突变检测试剂盒的说明书从肿瘤组织或细胞中提取基因组DNA。使用ABI 7500荧光PCR系统(Thermo Fisher Scientific, China)进行聚合酶链反应(PCR)。采用人EGFR突变检测试剂盒扩增难治性突变系统(ARMS)检测EGFR突变状态。
2.4. 统计学分析
使用中位数表示非正态分布的连续变量,使用非参数检验进行组间比较。分类变量组间比较使用卡方检验和Fisher精确检验进行。对单因素分析中具有统计学意义的变量,再纳入到多元logistic回归分析法进一步分析。随后,利用多变量分析结果建立nomogram预测模型。评估模型的预测性能使用计算曲线下面积(AUC)表示。评估该模型的临床效用使用决策曲线分析。对模型进行内部和外部验证则是通过一致性指数(C指数)和校准曲线。采用Bootstrap重采样(1000次迭代)生成校准曲线。使用IBM SPSS Statistics version 25.0软件和R4.2.2软件,包括“pROC”、“regplot”和“rms”包。在统计分析过程,差异有统计学意义要求双侧p ≤ 0.05。
3. 结果
3.1. 患者临床资料
共477例基因检测结果为EGFR野生型和70例EGFR罕见突变患者纳入试验组(表1)。其中,试验组患者的中位年龄均为63岁。EGFR罕见突变患者更常见于女性(26.4% vs. 8.1%, p < 0.001),不吸烟患者(19.1% vs. 8%, p < 0.001)和肺腺癌患者(16.8% vs. 4.1%, p < 0.001)。罕见突变在不同血清肿瘤标志物中表现也不同,罕见突变患者中CEA阳性(22.1% vs. 11.5%, p = 0.015),CYFRA21-1阴性(17.5% vs. 5.9%, p <
![](Images/Table_Tmp.jpg)
Table 1. Comparison of clinical data between the two groups of patients [cases (%)]
表1. 两组患者临床资料比较[例(%)]
0.001)和SCC-Ag阴性(24% vs. 9.3%, p < 0.001)更常见,且结果具有统计学差异。NSE阳性(13.6% vs. 5.5%, p = 0.092),CA125阴性(14.6% vs. 11.6%, p = 0.299)和proGRP阴性(14.8% vs. 10.7%, p = 0.155)在罕见突变中也较为多见,但结果无统计学差异。在验证组中,共纳入EGFR罕见突变患者26例和野生型患者193例。其中罕见突变组中位年龄为59岁(51岁~69岁),野生型患者中位年龄为64岁(57岁~68岁)。验证组中各项指标占比优势情况与试验组基本相似,具体数据详见表1。
3.2. 探索EGFR罕见突变的危险因素
将试验组上述因素进行logistic回归分析(表2),单因素分析结果显示为,EGFR罕见突变患者在年龄(p < 0.001)、吸烟史(p < 0.001)、病理类型(p < 0.001)、CEA (p = 0.017)、CYFRA21-1 (p < 0.001)和SCC-Ag (p < 0.001)等方面差异均具有统计学意义。将上述6项因素纳入多因素分析,结果显示,女性(OR = 0.347, 95%CI 0.164~0.733, p = 0.006)、病理肺腺癌(OR = 7.187, 95%CI 1.696~30.463, p = 0.007)、CEA阳性(OR = 2.838, 95%CI 1.332~6.049, p = 0.007)、CYFRA21-1阴性(OR = 0.268, 95%CI 0.133~0.538, p < 0.001)和SCC-Ag阴性(OR = 0.488, 95%CI 0.274~0.87, p = 0.015)是EGFR罕见突变的独立危险因素。
![](Images/Table_Tmp.jpg)
Table 2. Univariate and multivariate logistic analysis of the test group
表2. 试验组的单因素及多因素logistic分析
3.3. 构建预测模型
将多因素logistic回归分析的结果即性别,病理类型,CEA,CYFRA21-1和SCC-Ag共5项,纳入到预测模型中,绘制出nomogram图,EGFR罕见突变发生的概率可以通过为每个变量分配分数并将它们相加获得总分来评估(图1)。然后将该总数绘制在“总分”轴上,并从总分轴到“危险度”轴绘制一条垂直线。例如,预测患有肺腺癌,且CYFRA 21-1阴性、CEA阳性和SCC-Ag阴性的女性患者EGFR罕见突变的概率,预测得分如下:肺腺癌得分为100,CYFRA21-1阴性得分为65,CEA阳性得分为52,SCC-Ag阴性得分为35,女性得分为52。将这些分数相加后,总数达到304,表明存在EGFR罕见突变的概率约为0.7 (70%)。
3.4. 模型的内部和外部验证
验证模型的预测性能使用ROC曲线,对Nomogram预测模型进行内部验证,试验组AUC值为0.793 (95%CI 0.743~0.842) (图2(a))。校准曲线用于验证Nomogram模型的预测一致性,见图,校准曲线及参数表明,模型给出的预测值与实际观测结果一致性较高(图2(b))。此外,我们实用临床决策曲线评估模型的临床效用,如图3,表明该模型的临床效用良好,该模型的概率阈值范围为0%~77%,表明范围较广,临床效用较好。同时,我们在验证队列评估了nomogram预测模型的预测价值,即外部验证。在验证组中,ROC曲线的AUC值为0.734 (95%CI 0.645~0.824) (图2(c)),校准曲线也证明了模型的一致性良好(图2(d))。
4. 讨论
近年来,靶向药物治疗可提高EGFR突变阳性患者的客观缓解率、无疾病生存期和总生存期。虽然部分EGFR罕见突变存在耐药性,多数罕见突变仍对靶向治疗敏感。尽管TKI对基因突变患者显示出显着的疗效,但EGFR突变的检出率远低于预期。因此,需要临床上易获取的检测方法来提前预测EGFR
![](//html.hanspub.org/file/231-8100227x8_hanspub.png?20240529083142930)
Figure 1. Flowchart of the diagnostic prediction model for clinical non-IA stage non-small cell lung cancer with rare EGFR mutations
图1. 临床非IA期非小细胞肺癌EGFR罕见突变诊断预测模型的列线图
![](//html.hanspub.org/file/231-8100227x9_hanspub.png?20240529083142930)
![](//html.hanspub.org/file/231-8100227x10_hanspub.png?20240529083142930)
Figure 2. Internal and external validation of the prediction model. (a) ROC curve analysis of the Nomogram model for diagnostic value in the test group; (b) Calibration curve for internal validation of the Nomogram model; (c) ROC curve analysis of the Nomogram model for diagnostic value in the validation group; (d) Calibration curve for external validation of the Nomogram model
图2. 预测模型的内部及外部验证。(a) 试验组ROC曲线评价Nomogram模型的诊断价值;(b) 内部验证Nomogram模型的校准曲线;(c) 验证组ROC曲线评价Nomogram模型的诊断价值;(d) 外部验证Nomogram模型的校准曲线
![](//html.hanspub.org/file/231-8100227x11_hanspub.png?20240529083142930)
Figure 3. Decision curve analysis of the Nomogram model’s clinical utility in the test group
图3. 试验组决策曲线评价Nomogram模型的临床效用
罕见突变状态,从而更多发现EGFR罕见突变的存在。据我们所知,我们的研究是目前探索EGFR罕见突变与STMs和其他临床病理特征关系的临床样本量最大的研究,对这部分肺癌患者日后的诊断和治疗都具有重要意义。
既往许多研究揭示了不同血清肿瘤标志物对非小细胞肺癌患者EGFR突变状态的预测价值 [11] [12] [13] [14] 。然而,目前仍缺乏关于EGFR罕见突变与血清肿瘤标志物相关的研究。Arthur等 [11] 发现EGFR突变型和野生型患者在CEA、CYFRA21-1或SCC水平上无统计学差异。相反,Jin等 [12] 报道了非吸烟肺癌患者的EGFR突变率增加,CEA水平升高。Wang等 [15] 在一项纳入1089例患者的研究中,证实了NSCLC患者CYFRA21-1阴性、SCC阴性、CA125阴性和EGFR突变之间存在关联。我们的研究结果表明,在非IA期的患者中女性,肺腺癌,CEA阳性,CYFRA21-1阴性和SCC-Ag阴性是预测EGFR罕见突变的独立危险因素。随后,利用多因素分析结果构建预测模型。ROC曲线和决策曲线分析表明,该模型对预测EGFR突变具有良好的预测效果(AUC = 0.793)和临床效用。CYFRA 21-1作为一种肿瘤标志物,对NSCLC表现出更高的敏感性,特别是在鳞状细胞癌中 [16] 。CEA在肺癌中表现出相对较高的敏感性,在肺腺癌和大细胞癌中观察到的血清浓度最高 [17] 。SCC-Ag则是在鳞状细胞癌中更常见。在内部和外部验证中,列线图模型的校准曲线清楚地表明预测和观测值之间的高度一致性。
我们的研究也存在一些局限性。首先,一些肿瘤组织很难获得,患者纳入和样本选择可能会出现偏差。其次,美国人群中的EGFR突变频率远低于亚洲人群,这可能会限制我们的结果对其他种族的适用性。
综上所述,CEA、CYFRA21-1和SCC-Ag可能是预测非IA期NSCLC患者EGFR罕见突变的关键因素。将STMs与其他临床因素相结合的Nomogram模型可以有效预测发生EGFR罕见突变的概率,为患者的诊断和治疗提供有价值的见解。
NOTES
*通讯作者。