肺癌是我国发病率和病死率最高的恶性肿瘤,早诊早治是提高肺癌患者生存率和改善预后的关键。近年来有较多研究聚焦于肺癌的生物标志物,新兴的生物标志物检测在肺癌的筛查中显示出一定的潜力。将生物标志物、影像组学和人工智能相结合,建立肺癌筛查预测综合模型,可能是未来提升肺癌筛查能力的发展方向。该文概述了生物标志物在肺癌筛查中的应用,介绍了新兴的生物标志物和新技术,探讨了生物标志物在肺癌筛查中的应用前景,旨在为提升肺癌筛查能力和实现肺癌早诊早治提供一定的理论依据。
引用本文: 刘利, 田攀文. 生物标志物在肺癌筛查中的研究进展. 华西医学, 2020, 35(1): 78-83. doi: 10.7507/1002-0179.201905065 复制
肺癌是我国发病率和病死率最高的恶性肿瘤[1],早诊早治是提高肺癌患者生存率和改善预后的关键。低剂量 CT(low-dose computed tomography,LDCT)是在高风险人群(根据年龄和吸烟史定义)中筛查肺癌的一种方法,其对肺癌筛查的价值已得到美国肺癌筛查试验[2]、国际早期肺癌行动计划[3]、欧洲 NELSON 试验[4]、意大利多中心肺癌筛查试验[5]等的证实。尽管对高风险人群采用 LDCT 筛查肺癌在全球广为应用,但仍存在不少争议,包括高风险人群界定标准不一、CT 筛查周期差异大、假阳性率高和效益成本比低等。近年来肺癌的生物标志物是研究热点,新兴的生物标志物检测在肺癌的筛查中显示出一定的潜力,将生物标志物、影像组学和人工智能相结合,建立肺癌筛查预测综合模型,可能是未来提升肺癌筛查能力的发展方向。本文概述了生物标志物在肺癌筛查中的应用,介绍了新兴的生物标志物和新技术,探讨了生物标志物在肺癌筛查中的应用前景,旨在为提升肺癌筛查能力和实现肺癌早诊早治提供一定的理论依据。
1 生物标志物在肺癌筛查中的应用
1.1 自身抗体
针对肺癌抗原的自身抗体通常出现在临床前阶段,可能远早于临床症状或影像学表现。单一自身抗体诊断肺癌的特异性高,但敏感性低。结合多种自身抗体则可提高诊断的特异性和敏感性。Boyle 等[6]研究发现,使用 6 种肺癌自身抗体[抑癌基因 p53、纽约食管鳞状细胞癌 1(New York esophageal squamous cell carcinoma 1,NY-ESO-1)、肿瘤相关基因(cancer-associated gene,CAGE)、三磷酸腺苷(adenosine triphosphate,ATP)结合 RNA 解旋酶 GBU4-5、膜联蛋白-1(annexin-1)和性别决定区 Y 框蛋白(sex determining region Y-box protein,SOX)2 的抗体]诊断肺癌的特异度为 89%,而灵敏度为 39%。另一项研究纳入了 1 987 例肺结节患者(结节直径为 4~20 mm),在 CT 筛查风险模型中加入了 7 种肺癌自身抗体[p53、NY-ESO-1、CAGE、GBU4-5、SOX2、人抗原 R(human antigen R,HuD)和黑色素瘤抗原(melanoma antigen,MAGE)-A4 的抗体],使肺癌诊断的特异度显著提高(>92%),阳性预测值达 70% 以上[7]。Chapman 等[8]在 154 例患者(104 例肺癌和 50 例正常对照)中检测了 7 种自身抗体[p53、c-myc、人表皮生长因子受体-2(human epidermal growth factor receptor-2,HER2)、NY-ESO-1、CAGE、黏蛋白 1(mucin,MUC1)和 GBU4-5 的抗体],其灵敏度为 61%,特异度为 90%。上述研究结果提示,肺癌自身抗体和其他肺癌筛查方式相结合,其临床价值可能会进一步提高。
1.2 补体片段
肺癌可通过经典补体途径激活补体级联效应,该途径下游分裂产物补体片段 4d(complement fragment 4d,C4d)的浓度在肺癌患者的血液和体液中增加[9]。有研究在 190 例无症状肺结节患者中检测血浆 C4d 水平,结果发现血浆 C4d 水平与肺癌风险具有相关性[比值比=4.38,95% 置信区间(1.61,11.93)],且肺气肿和慢性阻塞性肺疾病等潜在的混杂因素并不影响 C4d 水平,恶性肺结节患者的血浆 C4d 水平显著高于良性肺结节患者[9]。Ajona 等[10]分析了 67 例肺结节患者(肺结节直径 8~30 mm),发现血浆 C4d 诊断良性肺结节的阴性预测值为 84%,阳性预测值为 54%,其特异度为 89%,而灵敏度仅有 44%。
1.3 微 RNA(microRNA,miRNA)
循环 miRNA 是非编码 RNA,具有调控功能,能反映肿瘤和宿主之间的相互作用,已成为肿瘤诊断和预后判断的潜在生物标志物,且 miRNA 与肿瘤分期和基因突变无关[11]。Sozzi 等[12]进行的多中心临床研究评估了血浆 miRNA 识别分类器(microRNA signature classifier,MSC)对肺癌高风险人群的诊断价值。该研究采集了 939 例受试者(肺癌患者 69 例、LDCT 筛查的肺癌风险人群 652 例、对照组 287 例)的血浆,通过荧光定量聚合酶链反应检测 miRNA。结果显示,MSC 诊断肺癌的灵敏度为 87%,特异度为 81%;LDCT 筛查肺癌的灵敏度为 79%,特异度为 81%,假阳性率高达 19.4%;MSC 和 LDCT 联合应用可使 LDCT 的假阳性率降至 3.7%。而在肺癌术后患者中,血浆 MSC 还能监控肿瘤复发[13]。此外,正在进行的 3 项独立的大型肺癌筛查研究共纳入 16 000 例肺癌高危患者,或许将进一步验证 miRNA 对良恶性肺结节的诊断价值。
1.4 循环肿瘤 DNA
循环肿瘤 DNA 指导晚期肿瘤精准治疗的价值已被相关研究证实[14],但在早期肺癌诊断中的作用仍不确定。Abbosh 等[15]在 96 例Ⅰ~Ⅲ期非小细胞肺癌患者中检测血液循环肿瘤 DNA,灵敏度从Ⅰ期肺腺癌的 15% 到Ⅱ期或Ⅲ期鳞状细胞癌的 100% 不等,总体灵敏度为 48%。近期一项研究整合了血液循环肿瘤 DNA 和血清蛋白质谱技术,纳入了 1 005 例Ⅰ~Ⅲ期多种肿瘤患者和 812 名非肿瘤对照者,虽然总体特异度高于 99%,但灵敏度总体偏低,肺癌中灵敏度为 59%,乳腺癌中灵敏度 33%,而在卵巢癌中灵敏度高达 98%[16]。
1.5 循环肿瘤细胞(circulating tumor cell,CTC)
CTC 是原发肿瘤或转移瘤脱落进入血液循环的肿瘤细胞。CTC 数量少,且呈异质性,因此检测技术要求较高,目前仍在探索中。CTC 作为液体活检的一种方法也有一定优势,如可用于早期肺癌的筛查[17]和肺癌进展的动态检测,也可监测肿瘤的异质性,而且通过对 CTC 的基因检测,可以发现基因突变,从而指导治疗。Ilie 等[18]早期研究了肺癌的风险因素,检测了 245 例无癌症患者的 CTC 情况,包括 168 例慢性阻塞性肺疾病患者和 77 例无慢性阻塞性肺疾病患者,每年对 CTC 阳性慢性阻塞性肺疾病患者进行 CT 筛查,发现 CTC 检测相比 CT 筛查能早 1~4 年发现肺病病灶。Chen 等[19]通过检测 CTC 对肺癌或肺部良性结节患者以及健康者进行研究,其中肺癌或肺部良性结节患者中 CTC 阳性率为 84%,而后者中仅 4.2%。推测随着新技术的发展,CTC 联合影像等相关辅助检查,对肺癌的诊断或许能有更大提高。
1.6 外泌体
外泌体是 50~150 nm 直径的分泌膜包裹的囊泡(细胞外囊泡)[20]。目前学术界对外泌体能否指导诊断及治疗比较感兴趣[21],但相关研究却很少。近来 Zhang 等[22]对肺恶性结节和良性结节患者血浆中的外泌体进行了研究,通过对外泌体 miRNA 特征图谱的探索,发现其对肺癌早期诊断有着重要的意义。目前也有文献对外泌体蛋白调控肿瘤进展的机制进行了研究,并总结了其作为肿瘤标志物对肺癌筛查的可行性[23]。
1.7 DNA 甲基化
肿瘤组织以抑癌基因启动子区 DNA 的低甲基化和特定胞嘧啶-磷酸-鸟嘌呤(cytidine-phosphate-guanine,CpG)位点的高甲基化为特征。Esteller 等[24]进行了一项血清循环肿瘤 DNA 甲基化的研究,发现 22 例非小细胞肺癌中有 15 例(68%)检测到 DNA 甲基化异常,但在正常肺组织样本中未检测到甲基化异常。在组织甲基化异常的原发性肿瘤中,15 个样本中有 11 个(73%)在血清样本中也存在甲基化 DNA 异常。Wielscher 等[25]采用荧光定量聚合酶链反应检测 143 例肺部疾病患者(肺癌 33 例、肺间质纤维化 68 例和慢性阻塞性肺疾病 42 例)和 61 例健康对照者的血清样本,发现甲基化诊断肺癌的灵敏度为 88%,特异度为 90%。Hulbert 等[26]研究了 2 种 DNA 甲基化模型对肺癌的诊断价值,分析了 150 例Ⅰ期或Ⅱ期非小细胞肺癌患者和 60 例对照者,其中一种三基因模型[短暂扩充细胞基因(transit amplifying cells,TAC)1、同源框基因(homeobox,HOX)A17 和 SOX17 基因]相关痰液 DNA 甲基化诊断肺癌的灵敏度为 98%,特异度为 71%;另外一种三基因模型[半胱氨酸双加氧酶 1(cysteine dioxygenase 1,CDO1)、TAC1 和 SOX17]相关血浆 DNA 甲基化诊断肺癌的灵敏度为 93%,特异度为 62%。
1.8 血清蛋白质谱
多种血清肿瘤抗原试剂盒已开发用于肺癌的诊断。血清蛋白(癌胚抗原、肿瘤抗原 125、细胞角蛋白片段 21-1)和自身抗体 NY-ESO-1 抗体在肺癌高风险人群中诊断灵敏度为 74%,特异度为 80%[27]。一项研究发现,在肺癌高风险人群中,联合多种血清肿瘤蛋白标志物(癌胚抗原、细胞角蛋白片段 21-1、肿瘤抗原 125、肝细胞生长因子和 NY-ESO-1)诊断肺癌的灵敏度仅有 49%,但特异度高达 96%,纳入临床变量可使诊断的准确性提高[28]。Molina 等[29]进行的一项研究纳入了 3 144 例肺结节患者(其中 1 828 例为肺癌),根据肺结节大小、年龄和吸烟状况的临床预测模型诊断肺癌的曲线下面积为 0.85,联合了 6 种肿瘤抗原(癌胚抗原、肿瘤抗原 153、鳞状细胞癌抗原、细胞角蛋白片段 21-1、特异性神经元烯醇酶和促胃泌素原释放肽)后曲线下面积增加到 0.93。另一项研究纳入 178 例疑似肺结节患者,显示半乳糖凝集素-3 结合蛋白和清道夫受体富半胱氨酸蛋白 1 型蛋白 M130 联合临床风险预测模型诊断肺癌的灵敏度为 97%,特异度为 44%;通过多种血清肿瘤抗原检测,可使 40% 的良性肺结节患者避免侵入性检查,但假阴性结果可能使 3% 的恶性肺结节延误治疗[30]。
2 新兴的生物标志物和新技术
2.1 痰细胞的图像分析
传统意义上,痰细胞学检查不能产生足够或有用的肺癌筛查样本,但随着细胞学技术的发展,结合人工智能的图像分析算法,痰标本的诊断价值得以提高。三维流式细胞仪可以筛查痰标本中的异常细胞[31],这是一种新的检测方法。有研究对 91 例患者行痰细胞学检查,结果显示,与 LDCT 相结合,诊断肺癌的灵敏度和特异度分别为 91.8% 和 95.2%,特异度不足 100%,因为有 2 例痰标本已通过 Cell-CT 检测方式发现异常细胞,但截至最后一次随访,这 2 例患者均未发现恶性肿瘤。该研究还发现在肺癌风险人群中,运用 Cell-CT 建立肺癌风险预测模型,其阳性预测值为 95.4%,阴性预测值为 99.9%[32]。因此,将临床、痰细胞学与影像学相结合可以提高肺癌诊断的准确性。
2.2 代谢组学
代谢组学是 20 世纪 90 年代发展起来的一门学科,展现的是肿瘤发生发展过程中的代谢过程,以及肿瘤微环境相关的表型变化。代谢组学不仅应用于肺癌方向,而且应用于乳腺癌、卵巢癌、胃癌和前列腺癌等肿瘤的研究。其优点是代谢产物数量少,而可获取的生物样本广泛。肺癌代谢产物的变化包括糖酵解、柠檬酸循环、氨基酸代谢和细胞膜合成[33]。关于尿液中排泄的一些代谢产物,即肌酸核糖体和 N-乙酰神经氨酸,在临床发现疾病之前与肺癌高风险具有相关性[34]。2016 年 Puchades-Carrasco 等[33]发现,在肺癌患者中,鼠类肉瘤病毒癌基因(kirsten rat sarcoma viral oncogene,KRAS)/Kelch 样环氧氯丙烷相关蛋白-1(Kelch-like ECH-associated protein 1,KEAP1)基因或 KRAS/核呼吸因子 2(nuclear respiratory factor2,NRF2)突变可导致谷氨酰胺的分解,这又为运用代谢组学筛查肺癌提供了理论依据。不仅是血液样本,痰液或呼出气冷凝物也可用于肺癌高危人群筛查或鉴别孤立性肺结节的良恶性。此外,代谢组学还可以区分肿瘤组织学亚型和遗传学基础[35-36]。
2.3 肺癌的遗传易感性
全基因组关联研究发现,染色体 15q25.1 位点是肺癌的主要易感区,为肺癌群体提供了遗传学证据,这在肺癌风险预测模型中也很重要[37]。2017 年 Wang 等[38]分析了 1 000 多个候选基因,确定了 21 个基因[脱嘌呤/脱嘧啶核酸内切酶 1(apurinic/apyrimidinic endonuclease 1,APEX1)、共济失调毛细血管扩张症突变(ataxia-telangiectasia mutated,ATM)、轴抑制蛋白 2(axis inhibition protein 2,AXIN2)、尼古丁乙酰胆碱受体 α3 亚基(cholinergic receptor nicotinic alpha 3 subunit,CHRNA3)、尼古丁乙酰胆碱受体 α5 亚基(cholinergic receptor nicotinic alpha 5 subunit,CHRNA5)、唇腭裂跨膜1 样蛋白(cleft lip and palate transmembrane 1 like,CLPTM1L)、CXC 型趋化因子受体 2(C-X-C motif receptor2,CXCR2)、细胞色素 P450(cytochrome P450,CYP)1A1、CYP2E1、切除修复交叉互补基因(excision repair cross complement,ERCC)1、ERCC2、成纤维细胞生长因子受体(fibroblast growth factor receptor,FGFR)4、羟赖氨酸激酶(hydroxylysine kinase,HYKK)、miR146a、miR-196a2、8-羟基鸟嘌呤 DNA 糖苷酶(8-Oxoguanine DNA glycosylase,OGG)1、对氧磷酶(paraoxonase,PON)1、REV3L(protein reversionless 3-like)、超氧化物歧化酶 2(superoxide dismutase 2,SOD2)、端粒酶逆转录酶(telomerase reverse transcriptase,TERT)和肿瘤蛋白 p53(tumor protein p53,TP53)]中的 22 种变异形式与肺癌易感性有显著的相关性。而肿瘤阵列联盟研究计划(OncoArray Consortium)发现了新的肺癌易感基因[39],但这些新的肺癌易感基因在肺癌筛查中的价值尚待证实。综上,基于全基因组关联研究的大量基因信息开展研究,利用最先进的数学和统计学方法,将单核苷酸多态性与风险模型、人工智能和机器监督学习相结合[40-41],大量疑难病例的遗传易感性将可能被揭示,从而推动个体化的精准治疗。
2.4 分子生物标志物与影像组学和人工智能的结合
影像组学是荷兰研究人员 Philippe Lambin 在 2012 年首次提出。它是传统影像学与分子生物学、分子病理学、信息学于一体的新兴影像诊断方法。这是一个新的研究领域,是在肺癌影像表型和肿瘤微环境相关的海量数据中寻找生物标志物[42-43]。在人工智能时代,丰富的影像数据为这一领域的进步奠定了基础。通过肺影像数据库联盟和图像数据库资源计划,CT 图像的机器自我学习可以鉴别肺结节的良恶性[44]。目前该领域的研究主要集中在实时识别兴趣区域病灶;肿瘤微环境的直接时空表型特征;在局部(结节)、区域(叶)和器官层面上整合多维度信息;在端到端学习中整合成像、临床和组学数据。
通过影像的深度学习,影像组学可以识别表皮生长因子受体(epidermal growth factor receptor,EGFR)和 KRAS 突变的肿瘤[45]。基于影像数据的定量分析也可以预测肿瘤患者的生存率[46]。血浆生物标志物与影像组学特征的结合可更好地甄别肺结节的良恶性[47]。将血清生物标志物、肺结节的临床特征和影像学特征整合的预测模型在几项研究中准确识别了恶性肺结节[48-50]。
3 生物标志物在肺癌筛查中的应用前景
尽管生物标志物在肺癌筛查中颇具潜力,但多数尚在研究阶段,并未在临床实践中推广应用。现有的生物标志物研究主要集中在血液样本,而其他生物样本如痰液、支气管灌洗液、呼出气、尿液和唾液等则鲜有涉及。分析不同来源的生物标志物(如 DNA/RNA、蛋白质、脂质、代谢物等),多组学的生物标志物可使肺癌诊断能力进一步提升。总体而言,综合模型优于单独使用血清生物标志物,尤其是将生物标志物、影像组学和人工智能相结合,建立肺癌筛查预测综合模型,将是未来提升肺癌筛查能力,实现肺癌早诊早治的发展方向。
肺癌是我国发病率和病死率最高的恶性肿瘤[1],早诊早治是提高肺癌患者生存率和改善预后的关键。低剂量 CT(low-dose computed tomography,LDCT)是在高风险人群(根据年龄和吸烟史定义)中筛查肺癌的一种方法,其对肺癌筛查的价值已得到美国肺癌筛查试验[2]、国际早期肺癌行动计划[3]、欧洲 NELSON 试验[4]、意大利多中心肺癌筛查试验[5]等的证实。尽管对高风险人群采用 LDCT 筛查肺癌在全球广为应用,但仍存在不少争议,包括高风险人群界定标准不一、CT 筛查周期差异大、假阳性率高和效益成本比低等。近年来肺癌的生物标志物是研究热点,新兴的生物标志物检测在肺癌的筛查中显示出一定的潜力,将生物标志物、影像组学和人工智能相结合,建立肺癌筛查预测综合模型,可能是未来提升肺癌筛查能力的发展方向。本文概述了生物标志物在肺癌筛查中的应用,介绍了新兴的生物标志物和新技术,探讨了生物标志物在肺癌筛查中的应用前景,旨在为提升肺癌筛查能力和实现肺癌早诊早治提供一定的理论依据。
1 生物标志物在肺癌筛查中的应用
1.1 自身抗体
针对肺癌抗原的自身抗体通常出现在临床前阶段,可能远早于临床症状或影像学表现。单一自身抗体诊断肺癌的特异性高,但敏感性低。结合多种自身抗体则可提高诊断的特异性和敏感性。Boyle 等[6]研究发现,使用 6 种肺癌自身抗体[抑癌基因 p53、纽约食管鳞状细胞癌 1(New York esophageal squamous cell carcinoma 1,NY-ESO-1)、肿瘤相关基因(cancer-associated gene,CAGE)、三磷酸腺苷(adenosine triphosphate,ATP)结合 RNA 解旋酶 GBU4-5、膜联蛋白-1(annexin-1)和性别决定区 Y 框蛋白(sex determining region Y-box protein,SOX)2 的抗体]诊断肺癌的特异度为 89%,而灵敏度为 39%。另一项研究纳入了 1 987 例肺结节患者(结节直径为 4~20 mm),在 CT 筛查风险模型中加入了 7 种肺癌自身抗体[p53、NY-ESO-1、CAGE、GBU4-5、SOX2、人抗原 R(human antigen R,HuD)和黑色素瘤抗原(melanoma antigen,MAGE)-A4 的抗体],使肺癌诊断的特异度显著提高(>92%),阳性预测值达 70% 以上[7]。Chapman 等[8]在 154 例患者(104 例肺癌和 50 例正常对照)中检测了 7 种自身抗体[p53、c-myc、人表皮生长因子受体-2(human epidermal growth factor receptor-2,HER2)、NY-ESO-1、CAGE、黏蛋白 1(mucin,MUC1)和 GBU4-5 的抗体],其灵敏度为 61%,特异度为 90%。上述研究结果提示,肺癌自身抗体和其他肺癌筛查方式相结合,其临床价值可能会进一步提高。
1.2 补体片段
肺癌可通过经典补体途径激活补体级联效应,该途径下游分裂产物补体片段 4d(complement fragment 4d,C4d)的浓度在肺癌患者的血液和体液中增加[9]。有研究在 190 例无症状肺结节患者中检测血浆 C4d 水平,结果发现血浆 C4d 水平与肺癌风险具有相关性[比值比=4.38,95% 置信区间(1.61,11.93)],且肺气肿和慢性阻塞性肺疾病等潜在的混杂因素并不影响 C4d 水平,恶性肺结节患者的血浆 C4d 水平显著高于良性肺结节患者[9]。Ajona 等[10]分析了 67 例肺结节患者(肺结节直径 8~30 mm),发现血浆 C4d 诊断良性肺结节的阴性预测值为 84%,阳性预测值为 54%,其特异度为 89%,而灵敏度仅有 44%。
1.3 微 RNA(microRNA,miRNA)
循环 miRNA 是非编码 RNA,具有调控功能,能反映肿瘤和宿主之间的相互作用,已成为肿瘤诊断和预后判断的潜在生物标志物,且 miRNA 与肿瘤分期和基因突变无关[11]。Sozzi 等[12]进行的多中心临床研究评估了血浆 miRNA 识别分类器(microRNA signature classifier,MSC)对肺癌高风险人群的诊断价值。该研究采集了 939 例受试者(肺癌患者 69 例、LDCT 筛查的肺癌风险人群 652 例、对照组 287 例)的血浆,通过荧光定量聚合酶链反应检测 miRNA。结果显示,MSC 诊断肺癌的灵敏度为 87%,特异度为 81%;LDCT 筛查肺癌的灵敏度为 79%,特异度为 81%,假阳性率高达 19.4%;MSC 和 LDCT 联合应用可使 LDCT 的假阳性率降至 3.7%。而在肺癌术后患者中,血浆 MSC 还能监控肿瘤复发[13]。此外,正在进行的 3 项独立的大型肺癌筛查研究共纳入 16 000 例肺癌高危患者,或许将进一步验证 miRNA 对良恶性肺结节的诊断价值。
1.4 循环肿瘤 DNA
循环肿瘤 DNA 指导晚期肿瘤精准治疗的价值已被相关研究证实[14],但在早期肺癌诊断中的作用仍不确定。Abbosh 等[15]在 96 例Ⅰ~Ⅲ期非小细胞肺癌患者中检测血液循环肿瘤 DNA,灵敏度从Ⅰ期肺腺癌的 15% 到Ⅱ期或Ⅲ期鳞状细胞癌的 100% 不等,总体灵敏度为 48%。近期一项研究整合了血液循环肿瘤 DNA 和血清蛋白质谱技术,纳入了 1 005 例Ⅰ~Ⅲ期多种肿瘤患者和 812 名非肿瘤对照者,虽然总体特异度高于 99%,但灵敏度总体偏低,肺癌中灵敏度为 59%,乳腺癌中灵敏度 33%,而在卵巢癌中灵敏度高达 98%[16]。
1.5 循环肿瘤细胞(circulating tumor cell,CTC)
CTC 是原发肿瘤或转移瘤脱落进入血液循环的肿瘤细胞。CTC 数量少,且呈异质性,因此检测技术要求较高,目前仍在探索中。CTC 作为液体活检的一种方法也有一定优势,如可用于早期肺癌的筛查[17]和肺癌进展的动态检测,也可监测肿瘤的异质性,而且通过对 CTC 的基因检测,可以发现基因突变,从而指导治疗。Ilie 等[18]早期研究了肺癌的风险因素,检测了 245 例无癌症患者的 CTC 情况,包括 168 例慢性阻塞性肺疾病患者和 77 例无慢性阻塞性肺疾病患者,每年对 CTC 阳性慢性阻塞性肺疾病患者进行 CT 筛查,发现 CTC 检测相比 CT 筛查能早 1~4 年发现肺病病灶。Chen 等[19]通过检测 CTC 对肺癌或肺部良性结节患者以及健康者进行研究,其中肺癌或肺部良性结节患者中 CTC 阳性率为 84%,而后者中仅 4.2%。推测随着新技术的发展,CTC 联合影像等相关辅助检查,对肺癌的诊断或许能有更大提高。
1.6 外泌体
外泌体是 50~150 nm 直径的分泌膜包裹的囊泡(细胞外囊泡)[20]。目前学术界对外泌体能否指导诊断及治疗比较感兴趣[21],但相关研究却很少。近来 Zhang 等[22]对肺恶性结节和良性结节患者血浆中的外泌体进行了研究,通过对外泌体 miRNA 特征图谱的探索,发现其对肺癌早期诊断有着重要的意义。目前也有文献对外泌体蛋白调控肿瘤进展的机制进行了研究,并总结了其作为肿瘤标志物对肺癌筛查的可行性[23]。
1.7 DNA 甲基化
肿瘤组织以抑癌基因启动子区 DNA 的低甲基化和特定胞嘧啶-磷酸-鸟嘌呤(cytidine-phosphate-guanine,CpG)位点的高甲基化为特征。Esteller 等[24]进行了一项血清循环肿瘤 DNA 甲基化的研究,发现 22 例非小细胞肺癌中有 15 例(68%)检测到 DNA 甲基化异常,但在正常肺组织样本中未检测到甲基化异常。在组织甲基化异常的原发性肿瘤中,15 个样本中有 11 个(73%)在血清样本中也存在甲基化 DNA 异常。Wielscher 等[25]采用荧光定量聚合酶链反应检测 143 例肺部疾病患者(肺癌 33 例、肺间质纤维化 68 例和慢性阻塞性肺疾病 42 例)和 61 例健康对照者的血清样本,发现甲基化诊断肺癌的灵敏度为 88%,特异度为 90%。Hulbert 等[26]研究了 2 种 DNA 甲基化模型对肺癌的诊断价值,分析了 150 例Ⅰ期或Ⅱ期非小细胞肺癌患者和 60 例对照者,其中一种三基因模型[短暂扩充细胞基因(transit amplifying cells,TAC)1、同源框基因(homeobox,HOX)A17 和 SOX17 基因]相关痰液 DNA 甲基化诊断肺癌的灵敏度为 98%,特异度为 71%;另外一种三基因模型[半胱氨酸双加氧酶 1(cysteine dioxygenase 1,CDO1)、TAC1 和 SOX17]相关血浆 DNA 甲基化诊断肺癌的灵敏度为 93%,特异度为 62%。
1.8 血清蛋白质谱
多种血清肿瘤抗原试剂盒已开发用于肺癌的诊断。血清蛋白(癌胚抗原、肿瘤抗原 125、细胞角蛋白片段 21-1)和自身抗体 NY-ESO-1 抗体在肺癌高风险人群中诊断灵敏度为 74%,特异度为 80%[27]。一项研究发现,在肺癌高风险人群中,联合多种血清肿瘤蛋白标志物(癌胚抗原、细胞角蛋白片段 21-1、肿瘤抗原 125、肝细胞生长因子和 NY-ESO-1)诊断肺癌的灵敏度仅有 49%,但特异度高达 96%,纳入临床变量可使诊断的准确性提高[28]。Molina 等[29]进行的一项研究纳入了 3 144 例肺结节患者(其中 1 828 例为肺癌),根据肺结节大小、年龄和吸烟状况的临床预测模型诊断肺癌的曲线下面积为 0.85,联合了 6 种肿瘤抗原(癌胚抗原、肿瘤抗原 153、鳞状细胞癌抗原、细胞角蛋白片段 21-1、特异性神经元烯醇酶和促胃泌素原释放肽)后曲线下面积增加到 0.93。另一项研究纳入 178 例疑似肺结节患者,显示半乳糖凝集素-3 结合蛋白和清道夫受体富半胱氨酸蛋白 1 型蛋白 M130 联合临床风险预测模型诊断肺癌的灵敏度为 97%,特异度为 44%;通过多种血清肿瘤抗原检测,可使 40% 的良性肺结节患者避免侵入性检查,但假阴性结果可能使 3% 的恶性肺结节延误治疗[30]。
2 新兴的生物标志物和新技术
2.1 痰细胞的图像分析
传统意义上,痰细胞学检查不能产生足够或有用的肺癌筛查样本,但随着细胞学技术的发展,结合人工智能的图像分析算法,痰标本的诊断价值得以提高。三维流式细胞仪可以筛查痰标本中的异常细胞[31],这是一种新的检测方法。有研究对 91 例患者行痰细胞学检查,结果显示,与 LDCT 相结合,诊断肺癌的灵敏度和特异度分别为 91.8% 和 95.2%,特异度不足 100%,因为有 2 例痰标本已通过 Cell-CT 检测方式发现异常细胞,但截至最后一次随访,这 2 例患者均未发现恶性肿瘤。该研究还发现在肺癌风险人群中,运用 Cell-CT 建立肺癌风险预测模型,其阳性预测值为 95.4%,阴性预测值为 99.9%[32]。因此,将临床、痰细胞学与影像学相结合可以提高肺癌诊断的准确性。
2.2 代谢组学
代谢组学是 20 世纪 90 年代发展起来的一门学科,展现的是肿瘤发生发展过程中的代谢过程,以及肿瘤微环境相关的表型变化。代谢组学不仅应用于肺癌方向,而且应用于乳腺癌、卵巢癌、胃癌和前列腺癌等肿瘤的研究。其优点是代谢产物数量少,而可获取的生物样本广泛。肺癌代谢产物的变化包括糖酵解、柠檬酸循环、氨基酸代谢和细胞膜合成[33]。关于尿液中排泄的一些代谢产物,即肌酸核糖体和 N-乙酰神经氨酸,在临床发现疾病之前与肺癌高风险具有相关性[34]。2016 年 Puchades-Carrasco 等[33]发现,在肺癌患者中,鼠类肉瘤病毒癌基因(kirsten rat sarcoma viral oncogene,KRAS)/Kelch 样环氧氯丙烷相关蛋白-1(Kelch-like ECH-associated protein 1,KEAP1)基因或 KRAS/核呼吸因子 2(nuclear respiratory factor2,NRF2)突变可导致谷氨酰胺的分解,这又为运用代谢组学筛查肺癌提供了理论依据。不仅是血液样本,痰液或呼出气冷凝物也可用于肺癌高危人群筛查或鉴别孤立性肺结节的良恶性。此外,代谢组学还可以区分肿瘤组织学亚型和遗传学基础[35-36]。
2.3 肺癌的遗传易感性
全基因组关联研究发现,染色体 15q25.1 位点是肺癌的主要易感区,为肺癌群体提供了遗传学证据,这在肺癌风险预测模型中也很重要[37]。2017 年 Wang 等[38]分析了 1 000 多个候选基因,确定了 21 个基因[脱嘌呤/脱嘧啶核酸内切酶 1(apurinic/apyrimidinic endonuclease 1,APEX1)、共济失调毛细血管扩张症突变(ataxia-telangiectasia mutated,ATM)、轴抑制蛋白 2(axis inhibition protein 2,AXIN2)、尼古丁乙酰胆碱受体 α3 亚基(cholinergic receptor nicotinic alpha 3 subunit,CHRNA3)、尼古丁乙酰胆碱受体 α5 亚基(cholinergic receptor nicotinic alpha 5 subunit,CHRNA5)、唇腭裂跨膜1 样蛋白(cleft lip and palate transmembrane 1 like,CLPTM1L)、CXC 型趋化因子受体 2(C-X-C motif receptor2,CXCR2)、细胞色素 P450(cytochrome P450,CYP)1A1、CYP2E1、切除修复交叉互补基因(excision repair cross complement,ERCC)1、ERCC2、成纤维细胞生长因子受体(fibroblast growth factor receptor,FGFR)4、羟赖氨酸激酶(hydroxylysine kinase,HYKK)、miR146a、miR-196a2、8-羟基鸟嘌呤 DNA 糖苷酶(8-Oxoguanine DNA glycosylase,OGG)1、对氧磷酶(paraoxonase,PON)1、REV3L(protein reversionless 3-like)、超氧化物歧化酶 2(superoxide dismutase 2,SOD2)、端粒酶逆转录酶(telomerase reverse transcriptase,TERT)和肿瘤蛋白 p53(tumor protein p53,TP53)]中的 22 种变异形式与肺癌易感性有显著的相关性。而肿瘤阵列联盟研究计划(OncoArray Consortium)发现了新的肺癌易感基因[39],但这些新的肺癌易感基因在肺癌筛查中的价值尚待证实。综上,基于全基因组关联研究的大量基因信息开展研究,利用最先进的数学和统计学方法,将单核苷酸多态性与风险模型、人工智能和机器监督学习相结合[40-41],大量疑难病例的遗传易感性将可能被揭示,从而推动个体化的精准治疗。
2.4 分子生物标志物与影像组学和人工智能的结合
影像组学是荷兰研究人员 Philippe Lambin 在 2012 年首次提出。它是传统影像学与分子生物学、分子病理学、信息学于一体的新兴影像诊断方法。这是一个新的研究领域,是在肺癌影像表型和肿瘤微环境相关的海量数据中寻找生物标志物[42-43]。在人工智能时代,丰富的影像数据为这一领域的进步奠定了基础。通过肺影像数据库联盟和图像数据库资源计划,CT 图像的机器自我学习可以鉴别肺结节的良恶性[44]。目前该领域的研究主要集中在实时识别兴趣区域病灶;肿瘤微环境的直接时空表型特征;在局部(结节)、区域(叶)和器官层面上整合多维度信息;在端到端学习中整合成像、临床和组学数据。
通过影像的深度学习,影像组学可以识别表皮生长因子受体(epidermal growth factor receptor,EGFR)和 KRAS 突变的肿瘤[45]。基于影像数据的定量分析也可以预测肿瘤患者的生存率[46]。血浆生物标志物与影像组学特征的结合可更好地甄别肺结节的良恶性[47]。将血清生物标志物、肺结节的临床特征和影像学特征整合的预测模型在几项研究中准确识别了恶性肺结节[48-50]。
3 生物标志物在肺癌筛查中的应用前景
尽管生物标志物在肺癌筛查中颇具潜力,但多数尚在研究阶段,并未在临床实践中推广应用。现有的生物标志物研究主要集中在血液样本,而其他生物样本如痰液、支气管灌洗液、呼出气、尿液和唾液等则鲜有涉及。分析不同来源的生物标志物(如 DNA/RNA、蛋白质、脂质、代谢物等),多组学的生物标志物可使肺癌诊断能力进一步提升。总体而言,综合模型优于单独使用血清生物标志物,尤其是将生物标志物、影像组学和人工智能相结合,建立肺癌筛查预测综合模型,将是未来提升肺癌筛查能力,实现肺癌早诊早治的发展方向。