人工智能和PET/CT影像组学在非小细胞型肺癌诊疗中的应用

来源:临床放射学杂志 2025.09.09
我要投稿

作者:汤秋菊,陈松,中国医科大学第一附属医院核医学科

 

在我国,肺癌是最常见的恶性肿瘤之一,也是癌症患者死亡的首要病因。影像学技术在肺癌的早期诊断、疾病分期、疗效评价的过程中都发挥着关键的作用,如何更好地利用影像学技术降低肺癌患者的死亡率,提高患者生存期和治愈率是目前亟待解决的问题。

 

影像组学是近年来被应用于医学影像分析的新技术,是一种运用自动化数据特征提取算法,从医学影像中提取并量化海量特征数据的分析方法。影像组学极大的丰富了医学成像的定量评估指标,提供了图像中肉眼难以观测的定量信息。影像组学特征众多,从目前发表的各类研究来看涉及到的影像组学特征多达数百个,如何有效地分析这些庞大的数据是近年来临床工作者研究的难点和热点问题之一。

 

人工智能(artificial intelligence, AI)的快速发展为更好地分析和利用影像学数据,特别是影像组学数据,提供了新的方法。1998年,Yann LeCun等提出了神经网络的计算机模型,但由于当时计算机运算能力的限制,该技术没有被大量推广。近年来随着计算机运算能力的提高,神经网络重新成为了研究热点并逐渐演化为AI,该技术为大数据的处理提供了新的手段,使得计算机可以从大量的图像信息中筛选出重要的指标,快速发现数据间的潜在联系。通过该技术,计算机在图像分类、目标检测等多个领域有了逐渐取代并超越人类的趋势。

 

影像组学为AI提供了丰富的数据,将影像组学大数据和AI联合,也是近年来的研究热点,或许是目前充分利用影像组学大数据的最有效手段之一。PET/CT为影像组学提供了代谢和解剖两种图像是诊断肺癌、分期与再分期、放疗靶区勾画(尤其合并肺不张或有静脉CT造影禁忌症时)、疗效和预后评估的最佳方法之一。借助机器学习和影像组学两种技术,PET/CT的图像得到了充分的分析和挖掘。目前两种技术的联合应用在肺癌诊断、判断是否存在淋巴结转移、疗效预测等领域均取得了一定的研究进展。

 

1. 肺癌诊断

 

肺癌早期诊断和治疗可以明显提升患者的生存率和生活质量,影像学表现是肺癌早期诊断的关键,但如何提高影像学诊断的准确性是目前的难点之一。肺癌在疾病的早期通常表现为孤立性肺结节(solitary pulmonary nodule, SPN)和磨玻璃结节(ground-glass nodule, GGN)。

 

SPN和GGN的发生率都很高,非典型腺瘤性增生(atypical adenomatous hyperplasia, AAH)、原位腺癌(adenocarcinoma in situ, AIS)、微侵袭性腺癌(minimally invasive adenocarcinoma, MIA)和侵袭性腺癌(invasive adenocarcinoma, IAC)均可表现为GGN。鉴于肺癌早期诊断的重要性,如何正确判断SPN和GGN的良恶性是目前临床急需解决的问题。

 

部分国外学者推荐标准化摄取值(SUV)>2.5 g/ml作为鉴别恶性结节的诊断阈值。然而18F-FDG的高摄取并不是恶性结节的特异表现。在临床操作中,感染性肺部疾病,如肉芽肿、结核病会造成大量的假阳性结果。而我国作为第二大的结核发病率的国家,感染性肺疾病发病率远高于欧美国家,因此应用18F-FDG PET/CT 进行肺结节良恶性诊断时假阳性率和准确率有着明显不同。

 

为了提高18F-FDG PET/CT显像对于肺结节良恶性诊断的准确性,影像组学为临床医师提供了新的研究方向。研究发现源自双时相PET/CT图像的影像组学指标可用作恶性SPN的良好预测特征,与常用的临床指标和图像参数相比,延迟期PET图像中提取的影像组学特征“复杂度”在区分良性和恶性结节方面鉴别能力有显著的提升。

 

也有研究发现了恶性结节的影像组学特征“粗糙度”较低,而灰度共生矩阵(GLCM)中提取的影像组学特征“差异方差”、“熵”和“复杂程度”较高。借助代谢和解剖两种图像的加持,与CT图像中提取影像组学特征相比,利用PET/CT图像的影像组学特征建立的良恶性预测模型总体上优于基于CT特征的模型。

 

与SPN的研究相比,在PET/CT领域利用影像组学进行GGN良恶性判断的研究相对较少。GGN分为纯磨玻璃结节(pure GGN,pGGN)和混合磨玻璃结节(mixed GGN,mGGN),pGGN糖代谢相对较低,所以通过PET对其进行鉴别的难度较大。现有基于PET/CT的研究大多数都是针对mGGN。

 

研究表明仅通过FDG的摄取值判断良恶性准确性较低,而且对于恶性mGGN的SUVmax诊断阈值目前尚没有一致的结论,不同研究推荐的诊断阈值范围在1.0~2.0之间。PET/CT同时提供了PET的生物学代谢信息还有CT的解剖学信息,充分利用这些信息可以提高GGN良恶性鉴别的准确性。

 

Niu等建立了一个以患者性别、结节位置、边缘、胸膜凹陷、SUV指数(结节SUVmax与肝脏SUVmax的比值)5个参数来鉴别GGNs良恶性的预测模型,这项研究表明以PET/CT的图像参数与临床特征建立的预测模型可以提高GGNs的术前诊断水平;他的另一项研究提出,将PET/CT与高分辨CT联合可以提高直径为3 cm及以下GGN的诊断准确性。

 

提高PET/CT对于恶性肺结节的诊断特异性是目前亟待解决的问题之一,研究人员发现将PET/CT图像和机器学习相结合可以提高特异性。而作为机器学习的重要子集——深度学习,在肺结节的良恶性鉴别和降低PET/CT图像假阳性率方面均优于传统的影像组学技术。

 

2. 判断是否存在淋巴结转移

 

肺门和纵隔淋巴结是肺癌常见的淋巴结转移位置,影像学检查是判断患者淋巴结分期的重要的、无创的检查手段之一。最近有研究比较了18F-FDG PET/CT、CT扫描和支气管内超声/经支气管针吸活检(EBUS/TBNA)在非小细胞肺癌术前纵隔淋巴结分期中的诊断准确性。研究发现纵隔镜检查和EBUS/TBNA检查的总体准确率最高,分别为88.6%与88.2%,而18F-FDG PET/CT检查的准确率为70.2%。目前18F-FDG PET/CT诊断淋巴结转移的准确性较纵隔镜检查和EBUS/TBNA仍有较大差距,如何进一步提高PET/CT诊断淋巴结转移的准确性是亟待解决的问题。

 

随着近年来影像组学技术的出现,影像学可以利用的定量特征大大增加,从而补充更多有效的预测信息,使得影像学分析在淋巴结分期中代替有创的侵入性病理诊断技术(手术、纵隔镜)成为了可能。Wang等研究发现偏度、总能量、灰度游程长度矩阵(GLRLM)中的小依赖低灰度强调(SDLGLE)和灰度非均匀性归一化(GLNN)是预测N0肺腺癌隐匿性淋巴结转移最有效的特征。

 

最近有一项研究回顾性分析了528例肺腺癌患者,发现基于PET/CT的影像组学模型对胸部淋巴结转移预测的准确率高达0.865。另一项研究回顾性分析了716例非小细胞肺癌患者,证实基于18F-FDG PET/CT分析的影像组学模型对于非小细胞肺癌患者纵隔淋巴结分期有着不错的表现(AUC:0.81,敏感性:0.794,特异性:0.704)。但是由于一些良性病变引起的炎性淋巴结,使纵隔内轻度18F-FDG摄取掩盖了淋巴结内小的转移灶。此外,由于转移的淋巴结太小而不能精确描绘,这些降低了影像组学分析的准确性。为了进一步提高诊断准确率,一些研究者已经开始通过机器学习算法建立模型来预测淋巴结转移,运用不同的模型所得出的结论也不近相同。

 

Pak等建立了一个决策树模型,该模型具有96.23%的高特异度,但是具有40%的相对低的敏感度。Yin等建立9个支持向量机模型(SVM),发现SURblood(淋巴结最大标准摄取值与主动脉弓的比值)在模型中起主导作用,其中表现最佳的模型6平均准确率接近0.8,平均AUC约为0.82。Wang等比较了4种经典机器学习方法(随机森林、支持向量机、自适应增强和人工神经网络)和卷积神经网络(CNN)以及影像科医师诊断的准确性。他们得出的结论是:经典的机器学习方法和CNN表现相似,均优于影像组学(肿瘤大小、CT值、SUV、图像对比度和强度标准差)。

 

此外,与影像科医师诊断相比,均产生了更高的特异度,但敏感度较低,并且准确率没有显著差异(CNN为0.86,影像科医师诊断为0.81)。但是CNN不需要肿瘤分割或者特征计算,所以CNN比其他方法更加方便、客观,将CNN与诊断特征相结合也许是未来一个有前景的方向。近期也有研究将临床因素和影像组学结合起来,例如:CEA、肿瘤的大小、年龄、组织学亚型、肿瘤的位置与肿瘤的实性比在预测肺腺癌胸部淋巴结转移中有一定的作用。

 

也有研究证实与单独的PET影像组学建立模型(模型1)与CT影像组学结合临床因素建立模型(模型2)相比,将PET影像组学、CT影像组学和临床因素结合的预测模型(模型3)效果最好(这3个模型外部验证的AUC分别为:模型1:0.808;模型2:0.802;模型3:0.841)。

 

3. 非小细胞肺癌的生存预测

 

对患者预后判断一直是一个重要的临床问题,TNM分期是目前临床上最常用的预后判断指标。然而,具有相同TNM分期的患者表现出不同的预后,意味着除了TNM分期以外,仍有其他未知的因素可以影响患者预后。基于PET/CT图像提取的影像组学特征可反映肿瘤异质性,但是众多影像组学指标中哪些影像组学特征可以预测患者预后起到决定性作用,并没有一个统一的结论,此外大部分研究都是预测某一种治疗方法的预后,并不能确定所得出的结论是否可以用于预测其他治疗方法的预后。

 

例如:有一项研究发现在CT特征中:GLRLM中的“短行程强调”,PET特征中的:SUVmean、GLRLM中“长区域高灰度强调”以及“长行程高灰度强调”是进行手术治疗患者的无病生存率的预测因素;另一项研究则证实影像组学可以预测进行免疫治疗患者的预后;还有一项研究对接受碳离子放疗的Ⅰ期患者进行生存预测,结果发现MTV具有预测能力。

 

由于肿瘤可以通过血管、间质等侵袭邻近区域,在图像上可呈现毛刺、血管汇聚或胸膜黏连等其他表现。它们都可以在PET图像上呈现细微的不均匀摄取。为了研究肿瘤邻近区域是否有预测预后的能力,有一项研究将半影区(在肿瘤表面向外延伸1 cm)纳入研究范围,结果发现半影区提取的特征提高了预测准确性。

 

虽然研究表明影像组学与预后相关,但在很大程度上影像组学、临床因素和肿瘤生物学之间的复杂机制是未知的。一项多中心的研究结果显示影像组学特征、信号通路和临床因素之间存在相关性,影像组学特征与免疫系统、p53通路、细胞周期调节和转化生长因子β受体信号存在联系,病理学评分与影像组学评分具有相关性,影像组学、基因组学和临床信息在预测患者预后时具有互补价值。

 

4. 展望

 

目前,已发布的很多研究表明影像组学对于肺癌的诊断、精准医疗以及生存预测等方面有着较大的优势,特别是随着PEC/CT影像组学不断深入的研究,影像组学与AI结合展现出巨大的研究前景,但是在临床实践中的应用是有限的。大致原因如下:

 

(1)目前大部分都是小样本,单中心的研究。即使通过小样本研究得出一个“完美”的预测模型,但仍需要大样本多中心的研究进行验证,这与本研究影像组学的初衷不符。

 

(2)可重复性是科学研究的三大原则之一,但是由于不同的患者特征、不一致的成像参数,特征计算所涉及复杂的工作流程和相关的实施方法存在很大差异,以及大多数研究中缺乏技术细节导致影像组学特征的重复性较低。

 

(3)模型标准化问题:影像组学中特征选择的方法和机器学习模型的方法很多,通过特征选择和机器学习方法的不同组合建立的模型可能具有不同的性能,而对于哪种组合是最优组合,不同的研究有着不同的结果,例如:Zhou等从PET和CT图像中提取影像组学特征,研究发现梯度推进决策树和随机森林分别被认为是PET和CT数据集的最佳分类方法,且梯度推进决策树被认为是最优的特征选择方法;而Han等采取更大的样本量进行回顾性分析,研究发现线性判别分析(AUC:0.863;精密度:0.794)和支持向量机(AUC:0.863;精密度:0.792)分类器与ℓ2,1 NR特征选择方法相结合,都获得了最佳性能,此项研究也表明PET/CT影像组学联合VGG16DL算法(AUC从0.863提高到0.903;准确率从0.792提高到0.841)优于与影像组学相结合的传统机器学习方法;另一项研究表明具有径向基函数核的支持向量机(SVM-RBF)表现出最好的性能。

 

(4)伦理问题:任何一个新科技应用于实际时,都不能避开对于伦理的考量。由于AI系统运行不透明,在许多机器学习模型中,虽然很容易看出算法在做什么,但是很难理解其背后的医学机制,所以多数AI的运算过程也被称为“暗箱”。

 

AI和影像组学的出现丰富了PET/CT图像的分析方法,为肺结节良恶性判断、判断是否存在淋巴结转移和患者预后判断提供了新的方法,但目前仍处于研究阶段,期待随着研究的深入这些先进的技术手段能够早日应用于临床工作中。

 

来源:汤秋菊,陈松.人工智能和PET/CT影像组学在非小细胞型肺癌诊疗中的应用[J].临床放射学杂志,2024,43(05):714-717.