基于CT影像的深度学习在肺血栓栓塞症中的应用进展
作者:陈蓉,杨越,于雅茜,河北北方学院研究生学院;杨飞,河北北方学院附属第一医院医学影像部
肺血栓栓塞症(pulmonary thromboembolism,PTE)是一组由内源性或外源性栓子造成呼吸和循环系统障碍的病理生理综合征。由于其临床表现缺乏特异性,易出现误诊、漏诊,延误病人治疗时间,未经治疗的PTE病人致死率高达30%,如果临床医生能及时诊断和采取治疗措施,其病死率可降至2%~10%。因此,及时发现、尽早治疗有利于改善PTE病人的预后、提高生存率。
目前,CT肺动脉成像(CT pulmonary angiography,CTPA)为诊断PTE的首选影像学方法,利用CTPA影像学参数能够对PTE病人进行精确诊断,也是指导治疗、评估风险和预后的重要手段;同时能够对PTE病人进行风险分层,有助于病人的个性化治疗。深度学习(deep learning,DL)是人工智能(artificial intelligence,AI)领域的一个重要分支。其主要研究方法是利用计算机模拟人脑神经元,构建人工神经网络,自动分析并总结数据,“学习”是神经网络的核心特征,数据量越大,识别效果越好。
深度学习以PTE病人影像数据为基础,通过各种神经网络自动学习和提取特征,可用于诊断、识别、挖掘PTE影像和诊断报告中的隐含信息,辅助和指导PTE诊疗等,是目前和未来研究的主要方向。本文就近年基于CT影像的DL在PTE疾病中的应用和进展进行综述。
1. PTE自动检测与诊断
DL目前已广泛应用于临床,在医学影像中的应用主要包括影像级别和像素级别的分析,前者可用于判断是否存在病灶及鉴别良恶性,后者可用于检测病灶位置和分割病灶组织等。卷积神经网络(convolutional neural network,CNN)是图像分析的标志性DL技术和理想选择,由多个相互连接的神经元层组成,浅层可识别低层次图像模式,如线、环及其他简单几何图形等,深层可更深入地理解图像,做出例如“有PTE的影像”和“无PTE的影像”等类似的判断。
Weikert等将1 465个CTPA影像作为一个大规模的数据集,使用由多个CNN组成的Resnet架构的3D深度CNN,评估AI在CTPA中自动检测PTE的效能,结果显示其敏感度和特异度达92.7%、95.5%。该研究也纳入对比剂充盈欠佳的病人,结果显示含有中心栓子的PTE检出率最高(95.7%),其次是节段栓子(93.3%)和亚节段栓子(85.7%),表明在大型数据测试集上AI算法对自动检测PTE具有较高的诊断准确度。
Grenier等使用3D/2D U-Net混合拓扑结构,建立CNN并设计了一种自动检测应用程序,将来自228个临床站点的387例CTA影像作为验证集,以验证该程序自动检测PTE的效能,结果发现该程序在186例PTE阳性病人中正确识别了170例,敏感度为91.4%(95%CI:86.4%~95.0%);在201例PTE阴性病人中正确识别184例,特异度为91.5%(95%CI:86.8%~95.0%),准确度为91.5%;尽管已在后处理阶段消除了肺和肺动脉外的假阳性,但其中也存在8.6%的假阴性率(16/186)和8.5%的假阳性率(17/201)。
由此可见,基于DL的辅助诊断具有较高的敏感度和特异度,能够提高临床PTE检出率和诊断效能,在大多数紧急情况下可提供初步诊断。在此基础上,DL可作为影像的第二阅读器,即类似于识别肺小结节的自动软件,为放射科医生提供诊断和鉴别参考。
2. 评估PTE血栓负荷及灌注状况
利用DL-CNN可有效评估血凝块负荷。Liu等开发了基于U-Net框架的DL-CNN模型,以自动分割PTE栓子并计算血栓负荷。该研究设置了不同的血块检测概率阈值,用于测试U-Net对栓子的检测效能;同时纳入Qanadli评分、Mastora评分等影像学参数评估血凝块负荷,分析两者与DL-CNN计算的血栓负荷之间的关系,结果显示,当分割概率阈值为0.1时,U-Net检测血栓的敏感度为94.6%,特异度为76.5%,AUC为0.926 (95%CI:0.884~0.968),且其测量的血栓负荷与CTPA中的Qanadli评分(r=0.819,P<0.001)、Mastora评分(r=0.874,P<0.001)及右心室功能参数呈显著正相关。但由于该研究所用的数据集小,所用CTPA影像皆为无伪影影像,限制了模型的适用性,且并未纳入临床因素,因此未能分析血凝块负荷与PTE临床风险的相关性。
Zhang等比较微调训练的DL-CNN(ft)和从头开始训练的DL-CNN(fs)在PTE定量评估中的效能,以检测PTE血栓负荷,并分析其与PTE住院期间风险分层与短期预后的相关性,结果显示,2种模型检测中央肺动脉血栓的敏感度分别为99.06%、100%,特异度为72.61%、70.63%,且测得的血凝块体积相似;两者与Qanadli评分[DL-CNN (ft):r=0.825,P<0.001,DL-CNN (fs):r=0.827,P<0.001]和Mastora评分[DL-CNN (ft):r=0.859,P<0.001,DL-CNN(fs):r=0.864,P<0.001]呈正相关,并可发现低、中和高危病人的血栓负荷增加与右心室功能相关。
尽管DL模型在评估PTE血栓负荷和灌注情况等方面效果较佳,但仍有其局限性,尤其是受到肺动脉和邻近静脉周围的软组织和淋巴结、对比剂流动伪影或闭塞血管影响时,DL模型的评估结果仍需要医生的诊断确认,以保证结果的可靠性。
Vainio等选取经肺通气/灌注(V/Q)扫描确诊的25例慢性肺栓塞(chronic pulmonary embolism,CPE)阳性病人和25例阴性病人的术前CTPA影像,训练集-验证集-测试集按照48%∶12%∶40%的比例拆分,使用CNN与Hounsfield单位(HU)阈值2种方法,比较两者对CTPA灌注不足的检测效能,结果显示,CNN方法的曲线下面积(AUC)为0.87(95%CI:0.82~0.91),HU阈值方法的AUC为0.79(95%CI:0.74~0.84)。
另外,Singh等基于动态增强的双能CT肺血管成像(dual-energy CT-pulmonary angiography,DECT-PA)影像,采用CNN作为影像处理器对三维CT体积数据进行自动肺叶分割,分别获得各肺叶和全肺的定量灌注指标,以评价有无PTE病人的定量肺灌注水平,结果显示在所有病人的DECT-PA影像中,自动肺叶分割准确度可达100%,PTE病人肺灌注均明显低于无PTE病人,且与无PTE病人相比,PTE病人不同肺叶的衰减系数、对比剂剂量和标准化碘浓度的平均值均显著降低。
以上研究表明,基于DL的算法检测PTE灌注缺损具有可行性且效能良好,这对于判断PTE是否存在,以及区分闭塞性和非闭塞性PTE有重要作用。后续研究还可根据栓子位置、病灶分辨率或肺血管形态和密度等推断PTE灌注缺损区域,协助检测灌注不足及微小栓子等。
通常,血栓负荷的大小会影响PTE病人的右心功能和血流动力学稳定性,新鲜栓子形成会使肺血管阻力急剧上升,加重PTE临床症状和预后不良风险;当其发展为慢性血栓时则常导致肺动脉高压,降低病人长期生存质量。Qanadli评分与Mastora评分是目前临床中常用的半定量评估血栓负荷的方法,分值升高意味着肺动脉循环中的血栓负荷增加,但仅与栓子存在情况有关,并不能反映血栓负荷的实际体积。因此,尚需改良或创新各种评分系统,并与临床数据相结合,探索血栓负荷与灌注缺损的联系,全面并高效地评估PTE严重程度,这对评估PTE的治疗及预后等具有重要意义。
3. 挖掘影像报告的潜在信息
通过自然语言处理(natural language processing,NLP)技术可实现计算机与人类的自然对话,且已证明NLP技术能从非结构化报告中准确提取内容,但由于数据缺乏限制了其临床应用,而结合CNN模型大大提高了NLP的效能和准确性。Chen等使用无监督学习算法构建CNN模型,并比较其与开源应用程序PEFinder的分类效能,评估CNN模型与NLP模型从CTPA报告中提取PTE诊断结果的效能,结果显示,CNN模型的准确度为99%,AUC为0.97,在内部和外部验证数据中,CNN模型与开源应用程序在对PTE诊断结果进行阴性或阳性分类时的敏感度、特异度和准确度无显著差异,但PEFinder有着更高的F1分数、敏感度和准确度。
CNN模型有很好的泛化能力,可以从原始报告中获取更大规模的特征和信息,未来可以在更大范围的报告中训练和确认该模型的应用价值。Fink等则从1 248例病人的标准化PTE报告中提取关键特征,建立一个简化的肺动脉栓塞指数血栓负荷评分(pulmonary artery obstruction index clot burden score,PAOICBS),与Qanadli评分(PAOI Qanadli score,PAOIQ)进行比较,结果显示PAOICBS与PAOIQ呈显著正相关(r=0.94,P<0.001),且PAOICBS能够节省总体时间[(1.3±0.5)min和(3.0±1.7)min)],有较高的置信度(4.2±0.6和3.6±1.0)和组内相关系数(ICC)(0.99和0.95);且通过挖掘PTE描述的结构化报告可以指示血栓位置和肺动脉闭塞程度,但也存在检测意外的语义变化的不足。
影像学报告是临床研究中的一大丰富资源,凭借不断更新、集成和共享的优势能够快速推进DL在临床中的应用,在此基础上可以降低DL训练中产生的过拟合风险。目前,影像存储与传输系统(picture archiving and communication systems,PACS)涵盖了研究所需的各种数据,然而这些数据或报告仍然是非结构化的,且使用的是自由格式的语言,再加上诊断医生、医疗机构及检查设备的差异,使对影像数据进行语义标记成为一大挑战,也成为DL在医学成像中应用的一大瓶颈。
另外,由于自然语言的模糊性和多变性,使得传统非结构化报告向结构化报告的转化也存在重大挑战。Spandorfer等基于DL的NLP框架训练了一种将非结构化报告转化为结构化报告的CNN模型,结果发现CNN模型转化非结构化报告的准确度较高(92%~96%)且更具普遍性,能够有效识别和充分利用影像报告中有价值的信息,有利于在保证诊断效能的同时加强放射科医生与临床医生之间的沟通。
但该研究也存在局限性,例如在训练和测试不常见语句时需要更多的语句标记,报告的异质性和个体化明显影响算法的泛化性,且仅执行了最基本的结构-应用部分标签,未来的研究中还可将图示、词典等纳入算法以期提供更加结构化的数据。
DL模型利用灵活的结构从影像中获取与疾病相关的生物学信息并进行学习,利用多模态、多组学数据结合的方式也正逐渐成为DL研究热点。Cahan等提出了一种PTE自动风险分层方案,将30 d全因死亡率作为评估PTE严重程度的指标,使用多模态数据并以端到端的方式进行训练和开发DL模型,结果显示,使用3D CNN和Tab Net的中间融合模型的效能最佳,可将风险分层效能提高14%,肯定了使用多模态数据自动评估PTE严重程度的价值,且与临床肺栓塞严重程度指数(pulmonary embolism severity index,PESI)和简化PESI(simplified PESI,s PESI)评分相比,多模态分类器对于预测PTE早期死亡率有更高的特异度和敏感度,可用作临床中的替代预后模型。
目前,影像信息的可获得性、丰富的储备资源和较为完备的分析流程使DL在评估PTE预后方面有着广阔的应用前景,合理和高效运用DL技术能够帮助临床深入了解栓子微观结构,与临床数据结合开展多模态研究,或许可为解释PTE病理特征改变与栓子之间的关系提供线索,并能从整体提高评估临床预后的准确性和可行性,目前仍有很大的研究空间。
4. 小结与展望
基于CT影像的DL在PTE疾病中的应用目前仍处于发展阶段,同时也面临一些挑战:
(1)相关研究一般为回顾性研究,并未在临床环境中进行测试,需要更多的多中心、前瞻性研究,以提高研究开展和结果的可重复性、泛用性等;
(2)DL常会遇到CTPA影像中上腔静脉伪影、对比剂浓度不够及各种噪声等造成的临床假阳性问题,目前还未找到较好的解决方案,因此DL做出的任何结果仍需放射科医生确认并做出选择;
(3)对DL算法和放射科医生未能进行直接、全面的比较,而了解DL在应用过程中面临的需要人为处理的问题,这对于评估DL能否带来更好的临床结果至关重要;
(4)DL对大型数据集有高度依赖性,且DL的应用可能并不代表能自动理解运行和形成机制,其解释性的欠缺很可能误导研究者,未来仍需要优化和提升学习算法,提高DL对影像解读的准确性和稳定性;
(5)尝试开发多任务学习方法,整合临床和影像学数据,拓展DL在PTE领域应用的研究价值,例如评估血栓成分、PTE严重程度等。DL在PTE中的实践正在成为现实,了解DL的优势与局限非常重要,在现有的基础上进一步验证和优化其各种算法和模型,以利于尽快应用于PTE诊疗中。
来源:陈蓉,杨越,于雅茜,等.基于CT影像的深度学习在肺血栓栓塞症中的应用进展[J].国际医学放射学杂志,2024,47(02):219-222.