
非对比剂CT影像组学和机器学习在高血压脑出血诊疗过程中应用研究进展
作者:姜彦文,秦虎,冷昭富,帕孜力亚·艾克拉木,汪永新
,新疆医科大学第一附属医院神经外科
高血压脑出血
(hypertensive intracerebral hemorrhage,HICH) 占自发性脑出血(intracranial hemorrhage,ICH) 的80%,为脑卒中中病情严重的一个分类,死亡率和致残率均居各类型脑卒中首位。脑实质基底节区为常见发病位置,约占全部HICH患者60%~65%,具有起病突然、进展快、致死率和致残率高等特点。
非对比剂CT(non-contrast computer tomography,NCCT)能快速、准确检出HICH,其易用性及低时间成本使其成为常用诊断方法,对神经外科治疗决策至关重要。然而医学图像包含深层次信息进行解读解释需要很高专业知识,经验不足的阅读者最初的解读往往会导致误读和不良后果。
近年来,人工智能(artificial intelligence,AI)在医学影像领域展现出巨大的应用前景。机器学习(machine learning,ML)能够基于临床特征开展执行部分诊疗任务,其准确性与专科医生相当。其经过训练,也可以通过分类算法来检测医学放射影像异常,包括头部NCCT,并能通过特定分割算法对疾病模式或解剖体积进行定位和量化,一些研究尝试检测包括ICH在内的头部CT异常并取得了一定成果。
现阶段影像组学和ML算法已经被应用于诊断HICH并根据相应特征进行病情评估及预测,能够为临床疾病诊疗提供帮助,本文对当前NCCT影像组学和ML在高血压脑出血诊疗过程中的应用进展进行综述,对目前NCCT影像组学和ML算法在高血压脑出血诊疗过程中应用作一定总结,对探讨未来相关应用研究的可能方向提供建议。
1.概述
生物医学影像中蕴含着与疾病生理相关信息,不同于传统影像学是对影像资料宏观特征进行主观上的概括描述,影像组学是把数字化的医学影像转化成高维度资料并基于此进行高通量量化分析以揭示两者之间的关系。机器学习是计算机科学的一个领域,它赋予计算机系统以数据"学习"能力,而不需要显式地编程。目前常用ML模型包括logistic 回归模型(logistic regression,LR)、朴素贝叶斯模型(naive Bayes,NB)、决策树模型(decision tree,DT)、支持向量机模型(support vector machine,SVM)及随机森林模型(random forests,RF)等。
深度学习(deep learning,DL)作为ML的分支,展现出处理复杂高维数据的优越能力,包括卷积神经网络算法(CNN)、递归神经网络(RNN)等,现已逐步应用于疾病诊疗过程,具有相对优秀的发展潜力。现阶段以CNN应用最为广泛,其已在HICH相关患者诊疗过程多个环节取得一定成果,对提高HICH诊断效率及准确评估病情有一定帮助。
2.基于影像组学的ML 在HICH 诊断过程的应用
对HICH的快速、准确的诊断,可以为患者赢得更长有效治疗时间窗,从而降低不良事件发生率。在NCCT成像结果基础上,结合影像组学高维度资料运用与ML相应算法,提取相应特征,进一步加以分析来辅助诊断可显著缩短诊断HICH 所需时间。目前CHILAMKURTHY 等基于来自印度多中心颅脑NCCT影像资料,以DL算法构建用于检出ICH及分类亚型的分类算法模型,在验证集上,算法检测颅内出血的AUC达到了0.92。在不同来源的验证数据集上算法检测ICH的AUC为0.94(0.92~0.97)。
且由于HICH较常表现为基底节出血,在该模型中研究者采用两份不同来源验证集(validation set)对模型进行评估,检测脑实质内出血AUC分别为0.90,和0.95,这证明了该模型对于检测HICH具有一定效力。YE等纳入了来自3个机构的2836名受试者,总共76621 层面NCCT 影像资料,建立一种CNN 与RNN联合模型分类算法,并以其中随机10%作为验证集,对于二分类任务(预测是否存在ICH)和五分类任务(对阳性ICH各类亚型进行分类)均表现出优秀性能及鲁棒性(AUC分别达到0.98及0.8),且五分类任务中HICH患者较多表现的脑实质内出血表现最优(AUC=0.94)。
WANG等应用了2019-RSNA 脑CT 出血挑战数据集(超过25000 次CT 检查),在2D CNN分类器和两个序列模型的基础上,建立了一种用于ICH检测的DL算法模型,检测ICH的AUC≥0.98,在两组不同来源独立外部验证数据上,AUC值分别为0.95和0.96,显示出了良好适用性。
HEIT等基于NCCT扫描应用RAPIDICH(用于识别急性ICH和确定ICH的人工智能软件程序)评估ICH,共纳入308例患者,结果显示RAPIDICH正确识别了151 例/158 例ICH 病例和143/150 例ICH 阴性病例,证实该软件程序也具有优秀的性能(灵敏度0.956,特异性0.953,阳性预测值0.956,阴性预测值0.953),且其对ICH脑实质内和脑室内出血体积的快速量化与神经放射学专家手动分割结果呈正相关(r=0.98),故目前认为该软件项目可以引入日常临床实践中。
YEO等构建了基于Python编程的DL模型,在头部NCCT开源数据集上训练和测试,对原始输入进行了预处理,在此基础上运用CNN-RNN联合模型进行分析,并在该模型中提供了解决DL模型长期以来缺乏可解释性问题的方案,通过输出显著性热图图像,突出显示对模型预测贡献最大NCCT图像像素,能够在一定程度上直观估测输出结果的可靠程度,最终模型识别ICH及各亚型分组均达到AUC≥0.94 的水平。
ML 开发相关算法在检测ICH及区分ICH不同亚型方面已取得一定成果,且其在区分ICH不同亚型方面,对于脑实质内出血具有较好表现。由于HICH好发部位即位于脑实质内基底节区,因此,结合相关算法及患者基本病史,可明确提高HICH诊断效率,对更广泛地将基于影像组学的ML应用于临床HICH检测方面具有重要意义。
3.基于影像组学的ML 在HICH 血肿分割方面应用
颅内血肿病灶体积已被验证为HICH预后重要预测因素,但不规则形状血肿病变测量结果并不理想,致使这一重要预后评估因素价值受限。以DL相关算法构建模型,能够基于影像组学的高维度数据资料区分出不同属性的像素区域,精确地划分出图像内容。
王霁雯等基于CNN算法构建ICH影像分割算法模型,对于ICH不同亚型,与人工分割的相关一致性系数分别为实质内出血0.87、脑室出血0.85、蛛网膜下腔出血
0.67和混合型出血0.77。在HICH患者占多数的脑实质内出血与人工分割结果获得结果中相关一致性系数最高(0.87),优于ICH 其他亚型。
IRONSIDE等利用CNN构建模型,其结果与人工和半自动分割方法相比,平均体积Dice系数(Dice系数是一种集合相似度度量函数,通常用于计算两个样本的相似度,取值范围在[0,1],取值越高,表示进行比较的两集合相似程度越高)分别为0.894 和0.905,全自动与人工获得的ICH 量R2=0.981,P<0.0001;全自动与半自动R2=0.978,P<0.0001;在分割速度上(基于dcm格式图像上识别分割每层面血肿范围所需时间),全自动分割算法(平均12.0 s/scan±2.7 s/scan)明显快于两种手动分割算法(平均201.5 s/scan±92.2 s/scan)和半自动(平均288.58 s/scan±160.3 s/scan)分割方法。
赖建东等采用基于卷积神经网络算法(CNN)的计算机辅助诊断系统(infervision CT stroke research,DL-CAD)及多田公式法测量不同发病阶段患者ICH体积,相比多田公式,前者测量ICH各阶段血肿体积的准确性、测量速度及测量误差表现均优于后者。
SHARROCK等首次基于CNN算法应用MISTIE多中心随机对照临床试验II期和III期数据建立公开可用的用于ICH分割的DL模型(https://github.com/msharrock/deepbleed),随机抽取Ⅱ期数据100例扫描用于训练,以Ⅲ期数据随机500例用以验证,最佳输出模型与手动分割结果比较Dice系数可达到0.91。
后COORENS等提出了一种基于深度学习的NCCT图像中血肿自动分割方法,其核心结合掩码损失函数和U-Net架构,共纳入107例,在较少训练样本数量上实现了算法训练,其特异度可达96.2 %,可以快速准确地估计CT图像中的血肿体积,从而支持辅助临床管理。综上现阶段基于影像组学的ML全自动分割血肿及量化ICH血肿体积在准确性、测量所需时间上均优于多田公式,并在HICH患者占多数的脑实质出血上有更出色的表现,且现阶段基于U-NET架构DL模型已可以在较常规数据量规模上完成相关算法的训练。
4.基于影像组学的ML 在HICH 血肿周围水肿
带分割方面应用
由于血肿所带来占位效应,随其病程进展,颅脑NCCT中会表现出病灶周围出现不等程度血肿周围水肿带(perihematomal edema,PHE),这其中演变过程和HICH所带来继发性脑损伤关系密切。DHAR等根据2个ICH队列研究扫描数据所获得的影像组学数据,前者应用CNN进行训练,并在后者中将应用训练所得算法的分割结果与手动分割结果进行比较,PHE一致性较好(0.81),Dice系数为0.54,与2名专家评判所得结果的一致性相当(Dice 系数为0.57)。
IRONSIDE等在一项纳入400例成人自发性幕上脑出血患者NCCT扫描数据集中,应用CNN在训练数据集中的手动分割基础上衍生出一种全自动化分割算法,并在测试数据集中与手动和半自动分割方法的性能进行对比。以手动和半自动分割方法为参考标准,全自动分割算法的平均体积Dice系数分别为0.838±0.294和0.843±0.293,分割方法得到的PHE体积存在显著的组间相关性,且全自动分割算法(平均18.0 s/scan±1.8 s/scan)显著快于手动分割方法(平均316.4 s/scan ±168.8 s/scan,P<0.0001)和半自动(平均480.5 s/scan±295.3 s/scan,P<0.0001)分割方法。
KOK等应用从氨甲环酸
治疗超急性原发性脑内出血(即TICH-2)国际多中心试验(ISRCTN93732214)中获得的1732张有注释的基线NCCT扫描图进行了模型评估,基于U-Net网络进行训练,并使用no-new-U-Net(nnU-Net)检查了不同的损失函数以解决类的不平衡,在测试集中(n=174,占数据集的10%),应用Focal loss损失函数,PHE分割一致性可达0.88,Dice系数0.66,表现出相当满意的性能,表明基于U-Net的网络可以对自发性ICH的CT图像进行准确分割,应用Focal loss函数可以一定程度上解决类的不平衡,优化PHE分割结果。
目前已知多种不同病理生理机制均可影响PHE形成时间,准确对PHE体积进行量化有助于提高对HICH图像演化和神经损害的认识,但人工对其进行准确分割需耗费大量人力物力,通过以上研究,应用基于影像组学的ML技术可显著提升效率,有望实现进一步临床应用以对HICH患者病情评估起到辅助作用。
5.基于影像组学的ML 用于预测HICH 血肿扩大
对血肿扩大的精确、及时的预测有助于临床及时干预、改善预后。既往研究发现,NCCT中颅内血肿可能存在“岛征”、“黑洞征”、“低密度征”、“混合征”等特殊征象。基于此类特殊征象,LIU等纳入1157例自发性ICH 患者数据,选取部分临床特征及影像特征应用SVM进行训练,指标包括黑洞征象、混合征象、卫星征象、纤维蛋白原水平等9种特征,预测血肿扩大的平均敏感度为81.3%,特异度为84.8%,其预测血肿扩大的准确率达83.3%,AUC 为0.89。但由于NCCT影像上上述直观影像特征出现概率较低,以之评价预后特异度不佳。
LI H等纳入167例ICH患者影像数据,通过提取影像组学特征(初始血肿的1227个影像组学特征,经特征工程后提取4个性能最优特征)用于模型构建;并先后采用23种ML算法逐一构建模型并比较其结果,得出SVM基于影像组学特征训练所得输出模型在此分类任务中可达到较高准确率(72.6%)。后续LI等收集了258例急性自发性脑实质内出血的患者,选择经优化原始特征子集,构建影像组学模型(以影像组学分数为基础)、影像组学列线图和临床模型,且该研究针对不同出血位置进行了亚组分析以评估预测价值。
此研究中影像组学模型及影像组学列线图在预测血肿增大方面均能显示出良好的性能(曲线下面积,AUC分别为0.83,0.82),并且均优于临床模型(AUC=0.66),证实影像组学模型及影像组学列线图在预测血肿增大方面表现具有一定临床价值。在亚组分析中,对于HICH 好发部位(脑实质深部)也显示出良好的预测价值(AUC=0.836)。经上述研究表明,目前基于NCCT影像组学的ML构建预测模型预测HICH血肿体积扩大方面表现出良好的性能,比以往的NCCT异质性标记和斑点征具有更高普适性,有助于在NCCT尚未显示直观影像特征时对预后结局其加以预测。
6.基于影像组学的ML 用于预测HICH 患者整体预后
HICH预后较差,准确对预后进行预测对临床诊疗决策制定有一定帮助。在FERNANDEZ-LOZANO 等研究中,将患者分为脑梗死
、脑梗死+ICH及ICH 3组,共纳入6022例患者,其中包括ICH患者1100例,ICH患者中506例考虑为HICH。基于临床、生化和神经影像学因素应用RF算法ML技术生成预测模型,用于预测患者入院后3个月的死亡率和发病率,结果显示能够在一定程度上有效预测ICH患者预后。
NAWABI等纳入了来自多中心520例ICH患者,以基于影像组学的ML(RF算法)构建ICH预后预测模型,并与ICH评分进行比较,其预测效果(AUC为0.80)与ICH评分相同,且该模型和ICH评分进行联合预测AUC可提升至0.84。FANG等从195例HICH患者CT图像提取影像组学特征进行分析,并结合影像组学特征和临床危险因素构建诺莫图。其研究结果输出模型预测效率较之既往研究取得了较大提升(在验证集中AUC=0.90)。
基于目前NCCT及影像组学的ML在预测HICH预后方面表现,其在评估患者预后结局上已具有一定的临床价值。现阶段研究表明,影像组学联合ML也可用来预测HICH患者采取不同治疗方式等方面结局,如HICH术后结局等,但尚缺乏多中心、大数据的前瞻性研究,有待进一步验证。
7.小结与展望
随着影像组学和ML在诊断和治疗领域快速发展,检测颅内出血模型算法不断优化,分割病灶精度、性能和稳定性不断提升,这将扩大急诊治疗时间窗;准确分割和测量血肿和周围水肿区体积可以为临床提供更多有价值参考信息辅助临床决策;血肿扩大和术后预后预测会为临床诊断和治疗HICH带来新一轮变革,但结果尚需数据来源准确的多中心临床研究证实。
如进一步在HICH临床诊断和治疗中广泛应用影像组学和机器学习,建立充分系统化和结构化的数据库、标准化成像协议,并提供高质量的服务器和开发大存储容量的云系统,以在软件和硬件方面为其提供足够的支持是必要的。目前,绝大多数的ML算法用于临床还需要大量人力对数据集进行手工标注以用于进行模型训练,期待在未来的发展中,通过改进机器学习算法的自动化能力和简化使用方式,进一步推动其在临床领域的应用,为患者及医疗行业带来更多的便利和效益。
来源:姜彦文,秦虎,冷昭富等.非对比剂CT影像组学和机器学习在高血压脑出血诊疗过程中应用研究进展[J].中国神经精神疾病杂志,2023,49(10):609-614.