突破传统筛查瓶颈!“常规临床数据+机器学习”预测肝细胞癌风险|前沿速递

来源: 2026.04.04
我要投稿
图片

肝细胞癌(HCC)是癌症相关死亡的第三大原因,其发病率持续攀升,已成为全球重要公共卫生问题。当前肝细胞癌筛查策略主要以肝硬化作为核心纳入标准,但肝硬化起病隐匿、进展无症状,临床诊断难度大,导致大量患者确诊时已处于疾病晚期,预后极差。同时,传统筛查未纳入生活方式、基础疾病、血液检查等多维度风险因素,无法全面覆盖高危人群。随着代谢相关脂肪性肝病相关HCC病例不断增加,临床亟需低成本、广覆盖、高效的早期筛查手段。机器学习算法可整合多维度患者数据评估疾病风险,但既往相关模型存在队列规模小、缺乏外部验证、泛化性不足等问题,难以应用于临床。


近期,一项发表于Cancer Discov(IF:33.3)的研究开发并验证一种基于常规临床数据的可解释机器学习模型,该模型在内部和外部测试集中均显著优于现有风险评分,且仅利用常规临床数据即可实现高精度的风险预测。


Part 01

研究方法

本研究利用英国生物样本库(UKB)作为模型开发集,并使用“All of Us 研究项目(AOU)”进行外部测试,两大队列超90万例参与者,其中HCC共983 例。研究设置全人群、高危人群两个分析队列,后者为既往确诊慢性肝病或基线肝酶升高的患者。模型构建选用随机森林分类器,依次纳入人口学、电子健康记录(EHR)、血液学、基因组学、代谢组学五类数据模态,通过英格兰地区数据进行五折交叉验证完成参数调优,以苏格兰、威尔士地区数据及AOU队列数据分别完成内部、外部验证。主要评价指标为受试者工作特征曲线下面积(AUROC)、精确召回曲线下面积(AUPRC),同时将模型与 aMAP、FIB-4、APRI、NFS等现有风险评分进行效能对比,并评估模型在不同种族、性别亚组的预测表现。


图片1.png


Part 02

主要研究结果

UKB队列含538例HCC病例,确诊平均年龄 70±6.8 岁,从入组到确诊平均时间为 8.7 年;AOU队列含445例HCC病例,确诊平均年龄 62.1±10.2 岁。


• 单一模态预测显示,以血液学指标为预测效能最优的模态。全人群队列AUROC 0.86,高危人群队列0.87;其次为人口统计学(0.80/0.78)、代谢组学(0.79/0.82)、诊断数据(0.74/0.73)、单核苷酸多态性(0.62/0.65)。


• 整合人口学、诊断及血液数据的模型达到预测效能平台期,AUC达到0.88。在此基础上添加基因组学与代谢组学数据并未显著提升预测效果。


• 机器学习模型的AUPRC在全人群队列为 0.07~0.11,在高危人群队列为0.09~0.22,均高于 aMAP、FIB-4等现有线性风险评分(0.00~0.03)。


• 仅纳入15项常规临床指标的TOP15精简模型,预测效能与TOP30模型无显著差异(P=1),且显著优于传统评分。


• 分析各特征对模型决策的贡献显示,在所有特征中,血液指标(如γ-GT、AST、ALT 和血小板)对模型决策的贡献度最高,胰岛素样生长因子-1(IGF-1)和腰围亦为重要预测因子。


• 外部验证结果显示,模型在AOU队列中展现了优异的泛化能力,与内部验证结果一致。此外,模型在白人与非白人族群间的性能表现差异无统计学意义,表明其跨种族性能稳定。


图片2.png

图 模型预测性能


Part 03

讨论与结论

本研究基于大规模人群队列数据,构建并外部验证了用于HCC风险分层的机器学习模型 PRE-Screen-HCC。基于常规临床数据训练的模型预测效能优于现有风险评分,与代谢组学、基因组学模型预测效能相当,同时具备良好的可解释性与跨人群泛化能力。


该模型存在一定局限性,未基于病理或瞬时弹性成像证实的脂肪肝构建模型;EHR编码准确性可能影响结果;对女性肝细胞癌的预测效能偏低,且在病毒性肝炎流行率更高的亚洲人群中的有效性仍有待进一步验证。研究者提出PRE-Screen-HCC 可作为常规临床检查中一线、低成本预筛查工具,识别那些虽然不符合现有指南标准但处于高风险的人群,该类患者也可从后续影像学筛查中获益,为个体化分子预防与风险评估奠定基础,助力早期干预与根治性治疗。虽然该工具展示了良好的泛化性,但在其被临床广泛采纳前,仍需进行前瞻性验证。


参考文献

1.Clusmann J, Koop PH, Zhang DY,et al. Machine learning predicts hepatocellular carcinoma risk from routine clinical data: a large population-based multicentric study. Cancer Discov. 2026 Mar 26.




医脉通是专业的在线医生平台,“感知世界医学脉搏,助力中国临床决策”是平台的使命。医脉通旗下拥有「临床指南」「用药参考」「医学文献王」「医知源」「e研通」「e脉播」等系列产品,全面满足医学工作者临床决策、获取新知及提升科研效率等方面的需求。


本平台旨在为医疗卫生专业人士传递更多医学信息。本平台发布的内容,不能以任何方式取代专业的医疗指导,也不应被视为诊疗建议。如该等信息被用于了解医学信息以外的目的,本平台不承担相关责任。本平台对发布的内容,并不代表同意其描述和观点。若涉及版权问题,烦请权利人与我们联系,我们将尽快处理。

图片