
文献精读丨女性乳腺癌发病风险预测模型的建立与效能评估:一项系统评价与Meta分析
基于乳腺癌
全球发病率的持续上升,其早期风险预测对精准预防至关重要。风险预测模型作为量化个体发病风险的关键工具,其临床应用价值日益凸显。然而现有主流模型在跨种族验证中存在局限性,尤其对亚洲人群适用性不足。随着多基因风险评分(PRS)、循环生物标志物及机器学习技术的发展,模型优化迎来新的机遇。
近期,一篇发表在Annals of Medicine(IF=4.3)的Meta分析系统梳理了该领域的全球研究进展,通过整合多模态数据评估模型效能,重点分析遗传与生活方式两大影响因素,并探讨人工智能对模型的优化作用,为中国人群的精准预测提供循证支持。

研究方法
本研究系统检索PubMed、Cochrane Library、EMBASE、Web of Science及CNKI数据库建库至2023年8月31日的中英文文献,采用关键词组合及布尔运算策略,辅以文献追溯。纳入标准:针对≥18岁普通人群女性的乳腺癌风险预测模型开发/验证研究;观察性设计(队列/病例对照/横断面);包含≥2个风险因子;报告模型的量化性能。排除预后模型、无校准/区分度指标及非原始研究。
双人独立筛选、提取数据并采用PROBAST评估偏倚风险。使用R/STATA进行贝叶斯Meta分析,汇总C统计量(95%CI及预测区间)评估区分度与校准度。
研究结果
研究纳入概况
最终纳入144项研究,涵盖88个独立队列(含36项前瞻性及52项回顾性队列)。研究地域分布以美洲为主(42.4%),其次为亚洲(32.6%,其中中国占33项)和欧洲(21.5%)。纳入研究的样本量范围广泛(97至2,211,039例),研究对象平均年龄介于35至73岁。

图1.纳入本Meta分析的文献筛选流程图1
预测模型特征
本研究共分析510个乳腺癌风险预测模型,其中开发模型297个,验证模型213个。开发模型的地域分布相对均衡(美洲35.7%,亚洲34.3%,欧洲26.6%)。建模算法中传统统计方法与机器学习方法占比大致均等。模型纳入的预测因子呈现递进趋势:从基础人口学/临床特征(42.1%)为主,逐步发展为结合遗传数据(16.5%)或影像学特征(15.2%),乃至整合全部三类因子的综合模型(5.1%)。验证模型主要来源于美洲(58.3%),超过半数(56.9%)涉及Gail模型。
模型性能评估
模型区分度(C统计量/AUROC)报告范围广泛,开发模型为0.45-0.96,验证模型为0.45-0.93。Meta分析显示模型整体区分度中等:5年风险预测模型的汇总C统计量开发模型为0.68,验证模型为0.61;10年风险模型分别为0.70和0.62。校准度方面,约70%的模型O/E比值处于0.8-1.2的合理范围。5年与10年风险模型的汇总O/E比值相近,分别为0.85和0.83,但5年模型异质性较大。校准报告不足(开发模型仅28个,验证模型118个),且报告的O/E比值范围差异显著(开发:0.78-1.20;验证:0.40-2.08)。
亚组分析结果
亚组分析显示:采用机器学习算法的开发模型区分度(C=0.74)优于传统统计方法(C=0.67)。模型校准存在明显地域差异:在亚洲开发或验证的模型汇总O/E比值约为1.08,提示存在低估风险倾向;而欧洲和美洲模型校准更佳,O/E比值分别约为0.91和0.86。经典模型比较中,BRCAPRO模型(O/E=0.94)校准优于Gail模型(O/E=0.86)和Tyrer-Cuzick模型(O/E=0.66)。
偏倚风险与发表偏倚
纳入研究中超过半数(51.4%)存在高偏倚风险,主要源于分析领域(72%),其中又以缺失数据处理不当(55.6%)为主要问题。漏斗图结合Egger检验(p=0.04)提示Meta分析存在发表偏倚,趋向于无效结果。
研究结论
基于系统评价与荟萃分析,本研究对乳腺癌风险预测模型展开了全面评估。现有模型虽在短期及中期风险预测中展现中等区分度与校准度,但在普适性、可解释性及长期临床转化价值方面仍存在局限。为突破这些瓶颈,亟需推动数据科学、临床医学与公共卫生领域的跨学科协作,以提升模型的精准性、可及性与临床效用,最终为乳腺癌预防与早期筛查的策略优化提供支撑。