首页 > 医疗监管/ 正文

Cancer Discov | 新型AI基础模型可根据基因型精准预测癌症治疗反应,涵盖10种实体瘤超3万个肿瘤基因组数据

来源 2026-06-16 21:58:14 医疗监管

深度解析医学证据,lxfs.net为你支撑决策

近日,加州大学圣地亚哥分校研究团队在Cancer Discovery发表文章“A foundation model of cancer genotype enables precise predictions of therapeutic response”,报道了一种新型人工智能(AI)模型MutationProjector,该模型能够将肿瘤复杂的基因特征转化为对癌症治疗反应的预测。这一基础模型基于来自10种实体瘤超过3万例肿瘤样本的海量基因组变异数据进行预训练,整合了丰富的分子生物学知识。多个独立患者队列验证,MutationProjector预测多种癌症类型及不同患者群体对免疫疗法或化疗的耐药性时,在所有应用场景中均达到或超越现有方法水平,并可识别出一些意料之外的生物标志物。该模型生成的预测结果能揭示肿瘤的分子通路改变,有助于模型解读,并能精准重建未检测到的突变位点为将癌症突变与治疗反应的生物通路联系起来提供了新的框架。

图片

癌症确诊后,下一步常需进行基因检测,这有助于医生对肿瘤类型进行分类并确定治疗方案。DNA测序panel成本相对较低、结果获取迅速且与治疗效果具有明确关联性,已在临床实践中得到广泛应用。但具有临床应用价值的基因测序信息目前仅限于特定肿瘤类型或治疗场景中少数经过深入研究的基因/生物标志物。目前仅有约8%的病例能根据遗传学特征成功匹配到FDA批准的靶向疗法,且通常基于单一基因的变异。癌症突变与治疗效果相关联面临的挑战之一是大多数突变事件较为罕见,同时生物标志物并非独立发挥作用,而是通过协同作用影响药物疗效。

文章通讯作者、加州大学圣地亚哥分校Trey Ideker教授表示:“基因测序在癌症诊疗中已属常规操作,但我们仍难以全面解读患者肿瘤中发现的众多突变。研究开发MutationProjector项目的初衷,利用数万个肿瘤基因组数据构建一个通用模型,将癌症中的突变模式转化为关于治疗反应的更精准预测。”

与依赖少量生物标志物的传统方法不同,该研究报道的MutationProjector是一种用于解析癌症复杂遗传变异图谱的基础模型(图1)。该模型基于10种不同实体瘤30,328份肿瘤样本的遗传特征谱进行预训练,包括临床基因检测panel中涉及的468个基因的遗传变异信息,每个基因分别评估体细胞突变、拷贝数扩增或拷贝数缺失。MutationProjector采用了图注意力网络架构,将来自肿瘤基因变异及协变量的高维数据转化为统一且定量化的肿瘤生物学状态表征。同时,该模型还整合了癌症分子网络的相关知识,包括七种不同的分子网络模型,涵盖蛋白质间物理结合、转录调控、遗传互作等,共同涵盖了468个基因之间的19,789种相互作用。

经过大规模数据集预训练后,MutationProjector能够分析肿瘤中存在的多种遗传变异组合,可将肿瘤基因组转化为反映其生物状态改变的定量坐标,仅需少量样本即可帮助研究人员识别可能受干扰的分子通路,进而确定最有效的治疗方案。

图片

1.利用大规模数据集进行训练。

MutationProjector模型被训练完成后,交叉验证显示:预测基因突变状态的总体精确-召回曲线下的面积(AUPRC值为0.21random guessingAUPRC值为0.02,提升9.7倍,且这一性能在不同癌症类型间保持稳定,并在外部肺腺癌队列评估中表现一致(图2)。MutationProjector模型的优异性能主要源于其捕捉到的癌症基因网络中存在的广泛突变依赖性,这使模型能够充分关注数千种基因间的相互作用关系。此外,该模型在识别癌症亚型方面具有显著潜力,可识别出具有特定基因对共突变特征的肿瘤亚型准确捕捉通过mRNA测序已界定的经典肿瘤亚型。

图片

2.MutationProjector模型性能评估。

研究团队对MutationProjector的肿瘤嵌入表示进行了分析与解读,发现肿瘤大致按组织类型分层分布,并存在显著的特定类型混合现象:例如,肺鳞状细胞癌、头颈部鳞状细胞癌或食管癌的肿瘤彼此高度相似,均属于更大的鳞状细胞肿瘤聚类。除组织类型外,MutationProjector嵌入还提供了关于关键致癌基因突变状态的重要附加信息,包括结直肠癌中的APC基因突变、特定乳腺癌亚型中的GATA3基因突变。此外,该模型还可识别出具有特定基因对共突变特征的肿瘤亚型准确捕捉通过mRNA测序已界定的经典肿瘤亚型。

随后,研究团队利用多个独立队列数据集,评估了MutationProjector肿瘤表征方法在免疫治疗反应预测、化疗反应预测以及转移结局预测等多种临床应用中的实用性(图3)。在PD-1/PD-L1免疫治疗反应预测中,MutationProjector在膀胱癌、肺癌和黑色素瘤中均能显著预测无进展生存期和/或总生存期,且性能优于现有生物标志物和传统监督学习方法,包括PD-L1表达水平、肿瘤突变负荷、微卫星状态等。在化疗反应预测方面,MutationProjector顺铂治疗肿瘤样本数据训练后,在独立的膀胱肿瘤队列验证中,表现亦优于现有生物标志物经典机器学习方法。原发性肺腺癌患者队列转移结局的预测分析中,MutationProjector预测AUPRC值高达0.84,优于其他机器学习模型。

图片

图3.药物反应和转移的预测结果。

最后,研究人员确定MutationProjector模型中对各项临床应用最为关键的具体遗传生物标志物(图4除预测成功免疫治疗反应的TMB外,该模型预测结果主要依赖于多种染色质重塑因子以及染色质修饰因子的基因变异。除单一生物标志物外,研究还发现模型对相互作用基因对具有高度关注,其中某些组合对治疗无应答具有强预测性,例如KRAS-STK11KEAP1-STK11SMARCA4-STK11在化疗反应预测方面,多种基因变异被认为具有重要性,包括大量DNA修复基因。预测转移结局的重要特征包括细胞周期相关基因、促血管生成基因、 APOBEC突变特征等,同时研究发现的意外特征包括细胞周期与DNA损伤修复相关组分、转录因子以及RNA剪接相关因子。

图片

图4.用于免疫治疗预测的关键生物标志物分析。

该研究利用涵盖10种实体瘤类型的3万多个基因组数据构建了MutationProjector模型,可根据肿瘤基因型预测癌症治疗反应。该研究探索了一种癌症基因组分析的策略,即采用单一预训练肿瘤模型应对多种任务,与传统为每个任务单独构建模型的方法形成鲜明对比。MutationProjector模型的设计不仅是进行预测,更是揭示这些预测产生的内在机制,这有助于优化生物标志物和治疗策略,这种可解释性在精准肿瘤学领域有着重要作用,可帮助临床医生明确肿瘤基因型与治疗决策之间的关联。

原文信息:

JungHo Kong , Ingoo Lee , Dean Boecher, et al. A foundation model of cancer genotype enables precise predictions of therapeutic response. Cancer Discov (2026).https://doi.org/10.1158/2159-8290.CD-25-1735

阅读全文

小提示:本篇资讯仅在梅斯医学APP中开放阅读,请扫描二维码直接下载APP

-->

Tags: Cancer Discov | 新型AI基础模型可根据基因型精准预测癌症治疗反应,涵盖10种实体瘤超3万个肿瘤基因组数据  

搜索
网站分类
标签列表