首页 > 医疗资讯/ 正文

Nat Commun:西北工业大学/四川大学/天津大学团队通过深度强化学习识别透明细胞肾细胞癌的潜在风险基因

来源 2025-04-24 12:10:36 医疗资讯

透明细胞肾细胞癌(ccRCC)是最常见的肾细胞癌类型。然而对ccRCC风险基因的理解仍然有限。这种知识差距对ccRCC的有效诊断和治疗构成了挑战。

2025年4月15日,西北工业大学彭佳杰、四川大学华西医院艾建忠、天津大学智能与计算学院郝建业共同通讯在Nature Communications上在线发表题为“Identifying potential risk genes for clear cell renal cell carcinoma with deep reinforcement learning”的研究论文。研究提出了一种名为RL-GenRisk的基于深度强化学习的计算方法来识别ccRCC风险基因。

与传统的监督模型不同,RL-GenRisk将ccRCC风险基因的识别构建为马尔可夫决策过程,结合图卷积网络和深度Q网络进行风险基因识别。此外,提出了一种设计良好的数据驱动奖励,以减轻稀缺已知风险基因的限制。评估表明,RL-GenRisk在ccRCC风险基因鉴定方面优于现有方法。此外,RL-GenRisk鉴定了8个潜在的ccRCC风险基因。研究成功验证了表皮生长因子受体(EGFR)和小胶质细胞突触前基质蛋白(PCLO),并通过独立的数据集和生物实验进行了验证。这种方法将来也可能用于其他疾病。

图片

肾细胞癌(RCC)是全球最常见的癌症之一,是一种起源于近端曲小管内壁的肾癌。透明细胞肾细胞癌(ccRCC)占所有RCC病例的80%,由于其高度免疫浸润而具有特别的侵袭性。此外,超过30%的ccRCC患者患有转移,这是导致ccRCC患者死亡的重要因素。尽管已经有几种药物用于治疗ccRCC,但由于ccRCC的异质性,疗效仍然有限。因此,有必要了解ccRCC的发病机制和识别风险基因,这可能有利于ccRCC的早期诊断和治疗。

癌症是一种复杂的遗传疾病。它的发生和发展与驱动基因突变的积累有关,这些突变为细胞提供了选择性生长优势。因此,一类识别癌症风险基因的方法是基于突变数据。在过去的几年里,几个癌症测序项目已经从数千名癌症患者那里生成了突变数据,增强了对癌症风险基因的鉴定。传统的统计方法侧重于患者队列中突变频率高于对照组的基因。到目前为止,基于频率的方法已经确定了许多癌症风险基因,并加强了癌症诊断和治疗。然而,癌症的遗传基础是高度多样化的。除了在大量患者中发生突变的基因外,仅在少数患者中观察到肿瘤发生和进展的一些关键基因发生突变。例如,PIK3CA已被以前的研究验证为ccRCC风险基因,在不超过5%的ccRCC患者中发生突变。纯粹基于频率的方法很难识别这些突变频率低但风险高的基因。

为了解决基于频率的方法的缺点,引入了蛋白质之间的相互作用以进行癌症风险基因鉴定,因为参与相同信号传导和调节途径的基因以及蛋白质复合物可能会相互作用以共同发挥它们的作用。HotNet2使用绝缘的热扩散过程,通过PPI网络传播热量来识别癌症风险基因。nCOP采用启发式搜索方法,根据癌症患者的突变数据从PPI网络中选择连接的子网,然后根据这些子网中出现的基因频率对癌症风险基因进行排序。上述两种方法都是无监督的,这可能会受到癌症高度多样化的遗传基础或PPI网络中的噪声的影响。最近出现了几种有监督的方法,它们可能是预测癌症风险基因的有价值的工具。例如,DeepDriver以基因突变类型为特征,基于Pearson相关系数构建k -最近邻图,训练卷积神经网络识别癌症风险基因。然而,与无监督方法不同,有监督方法需要大量已知的高可信风险基因作为模型训练的标记数据。遗憾的是,目前已知的高可信ccRCC风险基因的数量有限。

为了克服现有方法的局限性,研究提出了一种基于深度强化学习的ccRCC风险基因鉴定方法,名为RL-GenRisk(Reinforcement Learning-based gene risk)。基于强化学习的模型利用环境交互进行优化,应对稀少已知风险基因的挑战。具体来说,RL-GenRisk将PPI网络建模为环境,并利用图卷积网络学习状态表示。它还集成了深度Q网络(DQN)将强化学习与深度神经网络相结合,用于ccRCC风险基因识别。此外,数据驱动的奖励旨在促进一种识别ccRCC风险基因的直接方法。通过专注于具有节点特征的样本子图,数据驱动的奖励有效地利用了来自PPI网络和基因突变数据的信息。这不仅确保了对高突变频率基因的准确鉴定,而且还使RL-GenRisk能够识别出与高突变频率基因在功能上相互作用的潜在风险基因。大量实验表明,RL-GenRisk在鉴定ccRCC风险基因方面优于现有方法。此外,在独立数据集中揭示和验证了几个潜在的风险基因。具体来说,研究通过统计和生物学实验验证了两个顶级基因EGFR和PCLO。统计分析显示,在ccRCC患者中,EGFR在大细胞和单细胞水平上均显著上调,EGFR编码的蛋白质过表达与ccRCC患者生存率差之间存在显著关联。体外实验结果表明,EGFR表达降低促进ccRCC细胞凋亡以及抑制集落形成和迁移,使用EGFR抑制剂厄洛替尼可有效增强细胞凋亡并抑制迁移。总之,在体外敲低PCLO表达可显著抑制ccRCC进展,体内实验结果表明,厄洛替尼和EGFR下调均可显著抑制小鼠ccRCC肿瘤的生长。

图片

图1  工作流程图(摘自Nature Communications)

参考消息:

https://doi.org/10.1038/s41467-025-58626-4

Tags: Nat Commun:西北工业大学/四川大学/天津大学团队通过深度强化学习识别透明细胞肾细胞癌的潜在风险基因  

搜索
网站分类
标签列表