首页 > 医疗资讯/ 正文
近日,清华大学生命学院鲁志课题组和合作者在Nature Computational Science发表了题为“RNA-ligand interaction scoring via data perturbation and augmentation modeling”的研究论文[1]。该研究突破了传统药物设计方法依赖三维结构的局限,针对RNA结构匮乏的现实,提出了一种基于序列输入的RNA-小分子相互作用AI预测模型RNAsmol。该模型为靶向RNA的小分子药物研发提供了高效计算工具,为不依赖三维结构的人工智能辅助药物设计提供了新的方案和思路。
背景介绍
目前绝大多数的临床药物以蛋白质作为靶标,然而,许多蛋白质由于缺乏合适的结构口袋,常被认为是“难成药”或“不可成药”的。在人类的2万个左右的蛋白编码基因(占人类基因组总长度的1.5%左右)中,大约有10%-15%与疾病直接相关;而在这些基因中,据估计仅有700-900 个的蛋白产物是可以成药的(仅占人类基因组总长度的0.05%左右)[2,3]。另一方面,人类基因组的约70%甚至更多都会被转录成RNA,其中大多是非编码RNA (ncRNA)。因此,近年开始有越来越多的研究者试图将RNA作为药物靶标,并初步证明了这一策略的可行性[4-6]。新药研发成本昂贵且周期漫长,使用计算机辅助药物设计能够极大地降低研发成本,助力并加速靶向RNA的小分子药物的研发进程。然而,由于公开的RNA-小分子互作及已知的高分辨率RNA结构数据匮乏,开发数据驱动的深度学习模型仍面临诸多挑战。
研究内容
鲁志实验室长期致力于RNA生物信息学研究,在RNA-siRNA/shRNA、RNA-protein、RNA-ligand的计算设计上积累了大量科研经验[7-13]。在这项最新发表的工作中,作者利用数据扰动和增广策略针对RNA-小分子结合开发深度学习模型,搭建了用于RNA-小分子互作打分的AI预测方法RNAsmol。与其他计算方法相比,RNAsmol不仅具有更优异的预测性能,还具备广泛应用于多种药物筛选场景的潜力,对很多没有三维结构信息的RNA分子也依然可以进小分子药物预测。
1.基于数据扰动和增广的深度学习框架RNAsmol
该工作提出的RNAsmol框架,是一种结合数据扰动和数据增广策略的深度学习方法。在该框架中,数据扰动通过对训练数据进行随机扰动模拟真实环境中的数据多样性,从而帮助模型更好地学习到RNA-小分子结合的规律。而数据增广则通过在已知互作的基础上生成虚拟的负样本和潜在的未标记样本,增加模型对未知空间的识别能力。这种策略不仅提高了模型的鲁棒性,还帮助其更好地捕捉到不同类型的相互作用模式。此外,该模型结合基于图的分子特征表示方法和图扩散卷积模块对药物小分子进行结构建模,通过基于注意力机制的特征融合模块在多个模态下对靶标和药物分子特征进行加权整合,最终实现RNA靶标与小分子之间的打分预测。
2.RNAsmol在数据扰动空间中能准确分类RNA-小分子相互作用
在数据扰动空间中,RNAsmol通过扰动策略有效地减少了真实负样本与未知互作空间之间的偏差。该策略通过对已知的负样本进行扰动,生成潜在的“负例”样本,同时通过数据增广技术扩展已知的正例和负例样本的边界。这使得模型能够更好地理解RNA与小分子之间的结合规律,尤其是在数据不均衡的情况下,避免了模型偏向已知的正负样本。实验结果表明,RNAsmol在10折交叉验证中的表现超过了传统方法,平均AUROC(曲线下面积)指标提升约8%,同时在未见样本的评估中,性能提升了约16%。这一优势证明了该方法在稀疏数据场景中的有效性,进一步推动了RNA-小分子结合预测的计算研究。
3.RNAsmol作为虚拟筛选工具能准确区分诱饵分子与真实配体
在虚拟筛选的应用中,RNAsmol展现出独特的优势。与传统依赖于结构信息的筛选方法不同,RNAsmol完全基于RNA的序列信息进行预测。因为许多与疾病相关的RNA靶点(如lncRNA)的三维结构数据常常难以获得,RNAsmol能够弥补这一数据缺口实现对这些靶点的预测筛选。实验结果表明,RNAsmol在区分诱饵分子与真实配体时,成功将排序得分提高了约30%。因此,RNAsmol在各类RNA靶向药物筛选中具有广泛的适用性,通过该方法可以更加高效地筛选潜在的药物分子。
结 语
总的来说,该研究通过探究基于数据扰动和增广的深度学习训练策略在数据匮乏场景的应用,为靶向RNA药物研发的计算建模提供了新思路。
清华大学生命学院鲁志副教授与南昌大学徐振江教授为论文通讯作者。清华大学已出站博士后(现哈尔滨工业大学副研究员)马洪丽为文章第一作者。本课题得到来自国家重点研发计划、国家自然科学基金、“生物信息学”教育部重点实验室、“绿色生物制造”全国重点实验室、清华大学精准医疗研究院、Bayer制药公司等经费的资助支持。
参考文献:
0. RNA: 掌控生命后台 《环球科学》(Scientific American) 2024年7月刊封面文章
1.Ma, H., et al., RNA-ligand interaction scoring via data perturbation and augmentation modeling. Nature Computational Science, 2025
2.Warner, K.D., et al., Principles for targeting RNA with drug-like small molecules. Nature Review Drug Discovry, 2018
3.Knox, C., et al., DrugBank 6.0: the DrugBank Knowledgebase for 2024. Nucleic Acids Res, 2024
4. Sheridan, C., First small-molecule drug targeting RNA gains momentum. Nature Biotechnology, 2021
5. Howe, J.A., et al., Selective small-molecule inhibition of an RNA structural element. Nature, 2015
6.Aguilar, R., et al., Targeting Xist with compounds that disrupt RNA structure and X inactivation. Nature, 2022
7.Bai, Y., et al., OligoFormer: an accurate and robust prediction method for siRNA design. Bioinformatics, 2024
8.Zhao, W., et al., POSTAR3: an updated platform for exploring post-transcriptional regulation coordinated by RNA-binding proteins. Nucleic Acids Res, 2022
9.Li, Y., et al., Identification of high-confidence RNA regulatory elements by combinatorial classification of RNA-protein binding sites. Genome Biology, 2017
10.Tan, X., et al., Tiling genomes of pathogenic viruses identifies potent antiviral shRNAs and reveals a role for secondary structure in shRNA efficacy. PNAS, 2012
11.Tan, X., et al., Systematic identification of synergistic drug pairs targeting HIV. Nature Biotechnology, 2012
12.Lu, Z.J. and D.H. Mathews, OligoWalk: an online siRNA design tool utilizing hybridization thermodynamics. Nucleic Acids Res, 2008
13.Lu, Z.J. and D.H. Mathews, Efficient siRNA selection using hybridization thermodynamics. Nucleic Acids Res, 2008
原文链接:
https://www.nature.com/articles/s43588-025-00820-x
猜你喜欢
- JAMA Cardiology:维立诺雷加别嘌呤醇治疗射血分数保留的心力衰竭疗效分析
- 番茄蛋花汤怎么做更营养?
- Lancet Digit Health:通过深度学习从普通CT图像中检测肝棘球菌病
- MedComm:阜外-北大合作研究:肺动脉高压的全球挑战:疾病负担的时空异质性及政策启示!
- Hematology :关于用依米珠单抗治疗血友病A的专家意见论文
- 生肉不能直接在家冲洗?咱又做错了吗?
- 阳新县中医医院肿瘤科设备采购项目询价公告
- 为女人量身定制的性保健操
- 白内障患者不得不重视的术后饮食
- 重磅!职称按临床、科研分开评成可能!晋升副高必须下基层1年!明年起护士可正式开处方,包括检查、治疗申请单,一地落实了
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)