首页 > 医疗资讯/ 正文
分子对接结合打分函数的虚拟筛选流程广泛地用于先导化合物发现,已经成为药物设计中的常见范式。在发现了活性先导化合物之后需要进行结构优化,采用的手段通常是在固定先导化合物结构母核的基础上对部分片段作微小的修饰。然而在这一阶段的药物设计过程中打分函数的结果往往不具有指导意义,比较准确的计算手段是通过自由能微扰方法(FEP)计算两个配体分子之间的相对结合自由能。在合理设置参数和微扰过程的情况下,FEP的计算误差在1.0 kcal/mol左右,接近实验精度,可以很好地指导化合物结构优化的方向和策略。然而建立FEP模拟体系的过程较为繁琐。商业软件薛定谔中的FEP+模块尽管使用简单,但是需要收取较为昂贵的费用。另一方面,FEP需要消耗非常大量的计算资源,难以大规模开展。近期,上海药物所郑明月课题组开发了深度学习模型PBCNet(pairwise binding comparison network)用于快速准确预测配体相对结合自由能。测试结果显示,在利用少量数据进行微调优化的情况下,PBCNet可以与FEP+具有相近的性能,但仅需要FEP+十万分之一的计算时间,为先导化合物结构优化设计提供了方便有效的计算工具,相关工作发表在Nature Computational Science上 (Nat. Comput. Sci. 2023, 3, 860–872)。
PBCNet的整体框架如图1所示。首先通过图卷积神经网络从蛋白结合口袋中提取蛋白结构特征之后通过另一组神经网络将蛋白结构特征与配体特征进行融合(图1a)。此后,利用AttentiveFP网络计算融合了蛋白口袋特征的两个配体的最终特征(图1b)。最后,利用提取的特征预测配体之间的相对结合自由能。同时作者为PBCNet添加另一个辅助分类任务帮助模型学习:预测配体1是否比配体2具有更好的亲合性(图1c)。

图1、PBCNet的整体框架。
训练PBCNet需要的数据集的组成为已知复合物结构和相对亲合性数值的配体。为此,作者以BindingDB v.2020为数据来源构建了PBCNet的训练数据集。作者首先从BindingDB中提取了1265组化合物系列,每一组系列中均有化合物具有已知的晶体复合物结构。在每一组化合物中,利用Glide为没有复合物结构的化合物产生对接构象并基于以下规则进行挑选:(1)对接分子与已知晶体复合物结构的配体分子的公共结构片段之间的RMSD值小于2.0 Å;(2)同时具有多个满足条件的构象选取对接得分最高的构象。最后从BindingDB提取IC50数值。经过以上步骤,作者最终获取了971组化合物系列,平均每个系列有39个化合物结构。通过两两配对,作者最终得到约60万个已知结构和相对亲合性数值的一对配体组成的数据集。另外,为了测试PBCNet的性能,作者还构建了两个测试集(FEP1和FEP2,在构建训练集时两个测试集中与训练集重合的部分已被移除)。
作者首先在FEP1和FEP2上测试了PBCNet的性能,结果显示,PBCNet在FEP1和FEP2上分别能达到RMSE 1.11 kcal/mol和1.49 kcal/mol的水平,相比于其他同类型模型和Glide SP以及MM-GBSA均有显著优势,不过并没有超过FEP+。从Spearman相关系数而言,PBCNet在所有的测试体系上均比较稳定,而打分函数Glide SP在不同体系上的性能相差很大。这说明PBCNet的预测结果具有较好的稳定性。
以上测试对应的场景是在未知任何分子活性的情况下应用PBCNet。在实际的分子结构优化过程中,通常已经通过实验测得几个配体分子的亲合力,因此可以用这几个样本对模型进行调优训练。作者从每一个系列中随机挑选2-10个化合物用于调优训练PBCNet,并测试了在不同样本数下PBCNet的性能。结果显示,使用少量样本进行训练后,PBCNet可以与FEP+具有相近的预测性能(图2)。由于PBCNet具有比FEP+约十万倍的计算效率,因此PBCNet在实际的结构优化药物设计中可以快速高效地进行应用。

图2、PBCNet在FEP1和FEP2测试集上进行小样本学习后的表现,其中蓝色虚线为FEP+的测试结果。PBCNet在进行小样本调优后具有与FEP+相当的性能。
作者还模拟了PBCNet在实际项目中的应用,以评估应用PBCNet带来的效率提升。作者总共设计了九组数据,对比了在PBCNet的预测结果指导下发现最优活性化合物的次序并和实际发现最优化合物的次序。结果显示,应用PBCNet可以加速分子结构优化项目约473%,同时减少约30%的实验材料消耗。以上结果说明了PBCNet在实际分子结构优化中的应用价值。
总结
作者在此项工作中开发了基于孪生图神经网络的PBCNet模型,可以用于预测具有共同母核结构的一组化合物的活性高低,帮助新药研发人员决定同系化合物的合成优先级。作者展示了PBCNet模型具有较好的准确性和极高的计算效率,可以有效地指导对分子结构进行优化。为了方便使用,作者在其维护的网络服务器上提供了便捷的图形化界面(https://pbcnet.alphama.com.cn/index)。
参考文献
Jie Yu, Zhaojun Li, Geng Chen, Xiangtai Kong, Jie Hu, Dingyan Wang, Duanhua Cao, Yanbei Li, Ruifeng Huo, Gang Wang, Xiaohong Liu, Hualiang Jiang, Xutong Li, Xiaomin Luo & Mingyue Zheng, Computing the relative binding affinity of ligands based on a pairwise binding comparison network. Nat. Comput. Sci. 2023, 3, 860–872
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)