首页 > 医疗资讯/ 正文
小分子药物开发是一个漫长的过程。从巨大的化学空间中识别并挑选出最有潜力成药的分子仍然具有挑战性。尽管目前已经有多种方法用于评估化合物成药潜力,如基于结构性质的sp3碳杂化比例(fraction of sp3-hybridized carbons,Fsp3)、Lipinski5规则(Lipinski’s rule of 5,Ro5)、QED打分、相对类药性打分(relative drug-likeness,RDL),以及最近的基于深度学习的方法DeepDL和GCN。然而,这些方法往往只能测定与获批药物之间的理化性质相似性,而没有充分考虑药物在生物系统中的特性(例如渗透性、清除率)。因此,单一的打分无法完全涵盖药物复杂的性质空间,这极大地限制了对化合物的指导优化。

为了解决上述问题,诺华生物医学研究院近期报导了一种新的深度学习方法。该方法利用100个大规模ADMET预测结果来评估化合物成为相关候选药物的潜力,由此产生的分数称为bPK分数。该方法明显优于以前的方法,并在先前方法表现不佳的数据集上展现了较强的判别性能。相关工作以“Prediction of Small-Molecule Developability Using Large-Scale In Silico ADMET Models”为题发表在美国化学会出版的药物化学核心期刊Journal of Medicinal Chemistry上(DOI:10.1021/acs.jmedchem.3c01083)。
在该项研究中,作者对药物研发过程中的不同时间节点进行分类,将2005年至2017年间记录的近40000个化合物的理化特征数据及生物学数据用于训练深度神经网络模型。该模型采取秩次一致有序回归(rank-consistent ordinal regression)架构,以公司内部使用的ADMET模型及MELLODDY模型产生约100个的描述符作为模型的输入,根据预测产生的化合物ADMET图谱推断化合物在体内药代动力学(PK)阶段以外的研究潜力。为了评估bPK打分模型的性能,作者首先构建了一个包含约10000个化合物的内部测试集并进行打分,以分析该模型区分候选药能力,并与其他计算方法进行了比较。结果显示(图1b),QED、DeepDL或GCN等方法在内部测试集上没有显示出任何显著的辨别力,而作为基线模型的Fsp3模型的ROC-AUC为0.57,相较之下,bPK打分模型的ROC-AUC为0.83,展现出该模型较强的判别能力。

图1:(a)bPK打分模型架构(左)和用于预测单个化合物的模型概述(右);(b)bPK打分模型与和其他已发表的化合物评分(QED、DeepDL、GCN、Fsp3)的ROC曲线;(c)内部测试集中化合物bPK分数分布直方图。
随后,作者通过减少模型输入特征数量来检验该模型的鲁棒性。在去除体内PK数据后,模型性能略微下降(ROC-AUC ≥ 0.79),而仅使用ADMET数据时,ROC-AUC 显著降低(0.74),说明体外ADMET数据是模型的主要信息来源。作者还使用主成分分析得到的前2、5、10和20个特征来训练bPK打分模型。令人惊奇的是,在仅使用10个特征的情况下,模型AUC达到0.79。细微的特征变化并未使模型预测结果产生较大的波动,并且没有出现严重的过拟合现象,表明该模型具有较强的鲁棒性。
为了深入了解不同ADMET预测方法对bPK打分模型的影响,作者使用可解释性AI模型量化特征重要性(图2)。在Shapley值最高的15个特征中,包含了体内生物利用度、清除率、渗透性和溶解度等相关测定。这些特征与候选分子挑选规则基本一致。在UMAP降维图中,候选药物一致分布在bPK分数较高的区域,但从结构以及性质角度来看并未得到可总结性的规律。为了评估模型的泛化能力,作者从ChEMBL数据构建了一个公共数据集,来模拟內部数据集的分布。ROC曲线结果显示bPK打分模型在公共数据集上具有与内部数据几乎一致的表现。这些结果表明该模型具有较好的泛化能力和鲁棒性。

图2:(a)bPK打分模型输入特征Shapley分析结果(b)以bPK分数着色的UMAP降维图(c)根据性质及结构特征着色的UMAP降维图
最后,作者利用bPK打分模型在诺华公司的内部项目上进行了回顾性研究。他们导出了几个项目中经过诺华化学团队详细注释及表征的所有分子,然后使用bPK评分对化合物进行评分。作者分析了不同项目中bPK分数随时间演变规律(图3)。除了项目2之外,其他项目中使用的不同化合物系列均展现出不同的分布规律,且bPK分数随化合物优化推进而增加,每个项目所选定的候选药物均获得最高的bPK打分。该结果表明,bPK打分模型可以从已有化合物中获取经验,并将该经验用于指导苗头化合物的发现、先导化合物骨架优化及分子生成过程。

图3:诺华内部项目中bPK分数分布情况
综上所述,作者提出了一种新颖的机器学习模型-bPK打分模型,该模型利用大规模体外ADMET预测结果作为输入。相比于其他单一条件作为输入的计算方法,这种集成式输入使模型在庞大的化合物性质空间实现最大范围的探索。在多个数据集中,bPK打分模型均表现出强大的鲁棒性以及泛化能力。应用bPK打分可以有效区分不同系列化合物并最终确定其优先级,对于药物发现及优化具有重要意义。
参考文献:
[1] Beckers M, Sturm N, Sirockin F, Fechner N, Stiefl N. Prediction of Small-Molecule Developability Using Large-Scale In Silico ADMET Models. J Med Chem. 2023;66(20):14047-14060.
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)