首页 > 医疗资讯/ 正文
DNA测序技术的发展,特别是基因组学和宏基因组学工具的发展,使得大量蛋白质序列被发现。然而,仅有不到0.3%(约50万个)的蛋白质被人工专家审核过,不到19.4%受到明确实验证据的支持。缺乏审核的蛋白质,其功能注释往往只能依靠计算机自动标注。
大规模的基于社区的蛋白质功能注释研究表明,现有的计算机自动标注工具中,约有 40% 的酶类蛋白质的标注是错误的。这使得蛋白质功能注释仍然是一项令人望而却步的挑战。
如同 ChatGPT 使用书面语言的数据来创建预测文本一样,研究人员正在利用蛋白质的语言来预测它们的活动。
伊利诺伊大学香槟分校赵惠民团队,开发了一种名为CLEAN(contrastive learning–enabled enzyme annotation)的机器学习算法,使用了对比学习的方法来提高对酶功能的预测性能,能够表征酶功能,纠正错误标记的酶,以及识别具有两个或多个EC号的多功能酶。相关成果以“Enzyme function prediction using contrastive learning”发表于最新一期Science。

EC编号或EC号是酶学委员会(Enzyme Commission)为酶所制作的一套编号分类法,是以每种酶所催化的化学反应为分类基础。每一个酶的编号都以字母“EC”起头,接着以四个号码来表示。
目前开发了许多用于酶功能注释的计算机工具,这些工具大部分是通过将查询的序列与已知酶的目录进行比较,找到相似的序列来分配EC编号,标注这一酶催化哪种反应。然而,这些工具不适用于研究较少或未表征的酶,或者多功能酶。
该研究团队使用对比学习这一深度学习算法来预测酶功能,开发了一种名为CLEAN(contrastive learning–enabled enzyme annotation)的机器学习算法,CLEAN在UniProt的高质量数据上进行了训练,将氨基酸序列作为输入,并输出按可能性排序的酶功能列表(EC数)。

CLEAN 的对比学习框架
研究人员将 CLEAN 与六种最先进的 EC 数字注释工具进行比较,系统地研究了 CLEAN 的预测性能。通过计算验证,尽管不是每一个酶功能都能被CLEAN正确预测,但相对其他几种方法,CLEAN准确率更高。

CLEAN 与最先进的 EC 预测工具的定量比较
实验进一步验证了CLEAN算法的可行性。研究人员使用CLEAN算法对卤代酶进行酶功能分类的预测。卤代酶越来越多地用于生物催化CH官能团化 ,由卤代酶产生的具有卤素原子的小分子通常具有良好的生物活性和理化性质,从而在医药和农业领域拥有广泛的应用。
结果显示,CLEAN算法比其他六种常用计算工具表现更好。在使用CLEAN算法对36个卤素酶进行分类时,发现部分酶的分类存在问题,CLEAN算法提出新的酶功能分类并得到验证。研究表明CLEAN算法在酶功能分类方面表现出色,尤其在识别具有相似结构但不同功能的酶这一方法比其他方法更为优越。

36 种已识别卤化酶的 EC 准确度
该团队计划扩展 CLEAN 背后的 AI,用于表征其他蛋白质,例如结合蛋白。并希望进一步开发机器学习算法,以便用户可以搜索所需的反应,而 AI 会指出适合该工作的酶。
“目前有很多未表征的结合蛋白,比如受体和转录因子,我们也想预测它们的功能,”赵教授提到,“我们想要预测所有蛋白质的功能,以便能了解细胞中所有蛋白质,更好地研究或设计整个细胞,用于生物技术或生物医学应用。”
原文链接:
https://www.science.org/doi/10.1126/science.adf2465
猜你喜欢
- 吃维生素C能降尿酸?专家教你4步,轻松提升维C水平!
- Neurology:血管风险与严重和非严重中风的关联分析
- 免疫微环境 “拖后腿”?J Clin Oncol揭秘TP53突变淋巴瘤难治的深层原因
- 安庆市立医院激光眼科诊断仪系统采购项目招标公告
- Nature:谷歌推出医学版ChatGPT——Med-PaLM 2
- Sci Adv:四川大学米鹏研究发现基于STING激活与免疫逃逸抑制的肿瘤靶向纳米载体增强冷肿瘤免疫治疗效果
- Sleep Med:水疗法对纤维肌痛患者睡眠改善的效果
- 被召回的喜炎平:厂商说一天连出7起不良反应很反常
- 作为一名眼科医生 我这样让自己的孩子远离近视
- 【论著】症状性前循环颅内动脉重度狭窄患者急性期血管内治疗效果分析
- 搜索
-
- 1000℃Cell | 曾泽贤/潘登/冯驭团队开发SPAC-seq新技术,实现空间分辨率下高通量CRISPR筛选
- 1000℃福建师范大学ACS Nano:人工智能驱动的Janus敷料用于可视化伤口诊疗
- 1000℃中科院苏州纳米所ACS Nano综述:通过可穿戴AI接口学习人类-环境交互
- 1000℃Cancer Discov | 新型AI基础模型可根据基因型精准预测癌症治疗反应,涵盖10种实体瘤超3万个肿瘤基因组数据
- 1000℃新加坡国立大学/复旦大学《自然·通讯》:抗氧化脂质纳米颗粒增强mRNA稳定性用于再生治疗和基因编辑
- 1000℃489例疑似罕见遗传病患者进行全外显子测序WES:确诊率达53%,5.5%检出心血管或肿瘤相关基因变异
- 1000℃Nat Cancer | 基于组织病理学图像的AI模型可快速识别102种CNS肿瘤亚型,表现优于神经病理学家
- 1000℃国立清华大学《自然·通讯》:工程化人类PEG10纳米颗粒实现RNA自包装、递送与癌症治疗
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)