首页 > 医疗资讯/ 正文
DNA测序技术的发展,特别是基因组学和宏基因组学工具的发展,使得大量蛋白质序列被发现。然而,仅有不到0.3%(约50万个)的蛋白质被人工专家审核过,不到19.4%受到明确实验证据的支持。缺乏审核的蛋白质,其功能注释往往只能依靠计算机自动标注。
大规模的基于社区的蛋白质功能注释研究表明,现有的计算机自动标注工具中,约有 40% 的酶类蛋白质的标注是错误的。这使得蛋白质功能注释仍然是一项令人望而却步的挑战。
如同 ChatGPT 使用书面语言的数据来创建预测文本一样,研究人员正在利用蛋白质的语言来预测它们的活动。
伊利诺伊大学香槟分校赵惠民团队,开发了一种名为CLEAN(contrastive learning–enabled enzyme annotation)的机器学习算法,使用了对比学习的方法来提高对酶功能的预测性能,能够表征酶功能,纠正错误标记的酶,以及识别具有两个或多个EC号的多功能酶。相关成果以“Enzyme function prediction using contrastive learning”发表于最新一期Science。

EC编号或EC号是酶学委员会(Enzyme Commission)为酶所制作的一套编号分类法,是以每种酶所催化的化学反应为分类基础。每一个酶的编号都以字母“EC”起头,接着以四个号码来表示。
目前开发了许多用于酶功能注释的计算机工具,这些工具大部分是通过将查询的序列与已知酶的目录进行比较,找到相似的序列来分配EC编号,标注这一酶催化哪种反应。然而,这些工具不适用于研究较少或未表征的酶,或者多功能酶。
该研究团队使用对比学习这一深度学习算法来预测酶功能,开发了一种名为CLEAN(contrastive learning–enabled enzyme annotation)的机器学习算法,CLEAN在UniProt的高质量数据上进行了训练,将氨基酸序列作为输入,并输出按可能性排序的酶功能列表(EC数)。

CLEAN 的对比学习框架
研究人员将 CLEAN 与六种最先进的 EC 数字注释工具进行比较,系统地研究了 CLEAN 的预测性能。通过计算验证,尽管不是每一个酶功能都能被CLEAN正确预测,但相对其他几种方法,CLEAN准确率更高。

CLEAN 与最先进的 EC 预测工具的定量比较
实验进一步验证了CLEAN算法的可行性。研究人员使用CLEAN算法对卤代酶进行酶功能分类的预测。卤代酶越来越多地用于生物催化CH官能团化 ,由卤代酶产生的具有卤素原子的小分子通常具有良好的生物活性和理化性质,从而在医药和农业领域拥有广泛的应用。
结果显示,CLEAN算法比其他六种常用计算工具表现更好。在使用CLEAN算法对36个卤素酶进行分类时,发现部分酶的分类存在问题,CLEAN算法提出新的酶功能分类并得到验证。研究表明CLEAN算法在酶功能分类方面表现出色,尤其在识别具有相似结构但不同功能的酶这一方法比其他方法更为优越。

36 种已识别卤化酶的 EC 准确度
该团队计划扩展 CLEAN 背后的 AI,用于表征其他蛋白质,例如结合蛋白。并希望进一步开发机器学习算法,以便用户可以搜索所需的反应,而 AI 会指出适合该工作的酶。
“目前有很多未表征的结合蛋白,比如受体和转录因子,我们也想预测它们的功能,”赵教授提到,“我们想要预测所有蛋白质的功能,以便能了解细胞中所有蛋白质,更好地研究或设计整个细胞,用于生物技术或生物医学应用。”
原文链接:
https://www.science.org/doi/10.1126/science.adf2465
猜你喜欢
- 宁夏颁布我国第一部眼角膜捐献地方性法规
- 河北大学张金超教授团队《Biomaterials》:线粒体靶向纳米酶在急性肝损伤防治中的研究
- Nature Methods:生物影像分析的未来:NanoPyx开启效率与智能的双赢时代
- 女子路边摊打耳洞 5年后耳垂变肉瘤
- 销售过期食品发个声明就可以概不负责?专家:声明无效
- 甲减患者要知道!不是所有甲减患者都需要补碘
- 血液净化技术在脓毒症和其他高炎症反应疾病中的应用
- 减肥瘦身哪些方法能塑造体型 6式减肥瘦身操30天拥有完美身材
- AMERICAN JOURNAL OF TRANSPLANTATION:造血干细胞移植后儿科肝移植接受者实现了操作耐受性
- “动态清零”可持续且必须坚持
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)