首页 > 医疗新闻/ 正文
过去半个多世纪,人类一共解析了5万多个人源蛋白质的结构,人类蛋白质组里大约17%的氨基酸已有结构信息,而AlphaFold2预测的结构将这一数字从17%提高到58%。它带来的在生命科学各分支领域的革命,将在今后几年到十几年中逐渐显现出来。
蛋白质结构预测是生物学的重要“圣杯”,也是人工智能落子生命科学领域最炙手可热的研究之一。

近日,我国自研深度学习蛋白质折叠预测平台TRFold传来好消息,其基于2020年第14届国际蛋白质结构预测竞赛(CASP14)蛋白质测试集的成绩仅次于“阿尔法折叠的迭代版”(AlphaFold2),排名全球第二,这是国内目前所有公开蛋白质结构预测模型中的最好成绩,我国计算生物学领域的表现跻身全球第一梯队。
从2018年AlphaFold第一次代表人工智能“参战”,到AlphaFold2用机器学习方法取得媲美结构生物学实验的精测精度,计算生物学给蛋白质预测这一世纪难题带来了颠覆性的解法。人工智能会给生命科学领域带来怎样的巨变?蛋白质结构预测这个生物学里悬而未决的终极难题之一,会被人工智能彻底解决吗?
深度学习可在计算生物学领域广泛应用
蛋白质结构预测是生命科学领域一个由来已久、令人着迷的问题,同时又以难度大、成本高、进展有限著称。但这个人们本以为需要一个世纪慢慢探索的问题近年来却取得了重大突破:2020年CASP14竞赛中,谷歌公司旗下的DeepMind公司研发的AlphaFold2取得了总分(GDT)92.4/100的成绩,也就是说,计算生物学几乎获得了与实验室方法精确度相当的蛋白质结构预测结果。
这个里程碑事件令结构生物学家们感慨,自己用价值1000万美元的电镜努力了好几年得出的结果,Alphafold2竟然一下就算出来了。“依我之见,这是人工智能对科学领域最大的一次贡献,也是人类在21世纪取得的最重要的科学突破之一。”生物物理学家、西湖大学校长施一公不吝赞美。
为什么要预测蛋白质结构?
天壤蛋白质折叠项目负责人苗洪江对科技日报记者解释,“研究蛋白质结构,有助于了解蛋白质的作用,理解蛋白质如何行使其生物功能,认识蛋白质与非蛋白质之间的相互作用,对于生物学、医学和药学等都非常重要”。
传统观测蛋白质结构的方法主要有3种,即核磁共振、X射线、冷冻电镜,但这些方法往往依赖大量试错和昂贵的设备,每种结构的研究都要花费数年时间。而人工智能应用于蛋白质结构预测的最新成果,即AlphaFold2,能在几天甚至几分钟预测出以前要花费数十年才能得到的具有高置信度的蛋白质结构。
“刚开始大家还在开玩笑,说Deepmind是不是通过什么方法盗取了真实实验结果,直到大家看到文章和开源代码才敢相信这件事情真的发生了。”苗洪江笑言,这侧面证明AlphaFold2预测结果之震撼,“这开启了人工智能在计算生物学广泛应用的大门,让整个领域的人看到了深度学习在这个领域可以广泛应用,这实打实的双盲实验结果就是证明。”
AI预测结果和实验室水平相当

1994年,美国科学家约翰·莫尔特(JohnMoult)发起国际蛋白质结构预测竞赛,每两年举办一届,竞赛的举办正是为了吸引计算机科学、生物物理学等不同领域的专家参与到蛋白质三维结构预测这一极具挑战性的生物信息学问题中来。2018年,人工智能正式参与蛋白质三维结构的预测,AlphaFold首次大显身手,在98名参赛队伍中排名第一。两年后,AlphaFold2带来真正的突破,它用机器学习方法对几乎所有的蛋白质都预测出了正确的结构,其中有大约2/3的蛋白质预测精度达到了结构生物学实验的测量精度。
事实上,过去半个多世纪,人类一共解析了5万多个人源蛋白质的结构,人类蛋白质组里大约17%的氨基酸已有结构信息,而AlphaFold2预测的结构将这一数字从17%提高到58%,因为无固定结构的氨基酸比例很大,58%的结构预测已经接近极限了。它带来的在生命科学各分支领域的革命,将在今后几年到十几年中逐渐显现出来。
施一公在接受媒体采访时曾谈到,人类蛋白质组里能够被预测的以单个蛋白为单位的空间三维结构,已经基本都被AlphaFold2预测了。总体而言,预测结果可信、也比较准确。对结构生物学来说,这是一个颠覆性突破。此前人类尚未被解析的一些结构,现在基本上都已经被预测。
对生物化学、细胞生物学、遗传发育、神经生物学、微生物学、病理药理等一大批生命学科和研究领域来说,这会大大改进人们对于生命过程的理解。比如,遗传学家也许积累了大量数据,但如果不知道蛋白质结构,就没法研究某个突变对于蛋白功能的影响。现在不同了,通过AlphaFold2的结构预测就能查看人类遗传病中的每一个突变在相关蛋白结构里的具体位置,进而有可能推测出蛋白功能如何受到影响。
再比如,DeepMind预测出来的蛋白结构,包括了众多G蛋白偶联受体和关键酶在内的一大批结构未知的药物靶点蛋白,而且预测的结构足够准确。这对于制药界来说太重要了,等于提供了可靠的药物设计和药物优化的重要基础。
单个蛋白质结构预测只是起点
今年7月,DeepMind公开了AlphaFold2的源代码,并在《自然》上发表论文阐述了AlphaFold2的技术细节。

“这次开源在生物学界掀起了巨大的波澜,意味着生物学家终于摆脱了先进设备的掣肘——此前这些昂贵的先进设备只有经费充足的大学或研究机构才有条件配置,而此后,小型团队或者个人研究者也有了参与蛋白质研究的可能。”天壤创始人、上海交通大学计算机系原副教授薛贵荣说。
苗洪江认为,目前的单个蛋白质结构预测只是一个起点,更加精准的侧链优化、蛋白质的动态分析、蛋白质与其配体(如小分子、DNA、RNA、多肽、蛋白质等)的相互作用等一系列的问题还没有解决,接下来的工作重点将是利用目前的全蛋白质组协同进化分析,建立起蛋白质与蛋白质之间相互作用的精准链路。
有了算法模型只是开始,向前走依然困难很多,薛贵荣坦言:“算力是很大的制约因素,比如AlphaFold2做了大量的数据蒸馏工作,他们的算法模型是基于30%的真实数据和70%的蒸馏数据一起训练的,背后是巨大的算力支持。”
充足的算力可以让蛋白质结构预测从单一结构向相互作用、从两两研究向规模化、从微观结构向宏观系统前进,“生物界有很多蛋白结构,比如基因测序大概已经测了几十亿条序列。但我们只知道序列,不知道结构,这就是很大的信息缺失问题。”薛贵荣说,“蛋白质通常以复合物的形式成对或成组地承担生命所需的种种功能。然而许多蛋白质复合物的结构仍然是谜,蛋白质之间的相互作用也尚未被识别。我们需要有充足的算力去支撑整个体系,进行蛋白质结构预测、蛋白质设计,研究蛋白质相互作用,药物研发等漫长而富有挑战的工作,寻找精准的疾病治疗新方法。”
同时,在数据来源和应用方面,也需要药厂、医院等进行协同和联动。“未来更多的医药企业、机构,以及人工智能公司,要一起把这个行业做大,现在只是个开始。”薛贵荣说。
来源:科技日报记者崔爽
注:文章内的所有配图皆为网络转载图片,侵权即删!
猜你喜欢
- Cardiovasc Diabetol :1型糖尿病患者的血糖控制和糖化作用与动脉僵硬的时变参数
- 张明智谈滥用激素治疗恶性淋巴瘤危害大
- 十分“秃”然!“16+8”轻断食翻车了?Cell:中国学者发现,长期间歇性禁食抑制毛囊再生,发质发量均下降!
- 男人开始衰老的7大特征,身体是最直接的反应
- EANM 2025:中国之声 | 华西医院研发 [18F] FMP 新型 PET 示踪剂,精准定位脑胶质瘤,提升诊断与分级效率
- 这样的接吻你学会了吗
- 春季排毒养颜吃什么好 十款春季排毒养颜食物推荐
- 长这样的西红柿,再便宜也别买
- BMC Medicine:阿戈美拉汀在改善重度抑郁症患者社交功能中的潜在作用
- 衡水市人民医院外科手术器械采购项目公开招标公告
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)