首页 > 医疗资讯/ 正文
无庸置疑人类细胞有非常复杂的组织结构,从纳米级的蛋白质复合物到微米级的细胞器和结构体。尽管已有多种技术(如电子显微镜、免疫荧光染色、蛋白质组学等)用于研究细胞结构,但这些技术大多是孤立应用的,缺乏系统性整合。
近日,加州圣地亚哥分校医学系的 崔·艾迪克 团队在 Nature 上发表题为 Multimodal cell maps as a foundation for structural and functional genomics 的文章,提出结合多模态数据(如蛋白质相互作用、免疫荧光图像等)并利用深度学习方法,可以构建一个全面、系统的细胞结构图,为理解细胞功能和疾病机制提供基础。
该研究主要步骤概括如下图所示,左上-从U2OS骨肉瘤细胞质中提纯蛋白质,使用亲和纯化-质谱仪测定其生物物理相互作用。同时,右上-用荧光激发光照射蛋白质,并利用高分辨率共聚焦成像测定其亚细胞分布。这些荧光激发光成像和生物物理相互作用数据被整合成一个多模态细胞图(图中),该图运用到五个生物学范畴中(图下从左到右-三维结构,蛋白作用,细胞特异性,蛋白质多位性,肿瘤突变解释)和一个可视觉化互动在线平台。
论文采用了多种先进技术和方法:
-
蛋白质相互作用(AP-MS,亲和纯化-质谱):通过免疫共沉淀结合质谱技术,系统性地识别超过5,100个蛋白质的相互作用网络。
-
免疫荧光(IF)成像:利用高分辨率共聚焦显微镜,获得了对应蛋白的亚细胞定位图像。
-
多模态数据融合:采用自监督深度学习模型,将亲和纯化-质谱的相互作用数据与免疫荧光图像数据进行融合,生成蛋白质的低维特征表示(嵌入向量)。
-
多尺度共同体检测:利用共同体检测算法(如HiDeF,Hierarchical community Decoding Framework)在蛋白质相似性网络中识别出275个不同的蛋白质复合体和亚结构。
-
验证与注释:通过全细胞尺寸排阻色谱(SEC–MS)验证蛋白质复合体的存在,结合大语言模型(GPT-4)对未命名的结构进行功能和名称注释。
-
结构预测:利用阿尔法折叠-多聚体(AlphaFold-Multimer)对蛋白质对进行三维结构预测,结合实验验证,构建多个蛋白质复合体的结构模型。
-
应用分析:对蛋白功能推断、细胞类型特异性、多位、多功能蛋白的识别,以及癌症突变的解读,建立一个可视觉化互动的在线平台。
主要结果如下;
-
多模态融合优势:结合蛋白质相互作用和成像数据,总共有 5,147 种蛋白质得到了很好的体现,融合数据比单一模态更能识别小型蛋白复合体,增强了结构的整体性和准确性。
-
细胞结构图:成功构建了一个涵盖275个蛋白质复合体的多尺度细胞亚结构图,范围从10纳米到10微米。
-
U2OS细胞图的注释:艾迪克团队组织了一系列面对面的注释会谈,十多个有专业学识的科学家,两人一组,根据专业知识和文献整理,对275个蛋白质复合体进行命名和设定功能,结合大语言摸型,为组学数据中所识别的基因集给出了有建设性的名称和功能解释。
-
系统验证:对U2OS 细胞的三次培养物进行了40个独立色谱分级分析(SEC-MS,尺寸排阻色谱法和质谱法),得到了 5,509 种蛋白质的定量分析图。
-
结构预测:利用阿尔法折叠-多聚体(AlphaFold-Multimer),预测了111个新颖的蛋白复合体的三维结构,其中许多结构在蛋白质数据库中未曾报道过。
-
功能推断:通过“以罪推罪“(guilt by association)策略,成功为975个功能未注释的蛋白质赋予了新的潜在功能,例如C18orf21在RNA处理中的作用;二肽基肽酶9(DPP9)在干扰素信号中的角色。
-
细胞类型特异性:比较U2OS和HEK293细胞的蛋白质复合体,揭示了细胞特异性和共性。例如,在 U2OS亲和纯化-质谱数据中可以明确识别出一种名为能量代谢调节复合体的细胞质成分,但在 HEK293 细胞中却没有检测到任何相应相互作用的蛋白体。
-
多位蛋白:发现约30%的蛋白质具有多重亚细胞定位,显示其多功能性。例如,XAB2是剪接体和转录偶联修复的已知因子,它不仅如预期那样定位于核组装体,而且还位于细胞内膜。该研究表明整个蛋白复合体存在多位性和多功能性。
-
癌症突变分析:将癌症基因突变数据映射到蛋白质复合体,研究者获得了涵盖 18 种肿瘤类型的 772 例儿童原发性肿瘤的全基因组体细胞突变谱,识别出21个在儿童癌症中反复突变的蛋白质复合体,在这些复合体中,重点研究了 250 种假定的癌症蛋白,这些蛋白不仅存在于反复突变的复合体中,而且自身也在多个肿瘤样本中发生突变,为癌症机制提供了新的理解。
-
细胞图工具箱和在线平台:读者可使用多尺度整合细胞可视觉化互动在线平台http://musicmaps.ai/u2os-cellmap/ 。 研究者还开发了细胞图工具箱,https://github.com/idekerlab/cellmaps_pipeline,将本文描述的终端到终端流程以一系列Python包的形式实现,并附带完整的用户文档。该工具箱提供了一个灵活且通用的细胞图构建框架,使研究人员能够通过多种输入方式集成和构建细胞图。
总之,该论文讨论了多模态数据整合在系统性构建细胞结构图中的重要性,强调了深度学习在数据融合和结构注释中的作用。作者指出,该细胞图不仅是基础研究的资源,也能指导结构生物学、功能注释、疾病机制研究等多个领域。多模态分析的另一个独特优势是,它通过设计为新的生物学发现提供了多条证据链。未来,随着技 术的不断发展,可以引入更多模态(如冷冻电子显微镜、空间转录组等),实现动态和时空的细胞结构映射。论文还强调了该方法的普适性,可以推广到不同细胞类型和疾病状态,为精准医学提供基础数据支持。
- 搜索
-
- 1000℃李寰:先心病肺动脉高压能根治吗?
- 1000℃除了吃药,骨质疏松还能如何治疗?
- 1000℃抱孩子谁不会呢?保护脊柱的抱孩子姿势了解一下
- 1000℃妇科检查有哪些项目?
- 1000℃妇科检查前应做哪些准备?
- 1000℃女性莫名烦躁—不好惹的黄体期
- 1000℃会影响患者智力的癫痫病
- 1000℃治女性盆腔炎的费用是多少?
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)