首页 > 医疗资讯/ 正文

EMBO Molecular Medicine:基于本体指导的聚类方法实现罕见儿科疾病的蛋白质组学分析

来源 2025-08-09 12:28:08 医疗资讯

罕见儿科疾病的研究长期以来受限于患者数量稀少,难以进行有统计学意义的分子机制分析。传统病例对照研究在样本量不足时往往无法得出可靠结论,而临床异质性进一步增加了研究难度。为解决这一瓶颈问题,本研究创新性地将临床本体论与大规模蛋白质组学相结合,开发了一个能够系统分析罕见疾病的整合框架。研究团队选取了1140名3至17岁的儿童和青少年作为研究对象,其中包括131名健康个体和1009名确诊患有394种不同疾病的患者,通过采集尿液和血浆样本进行全面的蛋白质组学分析。

在技术层面,研究采用了先进的质谱工作流程,包括基于二甲基标记的多重数据非依赖采集(mDIA)用于尿液分析,以及免标记的数据非依赖采集(DIA)用于血浆分析。特别值得注意的是,团队还开发了一种简化版的高氯酸去富集(PCA-N)策略,通过选择性沉淀高丰度血浆蛋白,显著提升了低丰度蛋白的检测灵敏度。最终,研究在尿液中定量了5081种蛋白质,在未处理血浆中定量了920种蛋白质,而在PCA-N处理的血浆中定量了1900种蛋白质。

研究的关键创新点在于将国际系统医学术语集(SNOMED CT)嵌入网络结构,通过语义相似性对罕见疾病进行聚类分析。具体方法包括构建基于SNOMED CT的疾病本体网络,利用node2vec算法将疾病节点嵌入低维向量空间,并通过k-means聚类(k=43)将临床相关的疾病归类。这种基于本体的聚类方法成功将样本量不足5例的疾病类别从344个减少到8个,显著提升了统计效力。例如,在尿液蛋白质组中,仅包含4例患者的"结构性心脏病"聚类(Cluster 18)通过这种方法识别出66个差异表达蛋白,包括与氧化应激相关的铜蓝蛋白(CP)和硫氧还蛋白(TXN)。类似地,在PCA-N血浆数据中,仅含2例患者的"膝关节肌肉骨骼疾病"聚类(Cluster 16)也检测到64个显著变化的蛋白质,如参与细胞外基质结构的胶原XVI型α-1链(COL16A1)。

图1 研究队列和蛋白质组学工作流程概述

研究结果揭示了尿液和血浆蛋白质组的显著差异及其与发育阶段的关系。尿液蛋白质组显示出更高的个体间变异(中位生物变异系数55.9%),主要反映肾脏功能和上皮细胞更新相关的蛋白质,如角质蛋白(KRT1/2/5)和黏蛋白(MUC1)。而血浆蛋白质组则更稳定(中位生物变异系数47.9%),富含载脂蛋白(APOA1/2等)和凝血因子(F2/FGA等)等系统循环蛋白。年龄效应分析发现,尿液蛋白质组在青春期(10-12岁后)呈现显著变化,特别是女性在9岁后角质形成细胞分化相关蛋白的急剧增加,反映了性激素对皮肤屏障功能的调控。相比之下,血浆蛋白质组显示出与免疫系统成熟相关的线性变化趋势,如B细胞受体信号通路蛋白随年龄增长而上调,而补体激活相关蛋白则下调。

图2 蛋白质组谱对年龄和生物性别的依赖性

在疾病特异性分析方面,研究重点解析了囊性纤维化(CF)的分子特征。在未处理血浆中,CF患者显示出78个差异蛋白,其中醛缩酶B(ALDOB)和钙黏蛋白1(CDH1)显著上调,免疫球蛋白δ重链(IGHD)则明显下调。ALDOB的上调可能与结肠黏膜代谢重编程相关,而CDH1的异常表达可能通过影响上皮-间质转化(EMT)加剧气道病理重塑。

图3 十种最常见儿科疾病中的差异蛋白表达

通过PCA-N血浆分析进一步发现67个新的差异蛋白,如参与肠道液体平衡调控的鸟苷蛋白(GUCA2A)和反映胰腺功能障碍的糖蛋白2(GP2)。相比之下,肾上腺生殖器综合征患者尿液中出现显著上调的结合珠蛋白(HP)和F-肌动蛋白帽化蛋白α-2亚基(CAPZA2),可能与氧化应激和雄激素诱导的细胞骨架重塑有关。


图4 基于SNOMED CT的疾病聚类及其蛋白质组谱分析

这项研究的重要意义在于建立了一个可推广的分析框架,将临床本体论与深度分子 profiling 相结合,为罕见疾病研究提供了新范式。通过语义网络聚类,即使是单一患者的罕见病也能通过生物学相关疾病群的聚合获得统计效力。多体液分析策略(尿液和血浆)提供了系统性和局部组织特异性的互补视角,而PCA-N去富集技术则显著扩展了血浆蛋白质组的覆盖范围。这些方法不仅适用于蛋白质组学,也可拓展至其他组学数据整合。从临床转化角度看,该框架与电子健康记录系统共享SNOMED CT本体结构,有利于促进分子发现向临床实践的转化。尽管存在某些罕见病在SNOMED CT中表征不足等局限性,但这项工作为理解罕见疾病的共享生物学机制开辟了新途径,推动儿科精准医学向数据驱动的网络医学范式转变。

原始出处:

Itang ECM, Albrecht V, Schebesta A-S, et al. Ontology-guided clustering enables proteomic analysis of rare pediatric disorders. EMBO Mol Med. 2025;17(7):1842-1867. https://doi.org/10.1038/s44321-025-00253-z

Tags: EMBO Molecular Medicine:基于本体指导的聚类方法实现罕见儿科疾病的蛋白质组学分析  

搜索
网站分类
标签列表