首页 > 医疗资讯/ 正文
在过去的二十年里,参考人类基因组序列一直作为遗传和生物医学研究及应用的基础,但广泛共识认为没有单一的参考序列能够代表全球人群的基因组多样性。
根据研究数据显示,仅有47个样本构建的人类全基因组参考(HPRC)在东亚人群样本的代表性较低,其中仅有3个南方汉族样本被包含在HPRC参考中,对于中国这样一个拥有14.4亿人口、众多民族群体的地区来说,代表性不足。此前的研究还表明,亚洲的遗传多样性在1000人基因组计划等大型国际合作项目中得到的覆盖较少。
基于此,26家科研机构包括复旦大学、西安交通大学和中国医学科学院等,共同组成了中国人群泛基因组联盟(CPC)。通过联合努力,研究团队成功测序了36个中国少数民族和汉族样本,并构建了116个高质量的基因组组装。
该成果以"A pangenome reference of 36 Chinese populations"为题,于2023年6月14日发表在Nature杂志上,第一通讯作者为中国科学院特聘研究员徐书华。

【多样性中国基因组的组装】
研究团队介绍了中国全基因组联合研究计划的第一阶段数据,其中包括116个高质量和单倍型相位化的全新组装序列,基于代表36个中国少数民族群体的58个核心样本。
这些中国全基因组联合研究计划的核心组装序列具有平均30.65倍高保真长读长测序覆盖度,平均连续性N50超过35.63兆碱基,并且平均总大小为3.01吉字节。这些核心组装序列为GRCh38参考基因组添加了1.89亿碱基对的有色体多态序列和1,367个蛋白编码基因复制。

图1 CPC小组使用58个核心样本的二倍体组装得到了CPC面板
【CPC组装序列的基因组特征】
研究团队使用Phased Assembly Variant caller对116个组装体与T2T-CHM13进行比对,并对每个样本进行变异调用。根据插入频率,确定了115个基因组区域作为插入热点,总长度为204.8Mb。
然后,研究团队对每个组装体相对于GRCh38参考基因组进行了拷贝数变异(CNVs)的注释。在所有组装体中,共有1,367个蛋白编码基因在至少一个基因组中拷贝数增加。每个组装体平均观察到53个(27-100个)具有拷贝数增加的基因,其中13.39%的CNV基因在整个CPC组装体集中的频率超过5%,而57.86%的CNV基因仅在单个单倍体中发现。
研究团队发现CPC组装体集中有1,079个重复基因,在HPRC组装体中没有观察到。在CPC组装体集中发现的562个(52.1%)新重复基因根据全基因组关联研究(GWAS)目录与特征相关联,其中207个(19.2%)与至少一种由疾病本体注释的人类疾病相关联,这表明CPC组装体集在疾病和表型关联研究中具有显著的潜力。

图2从CPC组装中识别出了拷贝数变异
【CPC全基因组的变异】
研究团队使用Minigraph-Cactus流程构建了CPC泛基因组的变异图谱,其中单倍型组装体可以表示为由序列节点组成的不同路径。
此外,他们发现在所有单倍型中,有4.96Mb的非参考序列出现在≥95%的单倍型中,代表了样本群体的核心基因组,还有72.24Mb的非参考序列出现在≥5%且<95%的单倍型中,代表了共有的基因组。

图3 将CPC 泛基因组图与HPRC组装进行比较,分析了CPC特有变异和CPC特定变异
【使用CPC参考进行短读映射】
为了进行变异调用,研究团队将图谱参考坐标中的GAM文件与线性参考坐标中的BAM文件进行了映射。结果显示,所有样本的映射率平均下降了0.58%(0.54-0.61%)。于是推测,当使用传统的线性参考进行调用或记录变异时,图谱参考的优势会丧失,因为图谱参考中的新序列在线性坐标中是缺失的。

表1 比较了HPRC图谱参考和CPC图谱参考的大小,包括用于短读映射的原始图和简化图
【与人类全基因组参考联合研究计划(HPRC)全基因组图的比较】
研究团队还鉴定了1590万个小变异和78,072个结构变异,其中590万个小变异和34,223个结构变异在最近发布的全基因组参考序列中尚未报告。

图4 在CPC 泛基因组图中可视化了新颖和复杂的结构变异。
【古代基因渗入和注释】
中国全基因组联合研究计划的数据显示,当从代表少数民族群体的人中获取数据时,可以显著增加对新颖序列和缺失序列的发现。这些缺失的参考序列富集了古代遗传位点的等位基因和与角化、对紫外线辐射的响应、DNA修复、免疫反应和寿命相关的基因,因此对于揭示人类进化以及在复杂疾病遗传性研究中找回缺失遗传性具有重要意义。

图5 比较了CPC中检测到的旧石器时代基因渗入片段的总长度与HPRC中的长度。

图6 比较了CPC研究中东亚人群的旧石器时代基因渗入片段的累计长度。
【研究意义】
徐书华的团队在基因组学领域取得了重要的突破,并通过前沿的技术和分析手段研究了亚洲人群的遗传演化历史。他们的工作不仅关注中国人群,还涵盖了周边国家和地区的人群。通过深入研究这些人群的遗传背景和基因组多样性形成机制,他们希望能够揭示人类族群的演化历史以及遗传变异对人类基因组序列功能和表型意义的影响。
这种群体基因组学的研究不仅帮助我们了解人类的起源和演化过程,还对现实的人类健康具有重要的参考意义。通过回溯族群的“基因史”,我们能更好地理解复杂的遗传疾病,并为精准医学的发展奠定群体遗传学基础。未来,随着大数据的积累和精准医学的发展,我们有望实现更加个性化和精确的医疗,根据不同人群的基因组差异来制定个性化的治疗方案。
参考文献:
1.https://doi.org/10.1101/2022.07.09.499321
2.https://www.science.org/doi/10.1126/science.1177074
3.https://doi.org/10.3389/fgene.2013.00127
原文链接:
https://www.nature.com/articles/s41586-023-06173-7
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)