首页 > 医疗资讯/ 正文
目前的遗传关联研究越来越多地基于全基因组或全外显子组测序(WGS/WES)。与之前基于单核苷酸多态性(SNP)阵列的研究相比,WGS和WES数据可以识别罕见变异,系统地表征它们对各种性状和疾病的贡献。在这种情况下,稀有变异的单倍型定相(haplotype phasing)涉及将每条染色体的遗传区域分为来自父方或母方的单倍型,这对识别复合杂合事件至关重要。因为复合杂合性是非近亲结婚个体罕见隐性疾病最常见的遗传模型之一。
近期,来自瑞士洛桑大学的研究团队在Nature Genetics上发表研究文章“Accurate rare variant phasing of whole-genome and whole-exome sequencing data in the UK Biobank”。该研究报道了一种新的单倍型定相方法SHAPEIT5,可以在大型WGS/WES数据集中精确鉴定罕见变异。通过对英国生物银行(UKB)全基因组和全外显子组测序数据的分析,研究团队证明SHAPEIT5可以提高基因型插补的准确性。

文章发表在Nature Genetics上
SHAPEIT5单倍型定相方法概述
据文章介绍,SHAPEIT5使用三种不同的定相模型对WGS或WES数据进行单倍型定相(图1),每个定相模型侧重于不同类型的变异:(1)使用SHAPEIT4模型对常见变异进行定相;(2)利用插补模型,将罕见变异分阶段植入所产生的单倍型;(3)采用合并启发模型对单例变异进行分阶段分析。SHAPEIT5对每个罕见杂合基因型进行定相,以少量信息丰富的单倍型为条件(图1b)。对于单例变异(次要等位基因计数(MAC)为1),SHAPEIT5使用另一种定相模型,该模型假设单例变异是最近的突变事件,并利用单倍型之间的IBD(Identical By Descent)共享模式进行推断(图1c)。

图1. SHAPEIT5的基本原理。
评估SHAPEIT5在UKB数据中的性能
为了评估定相性能,研究人员使用了147754个WGS数据和447470个WES数据,这些数据里包含了部分家系信息。研究发现,SHAPEIT5和Beagle v.5之间存在细微差别(图2)。当仅考虑Axiom阵列位点时,使用SHAPEIT5具有较低的转换错误率(SER)。
为了获取更可靠的数据,研究人员对次要等位基因计数(MAC)bin内的SER进行分层,以关注罕见变异。根据变异频率将杂合基因型分配到不同的MAC bin,并在每个MAC bin中计算它们被正确定相的分数。结果显示,SHAPEIT5在WGS和WES数据集中具有比Beagle v.5.4更高的准确度以对罕见变异进行定相(图2)。

图2. SHAPEIT5在UKB数据中的分相性能。
SHAPEIT5可对LoF复合杂合子进行鉴定
当基因的两个拷贝都含有至少一种杂合变异时,被称为复合杂合突变。复合杂合性通常在LoF变异的背景下进行研究,预计这些变异会对基因产生高度有害的影响,相当于纯合基因敲除。研究人员在检测的17689个蛋白质编码基因中,发现2150个(12%)基因至少有一个个体具有两个或多个LoF变异。从这些基因中,研究发现549个(26%)基因与一个或多个具有复合杂合LoF变异的个体相关(图3a)。当仅考虑高置信度单倍型调用时,SHAPEIT5仍然识别出完整数据集中识别的80%基因和79%的复合杂合事件,表明这些主要依赖于高置信度单倍型调用。同时,研究发现,与具有两个或多个LoF变体的2150个基因相比,549个复合杂合基因在几个已知必需基因列表中高度缺失(图3b)。相反,复合杂合基因在非必需和纯合LoF耐受基因列表中丰富(图3c)。总体而言,SHAPEIT5对罕见变异的准确定相能够以高置信度筛选UKB队列中的复合杂合事件,揭示LoF复合杂合事件在必需基因中面临强大的选择压力,正如其高负面影响所预期的那样。

图3. 使用SHAPEIT5定相的UKB WES数据中的复合杂合子鉴定。
结语
研究团队推出了SHAPEIT5,这是一种用于大型测序数据集罕见变异的定相工具。对UKB等大型测序研究中的罕见变异定相有可能解锁许多应用和分析。首先,可以筛选其他类型的功能变体的复合杂合效应。其次,阶段信息可以包含在罕见变异负荷测试方法中,该方法通常只考虑两种单倍型的混合。第三,使用精确定相的参考组可以对来自同一群体的任何新测序基因组进行高精度的极其罕见的变体定相,甚至在某种程度上是单例。这有利于诊断由复合杂合效应引起的罕见和严重疾病,例如英格兰基因组学数据集,其中可以通过合并相位信息来提高诊断率。
参考资料:
Hofmeister, R.J., Ribeiro, D.M., Rubinacci, S. et al. Accurate rare variant phasing of whole-genome and whole-exome sequencing data in the UK Biobank. Nat Genet (2023). https://doi.org/10.1038/s41588-023-01415-w
- 上一篇:驱动压:有何危害?
- 下一篇:在泌尿外科上班最意外的事!患者下体存在真实花园
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)