首页 > 医疗资讯/ 正文
在过去几年中,长读长测序技术在通量和数据质量方面取得了显著进步,极大地促进了人们对人类基因组变异的理解。长读长测序能够读取重复和高GC含量的区域,对于生成真核生物多样性的参考基因组,以及绘制完整人类基因组端粒到端粒图谱至关重要。长读长测序的另一个优点是能够对难以或无法通过其他基因组测序方法识别的复杂结构变异(SV)和重复元件进行基因分型。
人类单细胞全基因组测序(WGS)已成为一个热点研究领域,有助于解答细胞生物学多个领域的基本问题。目前,单细胞WGS研究主要集中在表征短读长测序中可检测到的遗传变异,包括单核苷酸变异(SNV)等。虽然单细胞短读长全基因组测序有多种方法,但仍未有识别单细胞全部遗传变异的技术。
近期,瑞典乌普萨拉大学等多个机构的研究人员在Nature Communications发表了题为“Long-read whole-genome analysis of human single cells”的文章,提出了一种新的人类单细胞长读长全基因组分析方法。利用基于PacBio高保真(HiFi)测序平台的长读长测序,对人类单个CD8+ T细胞进行WGS分析,并通过多重置换扩增(MDA)获得足以进行长读长测序的DNA。结果表明,与短读长测序相比,长读长测序可提高单细胞遗传变异检测的性能,特别是检测单倍型、复杂结构变异和串联重复序列(TR);并证明从头重建部分人类T细胞基因组是可行的。

文章发表在Nature Communications
兼容短读长和长读长测序的单细胞WGS工作流程
研究团队利用单细胞全基因组扩增技术(WGA)与PacBio HiFi WGS相结合开发了基于液滴的MDA技术(dMDA),对CD8+ T细胞进行分析(图1)。该单细胞WGS的具体工作流程如下,通过流式细胞荧光分选技术(FACS)分离单细胞,并将其放入含有裂解缓冲液的孔中,以便裂解细胞并释放DNA片段。随后,将DNA分子封装在约50000个液滴中,在每个液滴内发生dMDA反应。在dMDA反应过程中形成分子间嵌合体的风险大大降低,在含有单个DNA片段的液滴中,这种风险被完全消除。因此dMDA方法能够保留分子长度并减少扩增偏差。dMDA反应完成后,扩增的DNA可用于制备短读长或长读长测序文库。
在该研究中,来自同一人类供体的两个单独的CD8+T细胞(A和B)在体外进行克隆扩增,所得细胞集合用作WGA和测序的起始材料,并使用Illumina和PacBio全基因组测序分析来自克隆A和B的单细胞。

图1. 单细胞DNA扩增和测序实验概述。
dMDA增加覆盖均匀性
研究团队使用Illumina WGS分析了来自T细胞克隆A和B的16个单细胞DNA样本,其中8个样本使用dMDA进行扩增,其余8个样本则进行标准MDA处理。测序结果显示,与8个MDA样本相比,8个dMDA样本显示出更均匀的覆盖范围。在MDA样本中,68.9%的reads与≥200×覆盖率区域匹配,dMDA样本中仅为16.0%。对于完整的单细胞数据集,研究团队进一步量化了全基因组的覆盖率变化,发现MDA的标准差是dMDA样本的2.46倍。综上,与常规MDA相比,dMDA提供了更高的测序覆盖率均匀性。

图2. MDA和dMDA用于全基因组扩增的比较。
单细胞长读长测序中SNV的检测
研究团队使用5个dMDA单细胞样本(2个来自T细胞克隆A,3个来自T细胞克隆B)进行PacBio长读长测序。结果显示,PacBio平台获得平均15.7Gb数据,Illumina平台获得48.7Gb数据。随后研究团队将该数据用于单细胞SNV调用,发现PacBio单细胞测序检测到的胚系SNV数量与Illumina相似。
进一步,研究团队估计了SNV调用的精确度和灵敏度。结果显示,PacBio单细胞SNV调用精确度高于Illumina dMDA,但灵敏度略低。在这些变异中,有6,336个位于先前报道的与人类健康相关的“暗”基因区域。值得注意的是,PacBio数据提供了数千碱基的相位信息,这使得将单细胞中检测到的变异分配给其中一种单倍型成为可能,凸显了长读长测序在单细胞水平上识别和分析体细胞变异的优势。

图3. 短读长和长读长测序单细胞数据中的SNV分析。
长读长单细胞WGS改进了SV的检测
研究团队使用Sniffles从PacBio数据中调用SV,发现平均每个单细胞有3,493个缺失、4,636个插入、903个重复和 19,373个倒位。由于微流控平台的缺陷,其中绝大多数SV可能源自嵌合dMDA分子。研究团队将样本间SV进行合并,以识别真正的SV,结果显示每个单细胞平均检测到5,473个真实SV,其中2510个缺失、2957个插入。
为进行比较,研究团队也对Illumina dMDA样本进行了SV分析(图4),平均检测到327个真实SV。PacBio测序检测的单细胞真实SV数量是Illumina的16倍多。PacBio检测的SV中,缺失和插入的精确度分别为0.73和0.66,其灵敏度略高于0.20;重复和倒位的精确度接近于零,表明几乎所有此类事件都源自嵌合分子。真正的PacBio SV主要由长达1kb的插入和删除组成,具有代表ALU重复元件的约300bp的清晰峰。
此外,研究团队发现在PacBio单细胞数据中检测到的一些SV在Illumina批量数据中很难被识别。PacBio数据不仅使人们能够确定这些SV在单细胞中的确切断点,还能够通过附近杂合SNV的定相来重建单倍型。

图4. 长读长单细胞数据中的SV分析。
单细胞中的TR分析
假设通过PacBio reads可研究单细胞中的TR,为证明上述观点,研究团队使用串联基因型进行TR调用(图6)。首先提取Pacbio批量数据中所有纯合或杂合的TR,共发现15,098个此类重复元件。在单细胞中,平均有4,770个TR等位基因可以被正确地进行基因分型,其重复序列大小与批量样本一致。其中,最长的重复序列比参考基因组长662bp,主要由二核苷酸AT序列组成,这是在短读长数据中难以解析的区域。

图5. 在单细胞长读数据中检测到的TR。
基于长读长数据的单细胞基因组从头组装
PacBio HiFi reads是生成高质量人类基因组组装的理想选择,为研究单细胞基因组的区域在多大程度上可以被重新构建,研究团队选择了克隆A和克隆B中覆盖率最高的两个单细胞(A1、B1),使用Hifiasm对其进行了单独的从头组装。结果显示,T细胞A1和B1分别生成598.3Mb和454.1Mb的初级片段;序列N50值分别为35kb 和42kb ,其中最大的序列N50值为578.3kb。
研究团队进一步分析了BUSCO基因模型,发现在T细胞A1中,12.8%的基因(n=1,762)被完全组装;在T细胞B1中,9.0%的基因(n=1,236)被完全组装。
结语
综上所述,研究团队通过将自动化单细胞处理和基于液滴的WGA方法与PacBio HiFi测序相结合,能够对单个人类T细胞的长DNA片段进行测序。与短读长测序技术相比,PacBio长读长测序使每个单细胞的基因组覆盖率高达40%,从而能够检测SNV、SV和TR以及人类基因组的“暗”区域。该研究共检测到28例体细胞SNV,5,473个高置信度SV。此外,单细胞从头组装产生了高达598Mb的基因组和1762(12.8%)个完整的基因模型。总之,与短读长测序技术相比,长读长测序改进了对遗传变异的分析,包括人类基因组的“暗”区域,甚至能够从头组装部分单细胞基因组,长读长测序在表征单细胞的全谱遗传变异方面的前景。
参考文献:
Hård, J., Mold, J. E., Eisfeldt, J., Tellgren-Roth, C., Häggqvist, S., Bunikis, I., ... & Ameur, A. (2023). Long-read whole-genome analysis of human single cells.Nature Communications, 14(1), 5164.
原文链接
https://www.nature.com/articles/s41467-023-40898-3
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)