首页 > 医院动态/ 正文

Nat Commun | 王凯团队发表端到端、跨平台长读长单细胞转录组分析工具SCOTCH,精准解码异构体

来源 2026-05-15 11:24:46 医院动态

深度解析医学证据,DeepEvidence为你支撑决策

长读长单细胞转录组测序(lr-scRNA-Seq)能够实现单细胞分辨率下的全长异构体分析,以更精细地呈现细胞内的转录组图谱,为理解细胞功能及疾病机制提供了重要信息。lr-scRNA-Seq需要专门的计算解决方案,但目前已有的分析工具仍不尽如人意,在新型异构体重建模糊读段映射、操作简便性、平台兼容等方面面临不同的挑战,无法全面理解转录组的复杂性。

为充分发挥lr-scRNA-Seq的优势并克服上述局限性,美国费城儿童医院王凯团队推出了一款端到端、跨平台单细胞转录组分析工具SCOTCH。该方法可自动化分析lr-scRNA-Seq数据中的异构体特征,兼容NanoporePacBio测序技术以及10X GenomicsParse Biosciences的建库方案。SCOTCH将异构体建模为非重叠亚外显子组合,并采用动态阈值法实现可靠的异构体分配,同时高效解决映射问题。经大量模拟研究证实,SCOTCH在已知及新型异构体的注释与定量分析方面性能优异,并能有效应对基因重叠和嵌合读段等复杂比对挑战。该研究已发表在Nature Communications上,文章题为“SCOTCH: isoform-level characterization of gene expression through long-read single-cell RNA sequencing”。

图片

SCOTCH专门为lr-scRNA-seq数据分析设计,其预处理流程能够处理结合NanoporePacBio长读长测序技术、由10X GenomicsParse Biosciences方案生成的单细胞文库(图1a)。据悉,SCOTCH针对其他文库生成方案也在研发中。

具体而言,SCOTCH是将异构体建模为非重叠亚外显子组合(图1b-c)。通过整合读段覆盖度与现有注释数据来优化亚外显子边界,并采用Louvain聚类算法将读段归类为连贯的候选转录本结构,再进行迭代重比对,SCOTCH有效解决了基于剪接图谱方法中常见的片段化问题,降低转录本模型冗余,能够更可靠地识别更多的真实新异构体;其多聚腺苷酸(poly(A))感知过滤功能进一步降低了假阳性结构的检出率。此外,SCOTCH采用了读段特异性动态阈值策略,通过整合读段比对得分来区分来自重叠基因和嵌合转录本的多重比对读段,从而增强对测序和比对噪声的鲁棒性,并确保在最小化读段丢失的前提下实现准确的异构体定量分析。

图片

1.SCOTCH工作流程。

研究人员利用10X GenomicsParse文库、IlluminaNanopore测序技术,为两份人外周血单核细胞(PBMC)样本生成了大量评估数据,以验证SCOTCH的性能。结果显示,R10流动池的应用无需依赖配对短读长或复杂的计算方法即可实现异构体水平分析。这一结论通过多项关键对比得以验证,包括不同单细胞文库与测序技术组合(10X+IlluminaParse+Illumina10X+Nanopore_R910X+ Nanopore_R10Parse+Nanopore _R10)。结果显示,与R9流动池相比,R10流动池通过过滤器的读段数量更多,平均Q值更高,且更接近短读长测序的结果(图2a)。R10流动池还显示出更高比例的全长读段、全标签读段、基因标签读段和转录本标签读段(图2b),表明其测序质量更优,能更可靠的识别转录本,能捕获更全面的转录组图谱。

图片

2.5种测序组合对下游分析的影响。

此外,研究人员利用两个不同的细胞群体模拟真实的Nanopore单细胞RNA测序数据,评估了SCOTCH和其他方法在转录本特征识别与定量分析以及支持下游转录组分析方面的性能。研究显示,大多数其它方法均存在大量模糊比对读段相比之下,SCOTCH(默认增强注释模式)和SCOTCH.ao(仅注释模式)实现了最高比例的唯一比对读段且模糊度极低,展现出处理模糊比对的独特优势。已知与新型异构体的读段-异构体比对中,SCOTCH的准确率达0.876,与IsoQuant0.878)相当;SCOTCH.ao准确率达0.793,显著优于flames0.461)和Bambu0.163)等工具。

SCOTCH在检测新型异构体方面具有更高的灵敏度和准确性。其它方法仅识别出有限数量的真实新异构体,SCOTCH识别出1794个新型异构体,回收了显著更高的真实新型转录本比例,超越所有其他方法,且这种灵敏度的提升并未影响注释质量。进一步定量分析显示,SCOTCH能有效准确捕获转录本使用信号,在转录本水平分析中具有较高的稳健性。

图片

3.SCOTCH性能进行评估的模拟研究。

在完成模拟研究后,研究团队分别使用SCOTCHSCOTCH.aoIsoQuantwf单细胞分析流程对两个采用不同单细胞文库和测序方案处理的人类PBMC样本进行了分析(图4)。结果显示,这些模式在两个样本中均具可重复性,充分证明了在基因水平和转录本层面,SCOTCH在不同测序技术、文库制备方法和分析方法中对细胞类型鉴定的可靠性。

图片

4.SCOTCH与各种技术平台和流程的一致性和可重复性分析。

仅依赖基因表达比较可能忽略由转录本变异引发的重要生物学信号,因此研究人员验证了SCOTCH揭示转录本水平变化的能力。分析发现,SCOTCH能够有效揭示转录组变异,即使基因表达水平未显示显著变化。例如,SCOTCH鉴定出一种在两个PBMC样本的所有五种细胞类型中均表达的EIF6新异构体。PCR结果证实该新型异构体不仅存在于两个PBMC样本中,也存在于K562细胞系中。这进一步证实了SCOTCH在识别和注释新型异构体方面的可靠性。此外,在七个人类脑类器官样本(采用10X-PacBio测序方案)中,SCOTCH揭示了人类脑类器官中细胞类型特异性的转录本使用模式,实现了更精确的细胞类型注释。

综上,研究团队提出的lr-scRNA-seq数据处理与分析工具SCOTCH,整合了多项创新设计要素,表现出极高的效能。SCOTCH兼容NanoporePacBio测序平台,支持10X GenomicsParse Biosciences单细胞文库,解决了lr-scRNA-seq数据分析中读段-异构体映射不确定问题、灵敏度与特异性的平衡问题、分析工具分散不统一问题,是适用于lr-scRNA-seq转录组分析的稳健且灵活的工具。SCOTCH为深入探究不同细胞类型中转录异构体的功能奠定了基础,有助于揭示细胞过程的复杂性。

此外,SCOTCH是首个公开支持Parse Biosciences平台数据的工具,其独特优势在于可同时对多个样本进行测序,无需额外的数据整合即可实现特定细胞群体的高效分析。

原文信息:

Xu, Z., Qu, HQ., Chan, J. et al. SCOTCH: isoform-level characterization of gene expression through long-read single-cell RNA sequencing. Nat Commun (2026). https://doi.org/10.1038/s41467-026-72665-5

阅读全文

Tags: Nat Commun | 王凯团队发表端到端、跨平台长读长单细胞转录组分析工具SCOTCH,精准解码异构体  

搜索
网站分类
标签列表