首页 > 医疗资讯/ 正文
基于第二代测序技术的RNA测序(RNA-seq)技术已被广泛用于各种转录组研究,但其测序的序列长度较短,大多只能覆盖转录本的一小部分,导致序列难以精确映射到同源异构体(isoform),使得RNA测序很难用于分析全长转录本。
长读长测序(Long-read sequencing)是Nature Methods评选出的2022年度技术,其主要优势是测序长度远大于二代测序平台。基于HiFi测序的PacBio RNA测序平台Iso-seq可以产生长而准确的序列。Iso-seq的准确性达到99.9%,N50读长约为2500bp,远长于平均转录本长度(约1300bp),为全长转录组分析提供了理想的技术平台。目前,科研人员已经开发了一些长读长测序数据的计算工具,但在剪切位点预测、转录本定量分析、基因融合探测等方面仍有很多计算问题需要解决,亟需发展更准确、系统的长读长转录组数据分析工具,以充分利用长读长测序技术的优势,推动转录组学研究的进步。
近日,北京大学数学科学学院的席瑞斌团队和哈尔滨医科大学附属肿瘤医院苗素生团队在Nature Communications上发表了题为“TAGET: A toolkit for analyzing full-length transcripts from long-read sequencing”的文章。研究团队提出了一个名为TAGET(Toolkit for Analyzing full-length GEne Transcripts)的综合性计算工具包,用来分析Iso-seq全长转录组数据,包括转录本的映射和注释、基因融合的检测、差异表达分析以及差异同源异构体使用(DIU)分析。通过实验验证和与RNA-seq数据的比较,研究团队发现TAGET比其它工具更准确地检测新剪切位点、同源异构体和基因融合。这项研究进一步完善了三代测序Iso-seq数据的分析流程,帮助研究人员更方便、更准确地进行全长转录组分析。

文章发表在Nature Communications
TAGET使用经过处理(polished)的转录本作为全长转录组分析的输入。根据Iso-seq数据的分析流程,TAGET只考虑由至少两个循环一致序列(CCS)支持的转录本。在映射阶段,TAGET整合了长读段映射方法和短读段映射方法的结果,并利用卷积神经网络(CNN)来提高剪切位点的预测准确性(图1b)。在得到映射结果后,TAGET将转录本注释为七大类,包括:FSM (Full Splice Match),ISM (Incomplete Splice Match),NIC (Novel in Catalog),NNC (Novel Not in Catalog),Genic,Intergenic和Fusion。随后,TAGET进行后续的基因融合检测和差异表达分析等(图1a)。

图1. TAGET工作流程
研究团队使用了来自公开的癌细胞系COLO829的数据集以及新测得的七对肿瘤和正常组织匹配的数据集来评估TAGET的算法表现。这七对新测得的数据中,有三对(LGC-133、LGC-415、LGC-265)来自喉癌(LGC)患者,另外三对(LUSC-07、LUSC-25、LUSC-39)来自肺鳞状细胞癌(LUSC)患者,还有一对来自骨肉瘤(OS)患者。对于OS患者的癌症和正常组织,分别进行了两次重复测序(OS-1和OS-2)。
研究团队首先比较了TAGET和长读段映射方法(minimap2、GMAP)的映射准确性。结果显示,TAGET预测的剪切位点相比minimap2和GMAP有更高的比例与Ensemble数据库中的剪切位点相匹配(图2a)。通过与RNA-seq数据的短序列数据和参考基因组进行比较,研究团队发现TAGET预测的剪切位点中有99.3%能够得到至少两个短读段或参考数据库的支持,略高于minimap2和GMAP(图2b)。对于Ensemble数据库中没有的新剪切位点,TAGET的预测结果中有75.2%能够得到至少两个短读段的支持,远高于 minimap2和GMAP的结果(图2c)。不使用CNN模型的TAGET预测的新剪切位点中大约有60%可以被RNA-seq支持(图2c),低于TAGET给出的预测结果,说明CNN模型的有效性(图2d)。
研究团队发现TAGET和SQANTI在转录本注释的结果上比较相似(图2e),其中注释差异较大的类别主要涉及Genic、FSM和ISM,这主要是因为TAGET和SQANTI对这些转录本类别的定义不同。在TAGET报告的新剪切位点中,有82.3%是典型的,远高于SQANTI(图2f)。Motif分析还证实了GT和AG分别在5'供体剪切位点和3'受体剪切位点上富集(图2g)。

图2. TAGET映射和注释的性能评估
接下来,研究团队对TAGET的基因融合检测效果进行了分析,发现TAGET报告的基因融合比SQANTI和JAFFAL多(图3a),并且有更高比例的基因融合得到了至少2个RNA-seq序列的支持(图3b)。研究团队也通过模拟数据集证明了TAGET在灵敏度和精确度方面表现最佳(图3e)。

图3.检测基因融合
最后,研究团队使用GM12878细胞系的样本以及肺癌细胞系的23个样本来展示TAGET在牛津纳米孔技术(ONT)数据上的兼容性(图4)。

图4.TAGET在ONT数据集上的性能
综上所述,研究团队开发了一个可应用于全长转录组研究的多功能计算工具包TAGET,期望TAGET未来能在三代测序数据分析中发挥更重要的作用。
夏禹超、金子捷、张成胜、欧阳林坤是该研究的共同第一作者。该研究得到了国家重点研发计划、国家自然科学基金、黑龙江省博士后科研发展基金、北京信息科技大学基金、中国博士后科学基金、中俄数学中心的支持。
文章链接:
https://www.nature.com/articles/s41467-023-41649-0
- 搜索
-
- 1000℃Cell | 曾泽贤/潘登/冯驭团队开发SPAC-seq新技术,实现空间分辨率下高通量CRISPR筛选
- 1000℃福建师范大学ACS Nano:人工智能驱动的Janus敷料用于可视化伤口诊疗
- 1000℃中科院苏州纳米所ACS Nano综述:通过可穿戴AI接口学习人类-环境交互
- 1000℃Cancer Discov | 新型AI基础模型可根据基因型精准预测癌症治疗反应,涵盖10种实体瘤超3万个肿瘤基因组数据
- 1000℃新加坡国立大学/复旦大学《自然·通讯》:抗氧化脂质纳米颗粒增强mRNA稳定性用于再生治疗和基因编辑
- 1000℃489例疑似罕见遗传病患者进行全外显子测序WES:确诊率达53%,5.5%检出心血管或肿瘤相关基因变异
- 1000℃Nat Cancer | 基于组织病理学图像的AI模型可快速识别102种CNS肿瘤亚型,表现优于神经病理学家
- 1000℃国立清华大学《自然·通讯》:工程化人类PEG10纳米颗粒实现RNA自包装、递送与癌症治疗
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)