首页 > 医疗资讯/ 正文
近日,上海交通大学生命科学技术学院余祥长聘教轨副教授课题组和上海辰山植物园杨俊、王红霞团队合作在国际知名期刊《Nature Communications》发表题为“Transfer learning enables identification of multiple types of RNA modifications using nanopore direct RNA sequencing”的研究论文。作者结合纳米孔RNA直接测序技术和深度学习方法开发了可同时检测多种类型RNA修饰的迁移学习模型TandemMod(图1)。上海交通大学生命科学技术学院博士后吴优为论文第一作者,上海交通大学生命科学技术学院余祥长聘教轨副教授、辰山植物园王红霞副研究员和杨俊研究员为该论文通讯作者。

图1. 基于纳米孔RNA直接测序数据搭建TandemMod深度学习框架的示意图。
自然界RNA中存在160种以上的修饰类型。近年的研究揭示mRNA上的m6A、m5C、m1A和Ψ等修饰具有重要的生物学功能。结合抗体捕获、化学突变和限制性酶切等方法的高通量测序技术被广泛用于对mRNA某一类型修饰位点的鉴定。然而,如何在同一条mRNA转录本中同时鉴定多种不同类型的修饰位点还存在巨大挑战。相较于二代测序技术,纳米孔RNA直接测序 (Direct RNA Sequencing, DRS)能够对带有polyA尾的全长mRNA进行直接测序,mRNA穿过纳米孔时产生的电信号差异可用于推断单条mRNA上每个碱基的类别及其修饰信息(图2)。因此,结合机器学习算法,理论上DRS可实现在单条mRNA水平、以单碱基分辨率检测多种不同类型的碱基修饰。但是,目前纳米孔的电信号特征与天然mRNA上的哪些修饰碱基相对应还缺乏准确的标签,这制约了在单分子水平检测多种类型的RNA修饰。

图2. RNA通过纳米孔时产生电信号信息的示意图。
该研究中作者创新性地利用带有T7启动子的水稻cDNA文库体外转录出了具备不同修饰标签的数千种mRNA转录本,加polyA尾后通过DRS创建了分别带有未修饰碱基、m6A修饰、m5C修饰和m1A修饰等精准标签的体外表观转录组 (IVET)数据集(图3)。在此基础上,作者以每5个碱基分配到的电信号及其统计特征作为输入,训练并搭建了一个具备1维卷积神经网络 (1D CNN)、双向长短时记忆(Bi-LSTM)和注意力机制(Attention)的TandemMod深度学习框架(图1)。

图3. 利用水稻cDNA文库体外转录带有m6A、m1A和m5C标签的转录本、并通过DRS创建体外表观转录组的示意图。
作者首先将TandemMod模型与目前基于DRS预测m6A和m5C的主流算法进行比较,验证了TandemMod模型在体外转录本及细胞体内转录本DRS数据中预测RNA修饰位点的优越性能(图4)。在正常人类细胞中检测到排名前五的基序中有4个是已知的DRACH,在m6A甲基化酶敲除的细胞中m6A修饰率显著下降。

图4. 在体外转录本DRS数据和人类细胞DRS数据中验证TandemMod检测m6A修饰位点的优越性能。
进一步,作者通过迁移学习将TandemMod用于检测mRNA中的m7G、 hm5C、 Ψ 和Inosine等多种类型的RNA修饰位点,揭示了迁移学习可在保证同等性能的条件下显著减少训练集数据量和模型训练时间等计算成本(图5)。最后,作者通过TandemMod绘制了水稻幼苗在高盐胁迫下m6A、m5C和Ψ的表观修饰图谱,并揭示了mRNA中m6A和m5C的共修饰及其在高盐环境下的修饰率变化(图6)。

图5. 迁移学习检测m7G, hm5C, Ψ 和Inosine等多种类型的RNA修饰位点的性能、数据量和训练时间评估。

图6. 通过TandemMod绘制高盐胁迫下水稻m6A、m5C和Ψ的表观转录修饰图谱,并揭示m6A和m5C的共修饰及其在高盐环境下的修饰率变化。
综上,作者创建的体外表观转录组 (IVET) 将为基于纳米孔RNA单分子测序鉴定RNA修饰的机器学习方法提供基准训练数据集,开发的可迁移深度学习模型TandemMod将为动植物和微生物体内多种类型的RNA修饰位点鉴定及表观转录组研究提供重要的技术支撑。同时TandemMod还可用于检测RNA疫苗等人工修饰的RNA。
该研究得到了国家自然科学基金、上海市浦江人才和上海市科技创新行动计划的支持。感谢上海辰山植物园研究平台在纳米孔测序的帮助以及上海交通大学超算平台提供的计算资源。
原文链接:
https://www.nature.com/articles/s41467-024-48437-4
- 搜索
-
- 1000℃Cell | 曾泽贤/潘登/冯驭团队开发SPAC-seq新技术,实现空间分辨率下高通量CRISPR筛选
- 1000℃福建师范大学ACS Nano:人工智能驱动的Janus敷料用于可视化伤口诊疗
- 1000℃中科院苏州纳米所ACS Nano综述:通过可穿戴AI接口学习人类-环境交互
- 1000℃Cancer Discov | 新型AI基础模型可根据基因型精准预测癌症治疗反应,涵盖10种实体瘤超3万个肿瘤基因组数据
- 1000℃新加坡国立大学/复旦大学《自然·通讯》:抗氧化脂质纳米颗粒增强mRNA稳定性用于再生治疗和基因编辑
- 1000℃489例疑似罕见遗传病患者进行全外显子测序WES:确诊率达53%,5.5%检出心血管或肿瘤相关基因变异
- 1000℃Nat Cancer | 基于组织病理学图像的AI模型可快速识别102种CNS肿瘤亚型,表现优于神经病理学家
- 1000℃国立清华大学《自然·通讯》:工程化人类PEG10纳米颗粒实现RNA自包装、递送与癌症治疗
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)