首页 > 医疗资讯/ 正文
基因组结构变异(SV)与生物性状进化和严重疾病表型密切相关,近年来,长读长测序技术(LRS)的快速发展促进了SV的检测,包括简单SV(SSV)和复杂SV(CSV)。特别地,新发(de novo)SV和体细胞SV是孟德尔疾病和癌症发生的主要原因,人们通常使用调用集合并策略(callset-merge)和read推断策略(例如nanomonsv)进行样本间基因组SV差异鉴定,但这些方法假阳性较高、应用局限性较大,检测时易出现、误报(尤其是CSV)。
2022年,西安交通大学叶凯教授团队开发了基于深度学习的多目标识别框架SVision,能够自动从长读长测序序列数据中检测和表征CSV。SVision可直接检测CSV,而不用匹配已知结构,灵敏地检测常见和以前未表征的复杂重排。虽然有了较大的进展,但目前基于深度学习的图像模式测序在SV比较发现的应用中仍受限,主要问题包括无法表征基因组间差异和需要同时检测基因组间SV和基因分型。
近日,叶凯教授团队在Nature Biotechnology发表了题为“De novo and somatic structural variant discovery with SVision-pro”的最新研究,展示了其在新生和体细胞SV鉴定方法方面取得的突破性进展。叶凯教授团队开发了SVision-pro,这是一种基于神经网络的实例分割框架,能够直观地表示基因组到基因组水平的测序差异,并在无需任何推断模型的条件下比较地发现基因组之间的SV。经评估,SVision-pro性能优于目前最先进的方法,与SV合并方法相比,其具有较低的孟德尔错误率,低频SV灵敏度高且假阳性率降低,可提高CSV的分辨率。

文章发表在Nature Biotechnology
多种遗传病和癌症的变异研究需要在多个样本之间进行基因组变异差异比较,相较与领域内常用的“先检测再求差”的分步式策略,叶凯教授团队提出了基于“序列-图像”转换策略的多样本差异比较算法SVision-pro,将SV的检测和分型问题从序列问题统一转化为图像空间的变异实例分割问题。
SVision-pro包括两个关键模块:序列-图像表示模块将两个样本的基因组特征编码在一张图像中,神经网络识别模块从中比较识别SV及其基因组间差异(图1)。SVision-pro集成了SV检测和基因组之间的基因分型,作为一个一站式的基于神经网络的图像实例分割任务,促进了新发及体细胞SSV、CSV的发现。
序列-图像表示模块首先将LRS数据中识别出的异常基因组位点作为输入,并将每个read结果总结为一系列符号,这些一维(1D)符号序列直接从read比对结果中获得,无需任何面向sv类型的预处理;随后,将上述符号迭代聚集在一起作为候选异常基因位点,该过程无需匹配已知的SV类型,确保了SV位点的全面捕获,特别是对于未开发的CSV。
接下来,序列-图像表示模块在结构草图(structure sketching)、内容渲染(content rendering)两个步骤中比较两个基因组(病例基因组及对照基因组)。结构草图步骤将1D read符号序列转换为2D相似性图像,内容渲染步骤用增强覆盖轨迹(ACT)填充稀疏图像区域,ACT表示病例和对照基因组之间的基因组差异。这种表示策略有助于基因组间的比较,同时编码SV结构及其基因组间差异。
神经网络识别模块将上述任务集成到一个基于多任务神经网络的图像实例分割框架中,对基因组中的SV进行分类和比较。该框架接收编码图像并生成像素级分割掩码,将图像区域分类为五个基本SV成分(component)类型、一个野生型参考(REF)和背景,SV类型是通过将病例和对照轨迹中的成分连接在一起直接预测的。此外,该框架还可以对病例和对照基因组之间的SV成分类型、断点和等位基因频率(AF)进行三任务比较。除了广泛使用的来自AF的基因分型标签,SVision-pro通过对比病例基因组与对照基因组中的SV成分,生成了四个不同的类型,即Germline、New component、New breakpoint和New alleles。综上,SVision-pro可为不同的灵敏度要求提供灵活的图像属性,目前最低检测AFs为0.01。
为确定合适的实例分割模型,研究团队在模拟数据上训练、比较了五个不同参数大小的模型,包括Unet、全卷积网络、Deeplabv3、Lite-Unet和mini-Unet(图1c)。最终,Lite-Unet在精度和模型大小之间实现了平衡,同时表现出很强的模型可解释性。

图1. SVision pro概述
研究团队使用模拟和公开可用的数据集对SVision-pro和其他方法的性能进行基准测试,包括HiFi、ONT和CLR。结果显示,SVision-pro在HG002真实SSV和模拟CSV上表现优于其他方法,在CSV子组件准确性方面达到96%-98%,与SVision相比平均提高了15%。进一步的实验证明,SVision-pro对CSV检测具有高灵敏度和低假阳性率。
在六个家系中,研究团队将SVision-pro与调用集合并策略(Sniffles2、SVision等)进行了比较(图2a)。结果显示,SVision-pro对六个家系进行了正确的基因分型,并在同卵双胞胎之间实现了最高的孟德尔一致性(HiFi read 99.3-98.4%,ONT read 94.5%-97.6%)和最低的不一致性(0.7%),优于其他方法。SVision-pro的高基因分型准确性还促进了孟德尔样本的可发现,特别地,其分型了包含两个SV等位基因的复杂基因位点:SSV(插入)和CSV(插入-删除)。
与其他模型相比,SVision-pro报告了26个新发SV,包括13个插入和13个缺失,所有这些SV都经过手动验证。上述结果表明,SVision-pro有效减少了孟德尔样本中的假阳性调用,并报告了高质量的新发SV。
研究团队使用正常-肿瘤配对细胞系HCC1395和HCC1395BL,通过三种测序技术(包括HiFi、ONT和CLR)评估了SVision-pro。SVision-pro检测到87%-90%已发表的体细胞SSV位点,Sniffles2检测到66-81%,nanomonsv检测到6%-29%(图2f)。使用Vapor28对检测到的体细胞调用进行验证发现,与Sniffles2(9.8%-40.3%)相比,SVision-pro的假阳性率更低(4.3%-8.7%)(图2g)。这些结果表明,SVision-pro在检测体细胞SV方面具有更高的灵敏度和更低的假阳性率。
最后,SVisionpro解析了先前被报告为SSV的8个CSV,并鉴定了一个非体细胞复杂基因位点,该基因位点先前被报道为体细胞SSV。

图2.性能比较
综上所述,SVisionpro是一种准确且可解释的方法,用于比较SV检测和基因分型;通过直观比较测序比对中编码的基因组特征,避免了调用集级策略容易出错的合并过程,产生高质量调用。SVisionpro实现了高精确性、低假阳性的新发SV和体细胞SV的精准识别,为后续从大规模专病队列数据、临床诊断数据中发现关键致病SV提供了关键技术支撑,并为基于“人工智能+” 的生物序列大数据计算框架提供了新思路。
猜你喜欢
- 孩子神经发育关键营养素告急!Nutrients:美国妈妈 EPA/DHA 摄入仅135毫克/日,有早产史者再降 24mg,远不够推荐量
- 孕期吃坚果孩子或许更聪明
- 2022年07月13日每日养生小知识健康简报,星期三!健康是一种生活态度!
- 鼻子容易长痘应该如何恢复
- 冬季吃什么皮肤不干燥 冬季吃什么水果皮肤不干燥
- Cancer Res:复旦大学李辉等团队合作研究发现激活ACE2轴可以克服HCC的免疫抑制微环境
- “绘”解读真报告丨U2AF1突变实例印证!为啥肺癌患者有必要扩大基因检测范围?
- 纳米脉冲变身利刃 肿瘤微创治疗有了新武器
- United European Gastroenterol J:肝硬化患者经颈静脉肝内门体分流术后舒张功能不全与心功能失代偿相关
- Int J Mol Sci:干眼症:维生素D是否能起到缓解和治疗作用?
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)