首页 > 疾病防控/ 正文

Sci Transl Med | 香港基因组研究院团队发表快速、高效的基因变异分类框架AI-CURA,拓展全自动变异解读的边界

来源 2026-07-05 18:47:42 疾病防控

深度解析医学证据,lxfs.net为你支撑决策

罕见病种类且症状复杂,患者常面临误诊或延迟诊断问题。近年来,基因测序的快速发展为疾病研究带来了明显的效率提升,全基因组测序(WGS)已被证明在许多罕见病患者的诊断具有关键作用基因测序的临床应用涉及繁杂的文献分析和数据解读仍是限制其广泛应用的主要瓶颈

近日,香港基因组研究院团队在Science Translational Medicine发表研究AI-CURA, an automated LLM workflow for high-accuracy genetic variant classification”。研究团队开发了一种基于大型语言模型(LLM的完全自动化基因变异分类框架AI-CURA能够同时处理不依赖文献证据和依赖文献证据的数据,以简化罕见病的诊断流程。在遵循专家指南的前提下,AI-CURA框架能够在极短时间内,以与人类专家同等的准确性对150种变异进行分类,并能对150个分类不明确的变异进行分类。该研究拓展了全自动变异解读的边界,为AI-CURA在更多临床变异中的应用提供了支持。

图片

WGS识别出大量基因变异,依据美国遗传与基因组学院(ACMG/分子病理学会(AMP)发布指南和临床基因组资源库ClinGen)的建议可将变异相关证据划分为不同类别。虽然部分规则可轻松实现自动化处理,但大多数数据仍需人工解读文献资料。这要求变异库维护人员具备分子生物学与遗传学各领域的广泛知识,并深刻理解专家建议,以准确解读和评估变异特征。

基于这一需求研究团队将针对非文献依据标准的证据评估(可利用标准生物信息学工具实现自动化)与独立的、由LLM支持的文献依据证据评估相结合,建立了自动化的变异分类框架AI-CURA完成这一复杂判定AI-CURA整合了LLM,将基因组数据与不断更新的知识库绑定,能够同时处理不依赖文献证据和依赖文献证据的数据提高了变异分类效率和一致性。

ACMG/AMP发布的指南将变异分类细分为20条证据规则,约35%依赖文献证据解释。AI-CURA分为规则引擎层和 LLM 推理层。其中规则引擎层自动执行13条无需文献的ACMG规则(占65%LLM推理层处理7条需文献支持的规则。同时,ClinGen推荐、已知基因/表型关联信息也被整合进数据库。此外,研究人员还利用Claude-4.0-Sonnet将文献中的家系图、复杂表格转换为文本,弥补纯文本LLM无法解读图形证据的短板。

图片

1. AI-CURA框架设计。

为确定框架使用的LLM研究人员分析了两种最先进的LLMDeepSeek-R1o3-mini-high在总结与变异分类相关的文献证据方面的能力。结果显示,在解读ACMG制定的规则时两款模型的特异性均达到100%DeepSeek-R1灵敏度优于o3-minihigh,几乎涵盖所有文献支持证据,且没有引入错误判定。总体而言,DeepSeek综合表现更优异,且具有透明分步推理、开源可本地部署的优势

随后,研究使用由ClinGen专家筛选的150个变异AI-CURA进行验证。结果显示,DeepSeek-R1在判定7条文献依赖型ACMG规则的应用时展现出极高的准确率(89.3%100%ClinGen专家表现出高度一致性。DeepSeek-R1ACMG规则应用完全一致率为89.3%,最终分类一致率96.0%;临床等效标准诊断一致率高达99.3%

图片

2.AI-CURAClinGen变异的分类验证。

对于来自ClinGen中分类不明确的150个变异93 个分类不明确+57VUS),DeepSeek-R170%105个)变异完成明确分类,最终分类与人工解读的一致率达98.7%75.3%70个)不明确变异升级为致病/可能致病50.9%29个)VUS升级为P/LP。以上结果表明,AI-CURA可有效改善不明确变异的分类,有助于提升未确诊病例的诊断率。

此外,香港基因组研究院团队开展了香港基因组计划(HKGP通常每位患者需花费约4小时进行WGS数据整理,其中大部分时间用于文献检索高效解读数以万计的基因变异成为难点。研究团队利用LLM显著简化了变异分析与解读流程可在数分钟内完成文献证据的汇总。

近年来,LLM在医疗研究领域已展开了诸多应用研究,在优化临床决策、提升医疗系统的整体智能化升级方面有着重要作用,其推理能力和透明度的提升也有助于优化临床工作流程设计。但LLM在临床遗传学领域,尤其是罕见病诊断方面的潜力仍待深入探索。该研究开发AI-CURA框架能够几乎完全自动化地按照ACMG/AMP指南以及ClinGen建议对基因变异进行分类,其在基因变异分类准确性方面表现与人类专家相当,并能对分类不明确的变异进行重新分类AI-CURA实现了遗传病诊断及变异再分析中的自动化变异分类拓展了全自动变异解读的边界,为基因组诊断流程提供了新范式,也体现了基因测序数据的持续价值。

原文信息:

WEI MA, GRACE FONG, JOE LAI, et al. AI-CURA, an automated LLM workflow for high-accuracy genetic variant classification · Sci. Transl. Med. 18, eadz4172(2026)· DOI: 10.1126/scitranslmed.adz4172

阅读全文

小提示:本篇资讯仅在梅斯医学APP中开放阅读,请扫描二维码直接下载APP

-->

Tags: Sci Transl Med | 香港基因组研究院团队发表快速、高效的基因变异分类框架AI-CURA,拓展全自动变异解读的边界  

搜索
网站分类
标签列表