首页 > 疾病防控/ 正文
深度解析医学证据,lxfs.net为你支撑决策
罕见病种类多且症状复杂,患者常面临误诊或延迟诊断的问题。近年来,基因测序的快速发展为疾病研究带来了明显的效率提升,全基因组测序(WGS)已被证明在许多罕见病患者的诊断中具有关键作用。但基因测序的临床应用涉及繁杂的文献分析和数据解读,仍是限制其广泛应用的主要瓶颈。
近日,香港基因组研究院团队在Science Translational Medicine发表研究“AI-CURA, an automated LLM workflow for high-accuracy genetic variant classification”。研究团队开发了一种基于大型语言模型(LLM)的完全自动化基因变异分类框架AI-CURA,能够同时处理不依赖文献证据和依赖文献证据的数据,以简化罕见病的诊断流程。在遵循专家指南的前提下,AI-CURA框架能够在极短时间内,以与人类专家同等的准确性对150种变异进行分类,并能对150个分类不明确的变异进行分类。该研究拓展了全自动变异解读的边界,为AI-CURA在更多临床变异中的应用提供了支持。

WGS能识别出大量基因变异,依据美国遗传与基因组学院(ACMG)/分子病理学会(AMP)发布的指南和临床基因组资源库(ClinGen)的建议,可将变异相关证据划分为不同类别。虽然部分规则可轻松实现自动化处理,但大多数数据仍需人工解读文献资料。这要求变异库维护人员具备分子生物学与遗传学各领域的广泛知识,并深刻理解专家建议,以准确解读和评估变异特征。
基于这一需求,研究团队将针对非文献依据标准的证据评估(可利用标准生物信息学工具实现自动化)与独立的、由LLM支持的文献依据证据评估相结合,建立了自动化的变异分类框架AI-CURA完成这一复杂判定。AI-CURA整合了LLM,将基因组数据与不断更新的知识库绑定,能够同时处理不依赖文献证据和依赖文献证据的数据,提高了变异分类效率和一致性。
ACMG/AMP发布的指南将变异分类细分为20条证据规则,约35%依赖文献证据解释。AI-CURA可分为规则引擎层和 LLM 推理层。其中规则引擎层自动执行13条无需文献的ACMG规则(占65%);LLM推理层处理7条需文献支持的规则。同时,ClinGen推荐、已知基因/表型关联信息也被整合进数据库。此外,研究人员还利用Claude-4.0-Sonnet将文献中的家系图、复杂表格转换为文本,弥补了纯文本LLM无法解读图形证据的短板。

图1. AI-CURA框架设计。
为确定框架使用的LLM,研究人员分析了两种最先进的LLM(DeepSeek-R1和o3-mini-high)在总结与变异分类相关的文献证据方面的能力。结果显示,在解读ACMG制定的规则时,两款模型的特异性均达到100%,DeepSeek-R1的灵敏度优于o3-minihigh,几乎涵盖所有文献支持证据,且没有引入错误判定。总体而言,DeepSeek的综合表现更优异,且具有透明分步推理、开源可本地部署的优势。
随后,研究使用由ClinGen专家筛选的150个变异对AI-CURA进行了验证。结果显示,DeepSeek-R1在判定7条文献依赖型ACMG规则的应用时展现出极高的准确率(89.3%至100%),与ClinGen专家表现出高度一致性。DeepSeek-R1的ACMG规则应用完全一致率为89.3%,最终分类一致率为96.0%;临床等效标准的诊断一致率高达99.3%。

图2.AI-CURA对ClinGen变异的分类验证。
对于来自ClinGen中分类不明确的150个变异(93 个分类不明确+57个VUS),DeepSeek-R1为70%(105个)变异完成明确分类,最终分类与人工解读的一致率达98.7%;75.3%(70个)不明确变异升级为致病/可能致病,50.9%(29个)VUS升级为P/LP。以上结果表明,AI-CURA可有效改善不明确变异的分类,有助于提升未确诊病例的诊断率。
此外,香港基因组研究院团队开展了香港基因组计划(HKGP),通常每位患者需花费约4小时进行WGS数据整理,其中大部分时间用于文献检索,高效解读数以万计的基因变异成为难点。研究团队利用LLM显著简化了变异分析与解读流程,可在数分钟内完成文献证据的汇总。
近年来,LLM在医疗研究领域已展开了诸多应用研究,在优化临床决策、提升医疗系统的整体智能化升级方面有着重要作用,其推理能力和透明度的提升也有助于优化临床工作流程设计。但LLM在临床遗传学领域,尤其是罕见病诊断方面的潜力仍待深入探索。该研究开发的AI-CURA框架能够几乎完全自动化地按照ACMG/AMP指南以及ClinGen建议对基因变异进行分类,其在基因变异的分类准确性方面表现与人类专家相当,并能对分类不明确的变异进行重新分类。AI-CURA实现了遗传病诊断及变异再分析中的自动化变异分类,拓展了全自动变异解读的边界,为基因组诊断流程提供了新范式,也体现了基因测序数据的持续价值。
原文信息:
WEI MA, GRACE FONG, JOE LAI, et al. AI-CURA, an automated LLM workflow for high-accuracy genetic variant classification · Sci. Transl. Med. 18, eadz4172(2026)· DOI: 10.1126/scitranslmed.adz4172
小提示:本篇资讯仅在梅斯医学APP中开放阅读,请扫描二维码直接下载APP