首页 > 医疗资讯/ 正文
放射学鉴别诊断在临床医疗中起着至关重要的作用,对诊断和治疗决策有着深远的影响。要从影像检查结果中准确确定相关的鉴别诊断,需要具备高度专业的解剖学和病理生理学知识,同时还要熟练掌握视觉图像模式的识别能力,并能综合分析全面的临床信息。
最近的研究表明,大语言模型(LLMs)在根据病例呈现来进行放射学鉴别诊断方面具有日益显现的潜力。这些研究将大语言模型给出的诊断建议与专家评估或已确诊的诊断结果进行了比较。在最近的一项研究中,在 GPT-4 辅助下的放射科医生表现出诊断性能略有提升,且信心水平显著提高,但有 7.4% 的回复中存在 “幻觉”(即生成不符合事实的信息)现象。然而,在这种情况下,人类用户与大语言模型系统之间复杂的互动关系仍有待更详细地探究。
以往的文献揭示了人机交互在放射学诊断性能方面的关键影响。一项使用基于人工智能的乳腺钼靶图像分类系统的研究表明,无论是经验不足的还是经验丰富的阅片者,都容易受到自动化偏差的影响,自动化偏差是指人类用户倾向于遵循自动化决策系统给出的错误建议。同样,有研究显示,错误的人工智能结果会对放射科医生基于胸部 X 光片检测肺癌的表现产生负面影响。另一项研究则强调了在人工智能辅助膝关节磁共振成像(MRI)阅片过程中,建立有效的人机协作协议的重要性。类似地,人机协作的各个要素可能会影响大语言模型辅助下的鉴别诊断结果。在现实临床实践中,放射科医生或放射科住院医师很可能会将大语言模型用作支持诊断推理的辅助工具,而不是完全依赖其进行自主鉴别诊断。在这种情况下,人类医学专业人员在整合现有临床和影像信息、提出准确的问题、批判性地审查大语言模型的回复以及开展进一步研究以最终得出结论等方面,都起着关键作用。特别是考虑到大语言模型系统存在众所周知的生成事实性错误信息(即所谓的 “幻觉”)的倾向,全面评估用户与这些系统实际的交互方式就显得至关重要。

最近,发表在European Radiology 上的一篇文章探究了人类与大语言模型(LLM)协作对脑部磁共振成像(MRI)鉴别诊断的准确性和效率的影响。
这是一项回顾性研究,将 40 例诊断具有挑战性但已明确诊断结果的脑部 MRI 病例随机分为两组,每组 20 例。六名平均阅脑部 MRI 经验为 6.3 个月的放射科住院医师,分别采用传统互联网搜索(传统方式组)和基于大语言模型的搜索引擎及混合聊天机器人(大语言模型辅助组)来评估其中一组病例。采用交叉设计,以确保每种工作流程对每个病例的检查频率相同。对于每个病例,要求阅片者确定最有可能的三种鉴别诊断。由一组放射科医生对大语言模型给出的回复进行分析。通过观察和参与者反馈,总结出人类与大语言模型交互过程中的优势和挑战。
大语言模型辅助的脑部 MRI 鉴别诊断准确性更高(正确诊断数:大语言模型辅助组为 70/114,占比 61.4%;传统方式组为 53/114,占比 46.5%,卡方检验,p = 0.033)。在诊断时间和信心水平方面未观察到差异。对大语言模型回复的分析显示,在 82.1% 的病例(60/73)中,大语言模型的正确建议能够转化为阅片者的正确诊断。阅片者对病例的不准确描述(占病例的 9.2%)、大语言模型的 “幻觉” 现象(占病例的 11.5%)以及大语言模型回复缺乏足够的背景信息等,被确定为人类与大语言模型交互过程中存在的挑战。

表 与会者对LLM辅助鉴别诊断的评价
本项研究表明,人类与大语言模型的协作有潜力改善脑部 MRI 的鉴别诊断。然而,为确保其有效应用和获得用户认可,仍需解决一些挑战。
原文出处:
Su Hwan Kim,Jonas Wihl,Severin Schramm,et al.Human-AI collaboration in large language model-assisted brain MRI differential diagnosis: a usability study.DOI:10.1007/s00330-025-11484-6
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)