首页 > 健康护理/ 正文

主编推荐 ‖ 大语言模型在多重耐药菌感染防控领域的应用与评估

来源 2026-06-25 22:10:30 健康护理

深度解析医学证据，lxfs.net为你支撑决策

导读

人工智能作为引领新一轮科技革命和产业变革的战略性技术，在医疗卫生领域展现出巨大应用潜力。2024年11月，国家卫生健康委在《卫生健康行业人工智能应用场景参考指引》中明确指出，应积极推进卫生健康行业“人工智能+”应用创新发展，推动人工智能在传染病智能监测、智能卫生应急管理等场景的应用。大语言模型是近年来人工智能领域的重要突破之一，具备强大的语言理解、生成与语义推理能力。该类模型通常基于Transformer架构，通过大规模文本数据的预训练对上下文语言进行建模，完成文本生成、问答系统和推理分析等复杂自然语言处理任务。已有研究表明，ChatGPT-4o在2020、2021年中国执业医师资格考试中准确率分别为84.2%、88.2%，以ChatGPT为代表的大语言模型在医学教育、临床决策支持、患者沟通服务等方面展现出广阔应用前景。

目前，国内外研究多集中于大语言模型的通用医学知识表现，尚无研究系统评估过大语言模型在多重耐药菌感染防控领域的应用效果，其在医院感染控制专业语境下的知识准确性、可用性及完整性仍有待验证。现有研究缺乏针对以下关键问题的探讨：大语言模型能否准确理解多重耐药菌防控的专业术语与临床语境，其输出的防控建议是否符合感染控制指南的规范要求，在实时决策支持中大语言模型的知识覆盖度是否满足临床需求。

鉴于此，本研究构建了面向多重耐药菌防控领域的专业知识问答集，采用专家评估法，从准确性、完整性与可用性三个方面评估ChatGPT-4o在该领域的知识能力，探讨其在医院感染控制工作中的可行性与局限性。本研究旨在为大语言模型在医院感染控制领域的应用提供实证依据，为国内大语言模型的研发、应用及优化提供参考。

大语言模型在多重耐药菌感染防控领域的应用与评估

作者：于涵¹，王丽华²，杨颖³，郑怡²，何帅²，刁一卓²

单位：1. 辽宁中医药大学图书馆； 2. 大连理工大学附属中心医院感染管理与疾病预防控制部； 3. 中国医科大学图书馆

摘要

目的评估大语言模型ChatGPT-4o在多重耐药菌感染防控领域的知识能力，探讨其在医院感染控制领域的应用前景。

方法基于指南和专家共识，构建涵盖5类问题（基础概念、传播风险识别、感染控制实践、抗菌药物管理、监测评估）的专业知识问答数据集，输入ChatGPT-4o生成回答，并组织4名医院感染管理领域专家采用Likert五点评分法对模型输出结果进行评估，对比分析大语言模型在多重耐药菌感染防控专业领域的准确性、完整性和可用性。

结果在50道问题中，ChatGPT-4o总体回答的正确率为58.0%，部分正确率为40.0%，不正确率为2.0%。针对基础概念类问题，ChatGPT-4o表现最佳，正确率达86.0%；在抗菌药物管理类问题中表现相对较差，正确率为40.0%。准确性、完整性和可用性的得分均值分别为4.63、4.70、4.57分。

结论 ChatGPT-4o在多重耐药菌感染防控领域展现出良好的基础知识应答能力。尽管其在复杂感染控制情境中存在内容泛化、决策支持能力不足等局限性，但未来大语言模型在医院感染控制领域具有广泛的应用前景。

引文格式

于涵,王丽华,杨颖,等.大语言模型在多重耐药菌感染防控领域的应用与评估[J]. 中国感染控制杂志,2026,25(5):645-651. DOI:10.12138/j. issn.1671-9638.20263074.
YU Han, WANG Lihua, YANG Ying, et al. Application and evaluation of a large language model in the prevention and control of multidrug-resistant organism infection[J]. Chin J Infect Control, 2026,25(5):645-651. DOI:10.12138/j. issn.1671-9638.20263074.

阅读全文

小提示：本篇资讯仅在梅斯医学APP中开放阅读，请扫描二维码直接下载APP

-->

上一篇：梅毒治疗为何反复？一文读懂治疗失败与血清固定

首页 > 健康护理/ 正文

主编推荐 ‖ 大语言模型在多重耐药菌感染防控领域的应用与评估

小提示：本篇资讯仅在梅斯医学APP中开放阅读，请扫描二维码直接下载APP

猜你喜欢