首页 > 医疗资讯/ 正文
咽炎作为一种常见的上呼吸道感染疾病,每年影响全球数百万人,其病因主要分为细菌性和非细菌性两大类,其中细菌性咽炎多由A组链球菌引起,而非细菌性咽炎则通常由病毒、过敏或环境因素导致。准确区分这两种类型的咽炎对于临床治疗至关重要,因为细菌性感染需要及时使用抗生素以预防并发症,而非细菌性感染则不应使用抗生素,以避免加剧全球抗生素耐药性问题。然而,现有诊断方法如快速抗原检测和咽拭子培养存在时间延迟和操作复杂性,且临床医生仅凭症状和体征进行判断时容易产生误诊,尤其是在医疗资源匮乏地区,这一问题更为突出。因此,开发一种快速、非侵入性且准确的诊断工具具有重要的临床意义和社会价值。

近年来,随着智能手机普及和深度学习技术的进步,利用手机拍摄的咽喉图像结合人工智能模型进行疾病分类成为一种新兴研究方向。然而,该领域缺乏高质量、大规模且公开可用的数据集,限制了相关算法的开发和验证。为此,本研究团队构建了名为PGUPharyngitis的公开数据集,该数据集包含742名患者的咽喉高分辨率图像,并记录了每位患者的年龄、性别、20种症状的二进制指标以及4至9名医生的独立诊断结果。数据收集于伊朗两个气候迥异的城市,一个为寒冷山区,另一个为温暖潮湿的沿海地区,时间跨度为2023年10月至2024年5月,以确保样本的多样性和代表性。所有图像均使用三星Galaxy S21 Ultra和小米Redmi 8 Pro两款智能手机拍摄,并在光照充足的室内环境下利用手机闪光灯增强咽喉区域的可见度。
在数据预处理阶段,研究团队实施了严格的质量控制流程,包括手动检查图像清晰度、旋转校正错位图像、裁剪以突出咽喉关键区域,并排除了至少三名医生认为不适合诊断的图像,最终从原始860张图像中筛选出742张高质量图像纳入数据集。诊断标签的生成基于多名医生的独立评估,每位图像平均由六名医生审阅,部分图像审阅人数可达九名,诊断结果通过多数投票机制确定,若出现显著分歧则引入额外医生进行仲裁,以确保标签的准确性和一致性。数据集的最终形式为结构化Excel文件,每行代表一名患者,列包括患者ID、年龄、性别、20种症状的存在与否以及多位医生的诊断分类。

图1 (a) 数据集中非细菌性喉咙图像示例 (b) 数据集中细菌性喉咙图像示例
为验证数据集的实用性并建立基线性能,研究团队选取了四种深度学习模型——DenseNet121、Swin Tiny、MobileNet V3 Small和ConvNeXt Small,进行细菌与非细菌咽炎的二元分类任务。所有图像在输入模型前统一调整为224×224像素,训练过程中采用3折交叉验证以降低数据划分偏差,批量大小设为20,优化器选用Adam,并应用了随机旋转、水平翻转和仿射变换等数据增强技术。模型在五个性能指标上进行了评估,包括准确率、精确率、召回率、F1分数和AUC面积。实验涵盖了整个数据集以及按采集城市和手机型号划分的子集,以探究不同条件下模型的稳健性。
实验结果显示,在不同模型和数据集子集上,分类性能存在一定差异。当使用全部数据训练时,MobileNet V3 Small在多数指标上表现最佳,准确率达到80.50% ± 12.79%,精确率为69.30% ± 21.99%,召回率为55.26% ± 1.75%,F1分数为54.26% ± 1.81%,但AUC值相对较低,为55.40% ± 7.30%。其他模型如DenseNet121在AUC指标上略优,达到64.45% ± 3.06%。在按城市划分的子集上,寒冷城市数据训练的模型整体准确率较高,DenseNet121在寒冷城市子集上准确率达84.00% ± 4.00%,而在温暖城市子集上各模型性能较为接近。按手机型号划分时,三星手机拍摄的图像上ConvNeXt Small模型准确率最高,为81.25% ± 1.43%,而小米手机图像上Swin Tiny模型表现较好,准确率为72.00% ± 2.00%。这些结果说明,模型性能受数据来源和设备类型的影响,同时也反映了当前模型在咽炎图像分类任务上仍有提升空间,尤其是在处理真实世界中图像质量不均和症状重叠的情况时。
数据集的统计分析进一步揭示了患者群体的特征和症状分布。最常见症状为咽喉痛、咳嗽和流涕,分别占患者的19.8%、14.7%和12.1%,年龄分布覆盖多个年龄段,性别比例接近均衡,男性占51.6%,女性占48.4%。细菌性与非细菌性诊断的比例也得到统计,其中非细菌性案例略多,但整体分布较为平衡。此外,症状共现热图显示了不同症状之间的关联性,为后续多模态模型开发提供了依据。值得注意的是,数据集中有182张图像在所有医生诊断中达成完全一致,这部分数据可作为模型评估的“金标准”,而其余数据则适合用于训练具有标签不确定性处理能力的模型。

图2 本研究中使用的整体数据采集和质量评估工作流程
本研究的贡献在于提供了目前该领域规模最大、标注最详尽的公开咽炎数据集,并通过基线模型验证了其应用于人工智能辅助诊断的可行性。数据集的多样性和真实性使其能够支持远程医疗和移动健康应用的发展,特别是在资源有限地区,患者可通过智能手机自行拍摄咽喉图像,由AI模型提供初步诊断建议,从而减少抗生素滥用和误诊风险。然而,数据集也存在一定局限性,例如真菌性咽炎和慢性咽炎案例较少,图像质量因拍摄条件而异,部分图像聚焦不佳,但这些特点反而增强了模型在真实场景中的适应能力。未来研究可结合症状数据与图像信息,开发多模态深度学习架构,或引入概率方法处理诊断标签的不确定性,以进一步提升分类性能。
总之,PGUPharyngitis数据集的发布为咽炎智能诊断研究提供了重要资源,推动了人工智能在耳鼻喉科和初级保健中的应用。通过促进开源数据和算法的共享,本研究有望加速精准医疗和远程健康解决方案的普及,为全球公共卫生事业贡献力量。
原始出处:
Shojaei, N., Rostami, H., Barzegar, M. et al. A publicly available pharyngitis dataset and baseline evaluations for bacterial or nonbacterial classification. Sci Data 12, 1418 (2025). https://doi.org/10.1038/s41597-025-05780-5
本文相关学术信息由梅斯医学提供,基于自主研发的人工智能学术机器人完成翻译后邀请临床医师进行再次校对。如有内容上的不准确请留言给我们。
猜你喜欢
- Neurology:癫痫儿童 vs 正常儿童?存在基于疾病、癫痫灶定位、年龄发育的静息状态功能连接性(FC)差异——语言网络可塑性证据初步呈现
- 指南解读 | 中国肺癌骨转移临床诊疗指南(2024版)药物治疗解读
- 蒸脸器怎么加水 水加不好影响的不仅是肌肤
- Clin Cosmet Investig Dermatol:我国学者证实单核细胞与高密度脂蛋白比值(MHR) 指标为寻常型银屑病患者心血管风险评估提供新依据
- 内分泌失调对乳腺增生的影响
- 世卫组织:全世界总计新冠确诊病例达25327098例
- JAMA子刊:任何年龄确诊抑郁症都与痴呆症风险上升有关!
- 性是婚姻最坚实基础 性快乐把握在妻子手中
- 吃银耳有什么好处
- Lancet Microbe:免疫印记新突破!祖先株诺如病毒疫苗重塑老年人广谱中和抗体应答
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)