首页 > 医疗资讯/ 正文

Nat Commun:基于知识增强的视觉语言模型提升常见与罕见眼底疾病的诊断准确性

来源 2025-08-03 12:19:30 医疗资讯

在全球范围内,失明和视力障碍是导致疾病负担的重要因素,而视网膜和视神经疾病的早期检测与治疗对于减少永久性视力损伤至关重要。然而,眼科医疗资源的不足以及不同地区疾病分布的差异,使得眼底疾病的筛查和管理面临巨大挑战。近年来,基于人工智能的眼底疾病筛查系统在特定疾病(如糖尿病视网膜病变、青光眼)上取得了显著进展,但大多数模型仅针对单一疾病设计,难以应对新数据或新任务的需求。此外,由于数据收集的困难,现有模型通常覆盖的疾病类别有限,且难以适应多样化的临床场景。这些问题限制了人工智能模型在眼科临床中的广泛应用,尤其是在全球范围内推广时面临数据质量和标注一致性的挑战。 为了解决这些问题,研究团队开发了名为RetiZero的视觉语言模型。该模型整合了超过400种眼底疾病的知识,并通过341,896张眼底图像及其文本描述进行预训练。这些数据来源于29个公开数据集、180篇眼科文献以及在线资源,覆盖了不同种族和国家的多样性。RetiZero采用了结合掩码自编码器(MAE)和对比语言-图像预训练(CLIP)的框架,并引入了基于狄利克雷重参数化的不确定性视觉语言特征校准方法,以在高维嵌入空间中对齐图像和文本

Tags: Nat Commun:基于知识增强的视觉语言模型提升常见与罕见眼底疾病的诊断准确性  

搜索
网站分类
标签列表