首页 > 医疗资讯/ 正文
数字病理学利用高分辨率图像和自动化分析技术,可显著提升癌症诊断的准确性和效率,并且支持远程会诊和便捷的数据存储检索,对病例回顾和研究具有重要价值。然而,这一领域也面临着处理十亿像素图像的计算挑战,并且传统模型忽略了切片的全局背景信息。
微软研究院、华盛顿大学和Providence Genomics公司合作进行了一项数字病理学研究,以克服在癌症诊断领域全面实施人工智能(AI)的一些障碍。
基于Providence卫生网络的171189张全切片中的13亿张病理图像数据,研究团队构建了一个全切片病理AI基础模型Prov-GigaPath,可以读取整个切片的模式,以提高对患者特定癌症突变及其亚型的预测,以及肿瘤微环境可能对不同疗法的影响。分析显示,Prov-GigaPath可以准确地完成17个典型病理任务和9个亚型任务,包括预测泛癌基因突变,并优于其他数字病理方法。总之,Prov-GigaPath是一种开放权重的基础模型,可在各种数字病理任务中实现最先进的性能,证明了真实世界数据和全切片建模的重要性。近日,该研究成果发表在Nature上,文章题为“A whole-slide foundation model for digital pathology from real-world data”。

Providence Genomics首席分析和研究官Ari Robicsek表示:“这项变革性的工作是专注于克服三大挑战的结果,这三大挑战阻碍了已有的计算病理学模型在临床环境中的广泛应用:缺乏真实世界数据、无法整合全切片建模以及缺乏可访问性。”
为应对上述三大挑战,研究团队开发了Prov-GigaPath模型。
01 Prov-GigaPath概述
首先,Prov-GigaPath在来自Providence卫生网络的大型数字病理学数据集Prov-Path上进行了预训练。该数据集涵盖28个癌症中心的3万多名患者,包括31种主要组织类型的171,189个全切片的13亿个病理图像。就数据量而言,Prov-Path比TCGA大5倍多,就患者数量而言,比TCGA大2倍多。同时,Prov-Path还包含组织病理学发现、癌症分期、基因组突变谱以及相关的病理学报告数据。
其次,为了捕捉整个切片的局部和全局模式,研究团队提出了一种新型视觉转换器架构GigaPath,用于在千兆像素病理切片上预训练大型病理基础模型。其关键思想是嵌入图像块作为视觉标记,从而将切片变成一长串标记。
为了将GigaPath扩展到具有数万个图像块的切片级学习,GigaPath将新开发的LongNet方法应用于数字病理学。通过一个跨越多GB的高分辨率文件,以前的计算机视觉程序很难理解来自标准切片的大量信息,而且它们是将图像分解成数千个单独的图像块进行分析。为了理解这些信息,研究人员改进了微软的LongNet程序,该程序的操作类似于大型语言模型,但能够处理更长的序列数据。例如,给AI聊天机器人的书面提示可能会被计算机读取为由数十个相互关联令牌组成的序列,而LongNet可以同时处理多达10亿个令牌。
最后,为了加快数字病理学的研究进展,研究团队使Prov-GigaPath完全开放权重,包括源代码和预训练模型权重。

图1.Prov-GigaPath概述
02 Prov-GigaPath改进突变预测
从病理图像预测肿瘤突变可能有助于为治疗选择提供信息并提高个性化药物的利用率。研究团队将Prov-GigaPath与其它方法在5基因突变预测基准上进行了比较(图2)。在泛癌症环境中常见突变的18个生物标志物预测,以及肺腺癌突变预测(EGFR、FAT1、KRAS、TP53和LRP1B)分析中,Prov-GigaPath表现出最好的性能:在18种生物标志物上的AUROC下的macro-area为3.3%,在AUPRC下的macro-area为8.9%;肺腺癌突变预测的平均macro-AUROC为0.626。研究人员还验证了Prov-GigaPath的通用性,发现其与其它方法相比具有类似的优势。此外,在肿瘤突变负荷(TMB)预测中,Prov-GigaPath也获得了最佳性能。
总之,与之前最先进的病理基础模型相比,Prov-GigaPath在各种病理任务上表现出明显的性能提升。

图2.基因突变预测。
03 Prov-GigaPath改善癌症亚型
在9种主要癌症类型中,研究团队分析了Prov-GigaPath是否可以从图像中准确预测癌症亚型(图3)。研究显示,与其它方法相比,Prov-GigaPath在6种癌症类型上取得了显著改进,表明使用LongNet在整个切片中高效、有效地整合超大规模图像块集是有前景的。

图3.癌症分型的比较。
04 Prov-GigaPath的病理学视觉语言预训练潜力
Prov-GigaPath在病理图像上的良好结果进一步激励研究团队探索了其在多模态视觉语言处理中的应用。研究团队通过利用每张切片的相关报告来检查病理图像和文本的切片水平对齐(图4a)。这种自然发生的切片报告可以潜在地揭示更丰富的切片信息,但是建模相当具有挑战性,因为没有单个图像块和文本之间的细粒度对齐信息。研究在持续预训练中使用标准的跨模态对比损失作为视觉编码器,最先进的生物医学语言模型PubMedBERT作为文本编码器(图4b)。
与三种最先进的病理学视觉语言模型相比,Prov-GigaPath在两种癌症类型的所有3个指标上都获得了最佳的zero-shot分类结果(图4c,e),表明LongNet支持的切片级对齐确实很有优势。此外,使用视觉语言预训练的Prov-GigaPath还可以预测基因突变,预示着其未来在研究罕见癌症类型和新突变方面的潜在应用。

图4.图像-文本对齐的比较。
该研究展示了Prov-GigaPath在各种病理学和癌症亚分类任务以及视觉语言处理上的一流性能。Prov-GigaPath模型建立在迄今为止真实世界中最大的AI训练工作之一的基础上,即全切片组织分析,同时整个项目还包括放射学扫描结果、基因组学结果和患者健康记录。
Providence Genomics首席医疗官Carlo Bifulco表示:“通过Prov-GigaPath等AI工具,病理切片中的丰富数据可以揭示出人眼所不能识别的新关系和见解。研究团队下一步将是利用AI模型开发新的诊断应用,包括肿瘤微环境的研究和帮助治疗选择。”
Prov-GigaPath的开发和应用不仅展示了AI在处理和分析大规模病理图像数据方面的强大能力,也为未来的临床诊断带来了前所未有的潜力,推动了癌症诊断的智能化和精确化。未来数字病理学的发展将继续依赖于大数据和AI技术的深度融合,持续推动癌症等复杂疾病的早期诊断、精准治疗和个性化医疗的发展。
论文原文:
Xu, H., Usuyama, N., Bagga, J. et al. A whole-slide foundation model for digital pathology from real-world data. Nature (2024). https://doi.org/10.1038/s41586-024-07441-w
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)