首页 > 医疗资讯/ 正文
结直肠癌(CRC)是全球范围内最常见的消化道恶性肿瘤之一,五年生存率仅约65%。精准的风险分层对于制定个性化治疗方案至关重要。传统的TNM分期体系作为术后病理的金标准,尚不足以完全反映肿瘤的异质性,分子分型(如CMS分型)和微卫星不稳定性(MSI)标志物为精准治疗提供了新的视角。然而,这些分子标志物检测往往依赖昂贵且复杂的分子检测技术,且多基于术后样本,限制了其在术前风险评估中的应用。
CT作为结直肠癌术前评估的关键影像技术,能提供丰富的肿瘤形态学和浸润范围信息,近年来,伴随计算机视觉技术的飞速发展,基于CT的放射组学研究在结直肠癌诊断和预后预测中取得一定进展。但高质量标注数据的缺乏成为制约模型性能和泛化能力的重要瓶颈。 自监督学习(SSL)作为一种无需大量标注数据的深度学习范式,通过利用数据内在结构进行特征学习,近年来在自然语言处理和计算机视觉领域表现出色。医疗领域标注成本高昂,SSL为医学影像分析提供了有效解决方案,已有病理图像等领域的基础模型取得突破,但针对结直肠癌CT影像的大规模SSL基础模型尚处于起步阶段。

针对结直肠癌CT影像标注数据不足的问题,研究人员提出了CRCFound,一种基于自监督学习的结直肠癌CT影像基础模型。研究收集了6332例结直肠癌患者的三维CT图像数据,其中5137例无标注影像用于自监督预训练,剩余1195例带标注的影像用于下游任务微调和验证。自监督预训练采用基于掩码图像重建的任务(MAE),随机遮挡75%的图像块,模型学习从部分可见图像块重建完整图像,从而捕捉潜在的空间和结构信息。模型编码器采用基于Vision Transformer(ViT)结构的堆叠多头自注意力机制,具备强大的特征表达能力。 下游任务涵盖八大临床关键任务,包括TNM分期(T、N、M、整体分期)、MSI预测、CMS分型以及预后预测(整体生存期OS与无病生存期DFS)。此外,融合了中文放射学报告的文本信息,利用预训练的语言模型ChatGLM-6B提取语义特征,结合影像特征实现多模态融合,提升诊断性能。训练过程中,采用5折交叉验证保证模型稳定性,外部数据集进一步验证了模型泛化能力。

图:CRCFound 概述
主要结果
1、TNM分期诊断表现突出
模型在四个TNM分期任务中均表现出显著的优势。结合放射学报告文本信息的CRCFound_report模型在T、N、M及整体分期上的平均AUC分别达到0.889、0.847、0.830及0.774,显著优于未预训练模型。其中,N分期提升尤为明显,预训练模型相较传统模型提升幅度超过20%。Grad-CAM可视化显示,CRCFound模型能够精准聚焦肿瘤及其周围组织,表现出良好的疾病识别能力和解释性。

图:不同TNM分期中的性能比较
2、分子亚型预测能力强 在MSI预测任务中,融合文本信息的模型AUROC高达0.952,超越纯CT模型及传统训练模型约10%。CMS四分类任务中,预训练模型同样显著优于非预训练模型,尤其在CMS1亚型的识别中效果最佳,显示出模型对分子异质性的敏感性。

图:不同模型在MSI和CMS任务中的性能比较
3、预后预测显示独立预测价值 利用Cox回归模型,CRCFound在OS及DFS的风险分层中均表现出显著的统计学意义(DFS HR=4.62,OS HR=7.78,均p<0.001),且多变量分析确认CRCFound为独立预后因子,优于传统仅基于下游数据训练的模型。

图:预训练权重对CRCFound在两项预后任务中预测性能的影响
4、特征可视化揭示优秀的特征表达能力 t-SNE降维聚类分析显示,CRCFound提取的特征在多个任务中样本分类界限清晰,聚类结构明显,尤其是在样本不平衡的MSI任务中表现优异,远超未预训练模型。

图:使用与不使用CRCFound预训练权重在不同诊断任务中特征提取的聚类效果
5、多模态融合提升模型表现 融合放射学报告文本信息显著提升了模型在多个任务中的表现,尤其在TNM分期和MSI预测中尤为明显,说明影像与文本信息的互补性对精准诊断至关重要。
综上,CRCFound基于大规模无标注结直肠癌CT影像的自监督学习,成功构建了一个性能优异且泛化能力强的基础模型。该模型不仅克服了标注数据不足的瓶颈,还在多项临床关键任务中表现出色,涵盖肿瘤分期、分子分型及预后预测,展示了在结直肠癌精准诊疗中的巨大潜力。多模态融合策略进一步提升了诊断准确率,为临床决策提供了有力支持。
尽管本研究数据量较大,且包含多项任务验证,但数据主要来自单一医疗中心,未来工作需引入更多地区和多中心数据以提升模型的普适性和鲁棒性。此外,当前自监督预训练未充分利用放射学报告文本信息,未来可探索影像与文本的联合自监督训练,以挖掘更丰富的跨模态特征。结合其他影像模态(如MRI、PET)及病理图像,有望进一步提升模型对肿瘤生物学行为的理解。此外,多中心、多设备和不同扫描协议下的验证同样必要,以确保临床应用的可靠性。
原始出处
Yang J, Cai D, Liu J, et al. CRCFound: A Colorectal Cancer CT Image Foundation Model Based on Self-Supervised Learning. Adv Sci (Weinh). Published online August 12, 2025. doi:10.1002/advs.202407339
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)