首页 > 医疗资讯/ 正文
摘 要
目的 评估人工智能(artificial intelligence,AI)系统对肺结节良恶性和病理分型的预测能力及临床应用价值,并总结临床应用经验。方法 回顾性分析2016年2月—2025年2月兰州大学第二医院胸外科收治的肺结节患者临床资料。首先将肺结节分为良性组和非良性组,对比分析AI系统和临床医师的鉴别能力。其次将术后病理结果回报为前驱腺体病变(precursor glandular lesions,PGL)、微浸润性腺癌(microinvasive adenocarcinoma,MIA)、浸润性腺癌(invasive adenocarcinoma,IAC)的肺结节进行分析,对比AI系统及临床医师在预测肺结节病理分型上的效能。结果 在良性/非良性肺结节分析中,共纳入638例肺结节患者,其中男257例(双、三原发病灶例数分别为10例、1例),女381例(双、三原发病灶例数分别为18例、1例),中位年龄55.0(47.0,61.0)岁。同一患者的不同病灶作为独立样本进行分析。将两组变量进行单因素分析,结果显示除结节位置外,其余变量差异均有统计学意义(P<0.05)。多因素logistic回归分析显示,年龄、结节类型(亚实性肺结节)、平均密度、毛刺征、血管集束征为非良性肺结节的独立影响因素,其中年龄、结节类型(亚实性肺结节)、毛刺征、血管集束征与非良性肺结节发生呈正相关,平均密度与非良性肺结节发生呈负相关。AI系统所给恶性风险值预测非良性肺结节的受试者工作特征曲线下面积(area under the curve,AUC)值为0.811,略低于临床医师预测的0.898。在PGL/MIA/IAC分析中,共纳入411例肺结节患者,其中男149例(双原发病灶例数为8例)、女262例(双原发病灶例数为17例),中位年龄56.0(50.0,61.0)岁。同一患者的不同病灶作为独立样本进行分析。单因素分析结果显示,PGL、MIA和IAC三组患者除性别、结节位置及血管集束征外,其余变量差异均有统计学意义(P<0.05)。多分类多因素logistic回归分析显示,各参数在PGL组和MIA组间差异均无统计学意义(P>0.05),结节最大径、平均密度在PGL组和IAC组间差异有统计学意义(P<0.05),且作为独立危险因素与IAC发生均呈正相关。AI系统预测肺结节病理分型的平均AUC值、准确率、召回率及F1分数分别为0.807、74.3%、73.2%、68.5%,均优于临床医师预测肺结节病理分型指标(分别为0.782、70.9%、66.2%、63.7%)。AI系统预测IAC的AUC值为0.853,灵敏度、特异度、最佳截断值分别为0.643、0.943、50.0%。结论 该AI系统在预测肺结节良恶性及病理分型上均表现出较高的临床价值,尤其在预测肺结节病理分型上的能力已优于临床医师,后续随着算法的优化及多模态数据的充分整合可更好地辅助临床医师为肺结节患者制定个体化诊疗方案。
正 文
肺癌居我国癌症发病谱和死因谱首位,2022年新发病例增至106.06万,死亡73.3万,分别占我国癌症发病和死亡总数的22.0%和28.5%,构成重大公共卫生挑战[1]。肺癌早期在影像学上常表现为肺结节[2],美国国家肺癌筛查试验[3-4]结果显示,使用低剂量螺旋CT(low-dose computed tomography,LDCT)对肺癌高危人群进行筛查使该部分个体肺癌死亡率较X线筛查组下降20%,但假阳性率也高达96.3%左右。此外,肺腺癌作为最常见的原发性肺肿瘤[5],根据第5版《WHO胸部肿瘤分类》[6]分为微浸润性腺癌(microinvasive adenocarcinoma,MIA)和浸润性腺癌(invasive adenocarcinoma,IAC),而非典型腺瘤样增生和原位腺癌被归为前驱腺体病变(precursor glandular lesions,PGL)。有研究[7]表明,对于PGL可以随访观察或局部切除,局部完整切除后5年生存率可达100%;对于MIA行亚肺叶切除术,5年生存率也可达100%;而IAC手术方式往往需要肺叶切除术+淋巴结清扫,且5年生存率明显下降。因此,如何在术前准确鉴别良恶性肺结节并预测病理类型就成了问题的关键,直接影响到对患者诊疗方案的制定,对改善患者的预后效果非常重要,且能降低过度诊疗带来的损失[8]。
近年来人工智能(artificial intelligence,AI)影像诊断被尝试用于医学影像辅助诊断,我国目前已有部分AI影像辅助诊断系统被批准上市[9],基于胸部影像的肺结节计算机辅助诊断系统可对肺结节进行自动检测和分析,准确提取CT影像中有重要影响的微特征[10],如结节的大小、形状、类型、空间复杂性以及可疑“纹理”等,具有快速、无创、可捕捉肿瘤异质性和可重复性等优势,有助于提高医师对肺结节的识别和诊断能力,从而减轻医师的工作量,提高工作效率[9-11]。本中心使用“点内-ScrynPro™-肺小结节智能辅助筛查系统”对难定性肺结节常规进行预测分析。本研究旨在对比AI系统和临床医师对肺结节的预测效能,讨论AI系统在鉴别良性/非良性肺结节及预测肺结节病理分型上的临床应用价值。
1 资料与方法
1.1 临床资料和分组
回顾性收集2016年2月—2025年2月兰州大学第二医院胸外科收治的肺结节患者,入组670枚经术后常规病理明确诊断的肺结节。根据第5版《WHO胸部肿瘤分类》将肺结节分为两组:良性组(结核瘤、错构瘤、炎症性病变及良性肺肿瘤等)和非良性组(PGL、MIA、IAC及其他肺恶性肿瘤)。为评估AI系统及临床医师阅片对PGL及肺腺癌病理分型的预测效能,选择术后病理诊断为PGL、MIA或IAC,且AI系统给出定性诊断的肺结节。根据病理分型,将肺结节分为三组:PGL组、MIA组和IAC组。
1.2 方法
1.2.1 CT检查及结果预测
CT影像采用以下几种系统:Discovery CT750 HD(GE Healthcare)、Philips iCT 256(Koninklijke Philips N.V.)和Somatom Sensation 64(西门子)。扫描设置如下:管电压设定为120 kVp,管电流在150~200 mA之间变化。轴向图像的层厚和层间距均保持为5 mm,重建层厚和间隔均设定为1.25 mm。所有CT图像的分析采用了肺窗设置,窗宽1500 HU,窗位−400 HU。患者采集胸部LDCT/高分辨率CT图像后将DICOM文件导入AI系统中,其能自动检测肺部结节,并计算生成结节大小、体积、平均密度、恶性风险值、预测病理类型等参数。临床医师预测肺结节良性/非良性及病理类型由2名胸外科和放射科高年资医师阅片后得出预测,如果预测结果出现差异,则由更高年资医师阅片后共同讨论得出预测结果。
1.2.2 病理检查
标本均在兰州大学第二医院病理科完成病理检查,肺结节标本均经福尔马林固定,石蜡包埋切片,用特殊方法染色,最终病理诊断由2名主治医师以上职称的病理科医师确定。
1.3 统计学分析
采用SPSS 27.0统计软件对数据进行统计分析。符合正态分布的计量资料采用均数±标准差(x±s)表示,两组间比较采用独立样本t检验,三组间比较采用方差分析;偏态分布的计量资料采用中位数(上下四分位数)[M(P25,P75)]表示,两组间比较采用Mann-Whitney U检验,三组间比较采用Kruskal-Wallis H检验。计数资料采用例数和百分比(%)表示,组间比较采用χ2检验。采用pROC程序绘制受试者工作特征(receiver operating characteristic,ROC)曲线并计算曲线下面积(area under the curve,AUC)。应用Pycharm 2024.1.7 软件绘制三分类问题混淆矩阵及ROC曲线评价AI系统及临床医师预测肺结节病理分型的三分类结果,金标准为病理结果。双侧检验水准α=0.05。
1.4 伦理审查
本研究已通过兰州大学第二医院伦理委员会审批,批准号:2025A-137。
2 结果
2.1 良性组与非良性组比较
共纳入638例肺结节患者的临床资料,其中男257例(双、三原发病灶例数分别为10例、1例),女381例(双、三原发病灶例数分别为18例、1例),中位年龄55.0(47.0,61.0)岁,共计肺结节670枚。对两组间各参数进行单因素分析,结果显示除结节位置外,两组患者在性别、年龄、结节类型、结节最大径、结节体积、平均密度、分叶征、毛刺征、胸膜凹陷征、血管集束征上的差异均有统计学意义(P<0.05);见表1。将单因素分析中差异有统计学意义的参数纳入二元logistic回归分析,参数筛选方法为“向前-有条件”,协变量中的多分类计数资料参考类别选择最后一个(结节类型以实性结节为参考)。分析结果显示,年龄、结节类型、平均密度、毛刺征、血管集束征为非良性肺结节的独立影响因素(P<0.05),其中年龄、结节类型(亚实性结节)、毛刺征、血管集束征与非良性肺结节呈正相关,平均密度与非良性肺结节呈负相关。结节体积在多因素回归分析中P值为0.001,但由于其OR值为1.000[95%CI(1.000,1.001)],可以认为该变量在良性组与非良性组之间无临床意义;见表2。
2.2 PGL/MIA/IAC三组间比较
共纳入411例肺结节患者的临床资料,其中男149例(双原发病灶例数为8例)、女262例(双原发病灶例数为17例),中位年龄56.0(50.0,61.0)岁,共计肺结节436枚。三组间各参数进行单因素分析,结果显示三组患者在性别、结节位置、血管集束征方面的差异无统计学意义(P>0.05),在年龄、结节类型、结节最大径、结节体积、平均密度、分叶征、毛刺征、胸膜凹陷征方面的差异均有统计学意义(P<0.05);见表3。将单因素分析中差异有统计学意义的因素纳入多元logistic回归分析,以PGL组为参考。分析结果显示,各参数在PGL组和MIA组间差异均无统计学意义(P>0.05)。结节最大径、平均密度在PGL组和IAC组间差异有统计学意义,且作为独立危险因素与IAC的发生均成正相关(P<0.05);见表4。
2.3 AI及临床医师的肺结节预测效能比较
在预测肺结节良性/非良性方面,ROC曲线分析结果显示,AI系统对肺结节综合分析后得出的恶性风险值在预测良性/非良性肺结节上的AUC值为0.811,灵敏度为0.897,特异度为0.605,最佳截断值为77.0%;临床医师阅片分析后,预测良性/非良性肺结节的AUC值为0.898,灵敏度为0.982,特异度为0.814;见图1。
图 1 AI系统及临床医师预测良性/非良性肺结节的ROC曲线
AI:人工智能;ROC:受试者工作特征;AUC:曲线下面积。
在预测肺结节病理分型方面,绘制混淆矩阵和ROC曲线进行分析,分析结果显示:AI系统对肺结节综合分析后预测PGL/MIA/IAC的整体AUC值为0.807,其准确率、召回率、F1分数分别为74.3%、73.2%、68.5%;临床医师阅片分析后,预测病理分型的整体AUC值为0.782,其准确率、召回率、F1分数分别为70.9%、66.2%、63.7%;见图2。
图 2 AI系统及临床医师预测PGL/MIA/IAC的混淆矩阵和ROC曲线
a:AI 系统预测的混淆矩阵;b:临床医师预测的混淆矩阵;c:AI系统预测的ROC曲线;d:临床医师预测的ROC曲线;PGL:前驱腺体病变;MIA:微浸润性腺癌;IAC:浸润性腺癌;ROC:受试者工作特征;AUC:曲线下面积;AI:人工智能。
ROC曲线分析结果显示:AI系统对肺结节综合分析,预测IAC的AUC值为0.853,灵敏度为0.643,特异度为0.943,最佳截断值为50.0%;见图3。
图3 人工智能系统预测IAC的ROC曲线
3 讨论
我国目前面临肺癌患者基数庞大及5年存活率不高的问题,医学影像数据年增长速度远高于影像科医师数量增长速度。此外,肺癌整体5年存活率为19.7%,其中Ⅰ期肺癌和ⅢA~ⅣB期肺癌5年存活率分别为77%~92%和0%~36%,差异巨大[9]。如何提升临床医师分析患者影像学资料的速度和提高早期诊断的准确度就成了核心问题。有研究[12]发现,临床医师在AI辅助下进行胸部CT阅片时间较对照组医师显著缩短[(118.5±10.5)s vs.(332.1±20.2)s,P<0.01],且AI较人工分析影像学检查有可重复性、不疲劳、不受主观倾向差异影响等优势。Fang等[13]的研究发现,AI参数联合影像体征对预测早期肺腺癌的亚型很有价值,在预测PGL vs. MIA和MIA vs. IAC的AUC分别达0.779和0.918。随着AI在肺结节筛查和诊断中展现出越来越重要的价值,为提高临床医师在解决肺结节领域疑难问题上的能力,我国专家[14]提出了通过AI系统与医师进行人机多学科团队(multi-disciplinary team,MDT)交流对话为肺结节患者做出个体化的诊疗建议。人机MDT可以充分结合并发挥二者优势,如AI快速精准检测肺结节并评估其各项定量参数,临床医师结合临床经验对肺结节做出判断,减少AI识别的假阳性及假阴性。前期研究已发现,本中心所使用的点内-ScrynPro™-肺小结节智能辅助筛查系统对肺结节的检出率可达100%[15],在预测早期肺腺癌浸润亚型上也表现出优秀的效能[16]。该AI系统基于深度学习中3D卷积神经网络算法对导入的胸部CT图像进行自动阅片及分析,检测其中肺结节的各项参数、语义特征并预测肺结节恶性风险值、IAC概率及病理类型。本次研究通过将AI系统和临床医师对肺结节的预测结果进行对比来评估其临床应用价值。
在预测良性/非良性肺结节方面,AI系统所给恶性风险值在预测非良性肺结节上的AUC值为0.811,灵敏度为0.897,特异度为0.605,最佳截断值为77.0%,表现出较佳的预测效能,但低于临床医师预测的AUC值0.898。二者的差距主要体现在:AI系统预测的特异度为0.605,胸外科医师预测的特异度为0.814,反映出AI系统目前对预测非良性肺结节的假阳性率仍较高。这可能是由AI系统对多模态数据融合不足所致,多模态数据融合可以突破模型泛化瓶颈问题,增强安全性、稳定性和可解释性[17]。AI系统目前未接入患者病历系统,无法自行整合患者病史、实验室检查(如肿瘤标志物、血常规与生化)、基因检测等信息。同时由于深度学习算法具有一定的黑盒性质[18],其决策的主要依据难以解释,这可能导致AI系统在多模态数据融合不足的情况下,对肺结节的几何尺寸和密度等参数在预测恶性肺结节上的权重占比过高,从而使部分具有较大几何尺寸和较高密度的肺结节表现出高恶性风险值。此外,AI系统目前对结节语义特征的识别还是略为单调,对边缘特征中更细致的深/浅分叶,内部结构中的空泡征、钙化情况及空气支气管征尚不能有效识别。而临床医师在判断结节良恶性上的临床经验更为丰富,在阅片时可结合病史及相关临床检查/检验结果综合分析后得出判断,这或许是目前该AI系统在预测良性/非良性肺结节上的效能略低于临床医师的原因。该组间多因素分析结果显示,年龄、结节类型(亚实性结节)、毛刺征及血管集束征为非良性肺结节的独立影响因素,且与非良性肺结节发生呈正相关。Reid等[19]开发的肺结节恶性肿瘤概率模型亦验证年龄、不规则/毛刺状结节边缘等因子为肺癌的预测因子,模型的一致性指数(C-index)范围为0.75~0.81。Liu等[20]在对Mayo进行外部验证和修订后开发的新模型中同样发现亚实性肺结节的恶性概率显著高于实性结节。Xu等[21]发现良性结节的基线密度为42.7 HU,高于恶性结节的基线密度(−2.2 HU),这一定程度上和本次研究分析出平均密度为非良性肺结节独立危险因素且与其发生呈负相关相印证,但多因素分析结果显示平均密度的OR值仅为0.997[95%CI(0.994,0.999)],这表明平均密度与非良性肺结节呈微弱负相关,提示医师在临床工作中应该更加关注随访过程中结节密度变化。
AI系统预测IAC的AUC值为0.853,灵敏度为0.643,特异度为0.943,最佳截断值为50.0%,体现出AI系统在预测结节是否为IAC上有较高的预测效能,提醒临床医师需多加关注IAC概率≥50.0%的肺结节。在预测肺结节病理分型上,AI系统的整体AUC值、准确率、召回率、F1分数分别为0.807、74.3%、73.2%、68.5%,均优于临床医师预测指标(0.782、70.9%、66.2%、63.7%)。AI系统在预测肺结节病理分型上展现出较好的预测效能,且优于临床医师。这可能是由于AI可以提取出影像学细微纹理特征,将蕴含在数字化图像中的像素纹理信息充分利用,如灰度依赖矩阵和灰度级运行长度矩阵被发现在肿瘤组织结构分析上具有重要价值[22-23]。三分类问题的多因素logistic分析结果显示,平均密度与结节最大径在PGL组和IAC组为独立危险因素,且都与IAC发生呈正相关。Heidinger等[24]同样发现,在CT影像上表现为纯磨玻璃结节的结节大小与组织学侵袭病灶的大小和数量呈正相关。这一发现符合腺癌从PGL、MIA到IAC渐进发展的生长规律[25]。本中心多年来积极应用AI系统参与肺结节影像诊断环节,通过人机MDT模式解决难定性肺结节的诊断。AI系统通过持续、大量的数据训练迭代了算法版本,临床医师通过交互反馈机制提升了诊断经验,二者通过相互学习使肺结节诊断水平得到了明显提升,目前长期使用AI系统的医师在人机MDT模式下鉴别良恶性肺结节的能力已超越AI。本研究进一步验证了AI在辅助诊断肺结节上的临床应用价值,提示医师关注恶性风险值≥77.0%、IAC概率≥50.0%的肺结节为非良性结节、IAC的风险。此外,通过人机MDT显著缩短临床医师阅片时间及定量参数提取时间,临床工作效率得到了显著提升。
本研究为单中心回顾性研究,所有数据依赖于现有记录,可能存在选择和信息偏倚,不同病理分型的样本量也不平衡,从而导致数据不完善。有待多中心、大样本研究进一步证实。
综上所述,该AI系统通过术前预测肺结节恶性风险、IAC率以及定性诊断肺结节病理分型,与术后病理结果相互验证后展现出较好的预测效能,尤其在预测病理分型上的效能已超过临床医师,呈现出较高的临床应用价值。随着后续样本量的扩大、多模态数据进一步整合、AI学习算法的优化及多中心研究的开启,相信AI系统会有更快速、准确的效能表现,有望在“人机MDT”讨论后辅助胸外科医师为肺结节患者制定最佳的个体化诊疗方案。
利益冲突:无。
作者贡献:杨卓文负责数据分析,初稿撰写;惠一鸣、林明治负责数据收集,软件操作;宋铁牛、孟于琪负责人工阅片;党继英、李随阳、张春皎、杨龙、司亮负责数据收集、整理;李斌、郑智中负责论文选题、设计、修改与审校。
猜你喜欢
- 搜索
-
- 1000℃李寰:先心病肺动脉高压能根治吗?
- 1000℃除了吃药,骨质疏松还能如何治疗?
- 1000℃抱孩子谁不会呢?保护脊柱的抱孩子姿势了解一下
- 1000℃妇科检查有哪些项目?
- 1000℃妇科检查前应做哪些准备?
- 1000℃女性莫名烦躁—不好惹的黄体期
- 1000℃会影响患者智力的癫痫病
- 1000℃治女性盆腔炎的费用是多少?
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)