首页 > 医疗资讯/ 正文

Briefings in Bioinformatics:机器学习在结直肠癌与肺腺癌预后预测中的公平性评估及偏差缓解策略

来源 2025-08-20 12:17:02 医疗资讯

机器学习(ML)在癌症预后预测中的应用日益广泛,但其模型可能因数据收集和算法设计中的偏差而对不同社会人口学群体表现出不公平性。尽管已有研究关注种族偏差,但年龄和性别对模型性能的影响尚未充分探讨。本研究通过分析结直肠癌(CRC)和肺腺癌患者的基因组数据,评估了五种ML模型(随机森林、多项逻辑回归、线性支持向量分类器、线性判别分析和多层感知机)在预测四分类生存结局时的公平性,并探索了减少偏差的方法。研究旨在为个性化癌症治疗提供更公平的预测工具,同时避免以牺牲整体性能为代价的偏差修正。

研究团队从癌症基因组图谱(TCGA)数据库中提取了589例CRC患者和515例肺腺癌患者的临床和转录组数据。通过差异表达基因分析筛选特征后,将患者按年龄(33-60岁、61-72岁、73岁以上)、性别和种族分组。研究采用交叉验证方法,比较了不同模型在各社会人口学子组中的性能指标(准确率、精确率、召回率和F1值)。此外,通过合并子组或针对特定子组训练模型等策略,评估了减少偏差的潜在方法。统计分析方法包括均方误差(MSE)计算和线性回归,以量化模型选择和方法论对性能差异的影响。

研究结果显示,所有ML模型在不同社会人口学群体中均存在性能差异。值得注意的是,较大的群体(如73岁以上年龄组和白人患者)往往表现更差。例如,线性判别分析(LDA)在CRC的61-72岁年龄组中准确率最高(83%),而多项逻辑回归(MLogit)在肺腺癌的同一年龄组中准确率最低(39%)。

性别分析表明,女性患者通常获得更高的准确率,尤其在CRC数据中线性支持向量分类器(Linear SVC)的性别差异达15%。种族方面,黑人患者尽管样本量较小,却在多数模型中表现出更高的精确率和召回率。通过合并子组或针对特定群体训练模型,某些模型的偏差显著减少。

例如,随机森林(RF)和多层感知机(MLP)在针对性训练后,性别组间的准确率差异从19.7%降至1.4%。线性回归分析进一步表明,模型选择和方法优化可显著影响公平性,其中MLP和RF在减少种族和性别偏差方面表现突出。

本研究的结论强调了ML模型在社会人口学群体中的性能差异,并提出了两种有效的偏差缓解策略。这些方法不仅减少了性能差距,还避免了传统偏差修正中对模型整体性能的牺牲。研究建议,在临床应用中应结合多指标评估模型公平性,并针对特定群体优化算法设计。未来的研究需要更大规模、更平衡的数据集以验证这些发现,并探索社会人口学特征之间的交叉性影响。此外,开发兼顾公平性与性能的新型算法将成为癌症预测领域的重要方向。

原始出处:

Feng CH, Deng F, Disis ML, Gao N, Zhang L. Towards machine learning fairness in classifying multicategory causes of deaths in colorectal or lung cancer patients. Brief Bioinform. 2025;26(4):bbaf398. doi:10.1093/bib/bbaf398.

Tags: Briefings in Bioinformatics:机器学习在结直肠癌与肺腺癌预后预测中的公平性评估及偏差缓解策略  

搜索
网站分类
标签列表