首页 > 医疗资讯/ 正文
机器学习(ML)在癌症预后预测中的应用日益广泛,但其模型可能因数据收集和算法设计中的偏差而对不同社会人口学群体表现出不公平性。尽管已有研究关注种族偏差,但年龄和性别对模型性能的影响尚未充分探讨。本研究通过分析结直肠癌(CRC)和肺腺癌患者的基因组数据,评估了五种ML模型(随机森林、多项逻辑回归、线性支持向量分类器、线性判别分析和多层感知机)在预测四分类生存结局时的公平性,并探索了减少偏差的方法。研究旨在为个性化癌症治疗提供更公平的预测工具,同时避免以牺牲整体性能为代价的偏差修正。

研究团队从癌症基因组图谱(TCGA)数据库中提取了589例CRC患者和515例肺腺癌患者的临床和转录组数据。通过差异表达基因分析筛选特征后,将患者按年龄(33-60岁、61-72岁、73岁以上)、性别和种族分组。研究采用交叉验证方法,比较了不同模型在各社会人口学子组中的性能指标(准确率、精确率、召回率和F1值)。此外,通过合并子组或针对特定子组训练模型等策略,评估了减少偏差的潜在方法。统计分析方法包括均方误差(MSE)计算和线性回归,以量化模型选择和方法论对性能差异的影响。

研究结果显示,所有ML模型在不同社会人口学群体中均存在性能差异。值得注意的是,较大的群体(如73岁以上年龄组和白人患者)往往表现更差。例如,线性判别分析(LDA)在CRC的61-72岁年龄组中准确率最高(83%),而多项逻辑回归(MLogit)在肺腺癌的同一年龄组中准确率最低(39%)。

性别分析表明,女性患者通常获得更高的准确率,尤其在CRC数据中线性支持向量分类器(Linear SVC)的性别差异达15%。种族方面,黑人患者尽管样本量较小,却在多数模型中表现出更高的精确率和召回率。通过合并子组或针对特定群体训练模型,某些模型的偏差显著减少。

例如,随机森林(RF)和多层感知机(MLP)在针对性训练后,性别组间的准确率差异从19.7%降至1.4%。线性回归分析进一步表明,模型选择和方法优化可显著影响公平性,其中MLP和RF在减少种族和性别偏差方面表现突出。
本研究的结论强调了ML模型在社会人口学群体中的性能差异,并提出了两种有效的偏差缓解策略。这些方法不仅减少了性能差距,还避免了传统偏差修正中对模型整体性能的牺牲。研究建议,在临床应用中应结合多指标评估模型公平性,并针对特定群体优化算法设计。未来的研究需要更大规模、更平衡的数据集以验证这些发现,并探索社会人口学特征之间的交叉性影响。此外,开发兼顾公平性与性能的新型算法将成为癌症预测领域的重要方向。
原始出处:
Feng CH, Deng F, Disis ML, Gao N, Zhang L. Towards machine learning fairness in classifying multicategory causes of deaths in colorectal or lung cancer patients. Brief Bioinform. 2025;26(4):bbaf398. doi:10.1093/bib/bbaf398.
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)