首页 > 医疗资讯/ 正文
MM MRD
多发性骨髓瘤(MM)是一种基于骨髓的、多灶性的浆细胞肿瘤增殖,占所有癌症的1%,大约占所有血液系统恶性肿瘤的10%。对多发性骨髓瘤患者进行可测量残留病(MRD)检测的兴趣可以追溯到20世纪90年代初的干细胞移植时代,从方法学角度来看,MRD评估在MM中已经准备好进入临床应用阶段,大量证据强调了使用高灵敏度的二代流式细胞术(NGF)和二代测序(NGS)检测确定的MRD状态在评估治疗反应以及因此评估患者预后方面的价值。MRD反应评估和监测可能为患者的个体化管理提供一系列机会。
此外,在临床试验中生成的大量高质量且标准化的MRD数据,已经促成了将MRD阴性作为MM治疗中加速监管批准的早期终点。数据毫无疑问地表明,新方案诱导更深且更持久的MRD阴性反应与延长生存期密切相关。然而,一些证据上的、技术上的和实际的挑战仍然限制了MRD指导治疗策略在常规实践中的实施,而将MRD作为替代终点的使用仍然存在一些争议。
《Nature Reviews Clinical Oncology》近日发表综述,全面回顾了MM中MRD检测的过去、现状和将来,讨论了使用MRD(和PRD)分析来指导MM患者管理的机会和挑战。全文约1.5万字,可以收藏慢慢看。
本文要点
-
MRD评估已准备好在MM的临床管理中进入应用阶段。
-
MRD阴性完全缓解(CR)可以视为MM中CR的新定义。
-
新方案诱导更深且更持久的MRD阴性反应的疗效与延长生存期密切相关。
-
在2024年,就将MRD阴性作为支持MM新治疗方案加速批准的早期终点达成了共识。
-
序贯使用MRD和外周残留病(PRD)检测方法可能是反应评估的下一个前沿领域。
引言
对多发性骨髓瘤患者进行MRD检测的兴趣可以追溯到20世纪90年代初,当时自体和异基因造血干细胞移植(HSCT)确立为这些患者的治疗选择。事实上,自体移植中残留癌细胞的检测是MRD评估在MM患者中的最早应用之一。值得注意的是,造血干细胞采集中可检测到MRD的负面影响至今仍被认可。这一观察结果体现了MRD的概念:在任何生物样本中检测到少量残留癌细胞,反映了其他地方存在更大的肿瘤负荷,这在大多数患者中会导致不利的生存预后。
自20世纪90年代以来,MM中MRD评估的方法和范围发生了深刻的变化。从方法学上讲,MRD评估从最初基于间期荧光原位杂交和DNA倍体分析的方法,转变为通过多参数流式细胞术进行免疫表型分析以及免疫球蛋白基因重排的聚合酶链反应(PCR)。这些进展之后,又开发出了高灵敏度(检测限[LOD]≤10⁻⁵)且标准化的二代流式细胞术(NGF)和二代测序(NGS)技术,它们是目前的金标准。
使用PET–CT成像来评估骨髓内疾病和骨髓外疾病(EMD)是MRD评估的另一种有价值的方法。能够检测到超过一千万个非恶性细胞中的一个癌细胞(即灵敏度在10⁻⁷对数范围内)的新版NGF和NGS,以及用于高灵敏度检测多发性骨髓瘤细胞衍生的单克隆免疫球蛋白蛋白(M蛋白)的基于质谱(MS)的方法的出现,为监测外周残留病(PRD)提供了潜力。MRD和PRD的序贯使用可能是MM反应评估的下一个前沿领域。
从临床角度来看,MRD已经从作为MM患者临床治疗中治疗效果的探索性生物标志物,得到进一步被研究,并且在2024年,就MRD阴性作为支持新治疗方案加速批准的早期终点的潜在作用达成了共识。
MM中检测MRD的意义
在MM中,MRD指的是在根据传统反应标准达到CR的患者骨髓中可检测到的肿瘤负荷。2016年国际骨髓瘤工作组(IMWG)建立了反应和MRD评估的共识标准;对于定义CR,标准包括:血清和尿液中M蛋白免疫固定电泳为阴性,任何软组织浆细胞瘤消失,以及骨髓穿刺浆细胞比例<5%。免疫固定电泳阴性及软组织浆细胞瘤消失仍然是普遍接受的终点。然而,通过传统显微镜显示<5%骨髓浆细胞已经失去其价值,因为在过去20年中批准了19种有效的MM新药后,几乎所有免疫固定电泳阴性的患者,其骨髓浆细胞比例也<5%。事实上,2016年IMWG指南指出,应使用每次骨髓穿刺获得的第一份样本进行MRD评估,而非细胞形态学检查,以确保样本高质量且具有代表性,从而增加获得准确MRD结果的可能性。
研究MRD的基本原理在于,尽管达到CR的患者预后较好,但他们仍处于疾病进展和死亡的中等风险中,这只能用存在传统方法无法检测到的残留癌细胞来解释。数十年的研究证实,达到CR但可检测到MRD的患者,其生存结果与部分缓解的患者相似。最终,MRD阴性CR可视为MM中CR的新定义。
人们可能会期望,无法检测到MRD就等同于治愈,但事实并非如此。这一认识引发了对MRD评估效用的相当大的怀疑,特别是部分无法检测到MRD的患者仍然会出现疾病复发。事实上,由于残留疾病通常存在于检测限(LOD)以下的水平,作者更倾向于使用“MRD无法检测”这一术语,而非“MRD阴性”。围绕MRD的不合理期望仍在引发讨论和争议,其程度是其他MM预后因素从未见过的。可以相信,尽管MRD无法检测并不等同于治愈,但治愈MM的道路需要实现深度且持续的MRD反应,至少在绝大多数患者中是这样。
MM中MRD检测的时间轴
在MM中,使用大剂量治疗后进行自体或异体造血干细胞移植(HSCT)能够实现更高的CR率,从而促使了在适合移植的患者中对MRD进行研究,以表征CR的质量,用于预测预后(图1)。2000年代初免疫调节剂和蛋白酶体抑制剂的引入进一步提高了CR率,推动了在该人群中进行MRD研究,并引发了对不适合移植患者中MRD作用的研究兴趣。在过去的十年中,抗CD38单克隆抗体、抗BCMA抗体–药物偶联物以及靶向BCMA和GPRC5D的T细胞重定向免疫疗法的发展,使得复发和/或难治性多发性骨髓瘤(RRMM)患者的CR率大幅提高,从而为在这一背景下评估MRD创造了动力。
这种时间线意味着,大多数在适合移植人群中发表的研究依赖于最初的、低灵敏度的MRD评估方法(图1),例如四色或六色流式细胞术。而涉及不适合移植患者的研究则使用早期、中等灵敏度(即多参数流式细胞术和PCR检测)和二代(NGF和NGS)方法的混合,而在RRMM的大多数MRD评估使用NGS。这种模式可能解释了为什么一项荟萃分析发现,与不适合移植的患者和RRMM患者相比,适合移植且MRD无法检测的患者的生存结果似乎较差。事实上,几项使用NGF和NGS的研究发现,在MRD无法检测的适合移植患者中,4年无进展生存(PFS)率接近90%,远高于上述荟萃分析中报告的不适合移植和RRMM人群的<65%(在该荟萃分析中,适合移植患者的报告比率<55%)。在接受现代治疗标准后MRD无法检测的不适合移植患者和RRMM患者的生存结果是前所未有的。新治疗方案的有效性数据清楚地表明,在MM患者中,深度且持久的MRD反应与延长生存期密切相关(表1和图1)。
MM中MRD检测的方法
对于MRD评估疗效,MM可以认为是一种处于前沿地位的疾病。目前,两种可互换的二代MRD评估方法(NGF和NGS),以及影像学和MS,都可用于监测骨髓内外的治疗效果(表2)。这些方法的多样性、敏感性和标准化,使得可以探索几种不同的肿瘤特征,这是MM所独有的,其他血液肿瘤无法媲美。
二代流式细胞术
流式细胞术可能是从MRD评估早期一直使用到现在的唯一技术,但也已经从分析细胞DNA含量(DNA倍体)和三色或四色荧光染色,发展到使用包含六个、八个或十个标志物的panel进行多参数免疫表型分析,同时仪器和试剂也得到了改进。直接比较MRD检测方法的研究通常发现,PCR和NGS比基于少于八个标志物和染色–溶解–洗涤方法的传统流式细胞术方法具有更高的灵敏度。然而,由EuroFlow联盟开发的一种优化的两管八色和批量溶解–洗涤–染色NGF方法达到了前所未有的2×10⁻⁶的灵敏度,并且在检测MRD方面与NGS检测表现相似。EuroFlow NGF方法有望获得监管批准,并在临床试验和常规实践中标准化使用。除了从样本采集到报告结果的快速周转时间(约24小时)外,NGF的一个独特特点在于能够评估血液稀释程度,从而避免因非代表性骨髓穿刺样本而导致的假阴性MRD结果,其可以根据B细胞和髓系前体细胞、肥大细胞和红细胞前体细胞的低百分比来识别。NGF的另一个优势在于可以在无需治疗前样本的情况下进行检测,因为可以通过事先不知道肿瘤表型的情况下识别表型异常的克隆浆细胞。
二代测序
基于NGS的MRD检测涉及免疫球蛋白重链和轻链重排的鉴定和定量,其需要一份初始的高肿瘤负荷样本,以识别用于后续评估的克隆型序列。在治疗前,接近95%的患者可以识别出克隆型序列。开发基于NGS的检测方法对于克服基于PCR方法的局限性(如适用性低)至关重要,并且能够在几乎所有样本中实现≥10⁻⁵的灵敏度。FDA已批准clonoSEQ NGS检测用于B细胞恶性肿瘤(包括MM)患者的MRD评估。NGS可以使用新鲜或冷冻样本进行检测,因此已成为大型队列、国际和/或多中心临床试验中MRD分析的首选方法,这些试验通常依赖样本存储和批量分析。在这些研究中,使用NGS生成高质量和标准化的MRD数据,在支持将MRD阴性作为MM新疗法加速批准的早期试验终点方面发挥了重要作用。该方法也在常规临床实践中得到应用,尽管其应用程度可能低于NGF,至少在美国以外地区是这样,原因在于其成本较高和技术资源有限。
影像学手段
骨髓的斑片状肿瘤浸润和髓外病变(EMD)支持在整个骨髓和骨髓外部分评估治疗效果的必要性。在多发性骨髓瘤(MM)中研究的不同影像学方法中,18F-FDG PET–CT已达成共识并标准化,并在临床试验和常规实践中被证明具有预后价值。
尽管PET–CT的灵敏度低于MRD检测,但它可以补充预后信息,特别是在复发和/或难治性多发性骨髓瘤(RRMM)患者中,因为这些患者发生EMD的概率更高,而这些EMD无法通过骨髓MRD检测捕捉到。在一线治疗中,通过下一代方法确定骨髓中MRD不可检测但PET结果阳性患者的百分比较低(约5%),且这种模式的预后相关性仍不确定。
更重要的是,有明确的证据表明,骨髓MRD不可检测且PET–CT结果为阴性的患者预后最好。这些观察结果支持了国际骨髓瘤工作组(IMWG)的“影像学+MRD阴性”反应标准,该标准定义为通过NGF或NGS检测到的不可检测MRD,加上在先前或基线PET–CT扫描中发现的每个摄取增加区域的消失,或者降低到低于纵隔血池标准化摄取值或周围非恶性组织的水平
外周残留病分析
在MM中,PRD(外周血残留病)评估是疾病监测的下一个前沿领域。MRD动态变化明确且显著地影响着多发性骨髓瘤患者的生存结果,持续MRD反应的重要性虽合乎逻辑,但正式确立却花费了一些时间,因为最初的研究仅限于进行一次或两次MRD评估。在对患者结果产生影响的MRD动态变化中,最有意义的变化是在维持治疗期间(例如从MRD无法检测状态转变为可检测状态)。这一认识意味着,与传统反应标准类似,MRD必须定期监测,以更准确地预测生存结局。频繁的MRD检测在临床试验中是标准做法,但由于连续骨髓穿刺带来的不适,尤其是在老年和虽然患者中,这在日常临床实践中可能是不切实际的。因此,越来越多的关注集中在采用侵入性较小的方法来评估外周血中的残留病灶。外周血残留病的生物学和临床意义可能与骨髓MRD不同,因此应该区别描述,并称之为“PRD”。
循环肿瘤细胞
欧洲流式联盟(EuroFlow)利用NGF检测循环肿瘤细胞(CTCs),对137例在临床试验外接受治疗的新诊断多发性骨髓瘤(NDMM)患者进行PRD监测。研究发现,治疗后CTCs持续存在的情况在患者中占比为26%,比以往使用传统流式细胞术方法高出50%。PRD状态和MRD状态均为PFS的独立预后因素,PRD阳性的风险比为5.1(95%置信区间2.9-8.9;P<0.0001),MRD阳性的风险比为2.4(95%置信区间1.3-4.4;P=0.004)。当对PRD状态进行连续监测时,其结果更具信息价值;持续检测不到PRD的患者,包括从阳性转为阴性的患者,其PFS中位数尚未达到(约90%的患者在4年以上),而任何时间点PRD检测呈阳性的患者PFS中位数为19个月。这些发现在不适合移植NDMM患者队列中得到重现,并在III期PETHEMA/GEM2012MENOS65和GEM2014MAIN试验中得到了前瞻性确认。在后两项试验中,通过NGF检测到138例患者中有16例(11.5%)在维持治疗和/或观察期间存在PRD,其2年PFS为7.5%,而未检测到PRD的患者2年PFS为83%(风险比12.8,95%置信区间6.2-26.4;P<0.001),2年总生存率(OS)分别为86%和100%(风险比18.5,95%置信区间2.0-170;P<0.001)。在包括R-ISS风险类别和CR状态的多变量分析中,只有PRD和MRD对PFS具有独立预后价值,风险比分别为3.4(95%置信区间1.6-7.4;P=0.002)和51.1(95%置信区间6.7-392;P<0.001)
循环游离DNA
基于检测克隆型V(D)J重排或体细胞突变,外周血DNA的NGS可用于来监测PRD,可反映CTCs和/或骨髓瘤细胞来源的循环游离DNA(cfDNA)的存在。在一项多中心、前瞻性、观察性研究中,对接受伊沙佐米、来那度胺和地塞米松统一治疗的RRMM患者进行cfDNA NGS检测,以监测与MM常见的遗传突变。在单变量分析中确定的六个最有价值基因(KRAS、TP53、DIS3、BRAF、NRAS和ATM)中发现的突变总数与较短的PFS相关(无突变、一个突变和两个或更多突变的患者2年PFS分别为57.3%、22.7%和0%),且与临床因素和cfDNA浓度无关。然而,尚不清楚在一线治疗中(残留疾病负担通常较低)是否能通过该方法获得相同的预后价值。
M蛋白
质谱(MS)可识别和定量特定的氨基酸序列以及M蛋白的质荷比(m/z),其检测下限(LOD)超过血清蛋白电泳(0.1 g/dl)和免疫固定电泳(0.05 g/dl)。用于完整免疫球蛋白轻链的MS的定量下限低至0.015 g/dl,而针对患者特异性小克隆型肽段的检测方法可达0.00001–0.00005 g/dl。因此,越来越多的证据表明,质谱比免疫固定电泳更敏感,并且在达到CR的患者中能够提供额外的预后信息。从移植后到维持治疗阶段,MRD与质谱结果之间的一致性逐渐增加,这可能是因为M蛋白的半衰期较长,导致在早期评估中可能出现假阳性结果。当使用更灵敏的质谱方法,特别是针对患者特异性克隆型肽段特征的方法时,这一问题可能更加令人关注。因此,尽管基于患者特异性克隆型肽段的检测方法(如EasyM和M-InSight)比分析完整免疫球蛋白或完整免疫球蛋白轻链的方法(如MASS-FIX和EXENT)更灵敏,但目前尚未就哪种方法更优达成共识。再次强调,质谱检测到的M蛋白动态变化比单次评估更具信息价值。
挑战和机会
持续存在MRD且PRD无法检测的患者,其PFS差于双阴性结果的患者。因此,对于可检测到MRD的患者,PRD无法检测应视为假阴性结果,目前在骨髓中持续存在MRD的患者中,约20%–30%观察到这种情况。希望随着更敏感方法(如通过BloodFlow进行的CTC分析)、多模式PRD评估(例如NGF或BloodFlow联合MS检测)的发展,以及对其他循环肿瘤生物标志物(包括可溶性BCMA)的评估,能够显著减少假阴性PRD结果的发生。如果能够实现,PRD评估有望使MM的治疗疗效监测变得不那么繁琐,并更具动态性。在此之前,骨髓仍然是高灵敏度评估疗效的金标准样本,尤其是在治疗的早期和更强化阶段。
可以假设,在治疗的后期阶段(例如,在维持治疗期间,或者如果患者在观察期),用更频繁的PRD检测来替代部分骨髓穿刺的可能性更大。只有在能够获得额外且有价值的信息时,更频繁地使用PRD检测才是合理的。例如,在对PETHEMA/GEM2012MENOS65和GEM2014MAIN试验的数据进行分析时,通过NGF检测到的PRD的存在有助于识别骨髓可检测MRD的患者中即将发生疾病进展的患者,这表明CTCs的存在反映了治疗耐药,并且可以提供肿瘤失控再生和扩散的早期迹象。因此,在探索骨髓可检测MRD患者进行早期干预的研究中,进一步考虑PRD的生物学意义是值得的。
MRD和PRD检测的算法
鉴于适合移植的NDMM患者的新标准治疗方案的4年PFS约为85%,中位PFS可能达到10年或更久,理想情况的治疗应为固定期限,尤其是对于达到MRD持续无法检测且没有MRD转阳长期风险因素的患者。此外,尽管目前MRD复发尚未视为疾病进展的标准,但根据正在进行的临床试验结果,它可能用作MRD复发时早期挽救干预的触发因素。在这种情况下,需要频繁进行MRD检测,但骨髓穿刺无法在如此长的时间内频繁进行。综合来看,这些因素突显了将骨髓MRD评估与高灵敏度、动态且微创的反应评估相结合的未满足需求,即PRD评估。因此,现在应生成高质量且同质化的数据,以定义未来的PRD反应(和进展)标准。
在此作者提出了一个MRD和PRD评估的算法(图2)。
在治疗的第一年,骨髓穿刺样本的MRD评估应作为标准方法,与现在被接受用于支持MM新治疗方案加速批准的MRD阴性CR终点保持一致。相比之下,在治疗的第一年进行PRD评估的价值可能有限。在这个时期,骨髓可实现高MRD阴性反应率,通过NGF或NGS评估的PRD状态在大多数患者中也是阴性。在这个时期可以考虑使用MS,但需要注意由于M蛋白的长半衰期可能导致的假阳性。对于治疗第一年MRD无法检测的患者,定期(例如,在首次MRD阴性结果后的每24个月)记录该状态的持续性可提供有价值的信息。目前,关于骨髓MRD检测的最佳频率尚无共识,为了避免在较短时间内进行多次骨髓穿刺,建议每两年进行一次骨髓MRD评估,可以与每6个月进行一次的更频繁、微创的外周血PRD评估(使用MS和/或NGF或NGS)相结合。每6个月的持续PRD反应可能与每24个月的骨髓持续MRD阴性相关;而PRD复发将自动意味着持续MRD阴性的丧失,可能无需进行确认性骨髓检测。这种策略可以在每6个月提供具有临床意义的结果,同时不降低生活质量。
当前和未来的MRD反应标准
CR 的当前定义与1998年确定的定义几乎相同,尽管 CR 的预测价值不断受到新方案疗效逐渐提高的挑战,但考虑到 CR 依赖于简单且广泛可用的方法,并且其使用的连续性有助于交叉研究比较,因此当前的 CR 定义在未来的缓解标准中可能保持不变。相比之下,严格意义的 CR(sCR) 的评估仍存在争议,因为定义 CR 患者 sCR 的血清游离轻链标准的预测价值有限,并且该缓解类别可能不会纳入未来的标准中。
2016年 IMWG 疗效标准和 MRD 评估是 MM 的突破。与其他血液恶性肿瘤中使用的标准相比,IMWG不仅提出了 MRD 标准,还定义了实施每个 MRD 标准的参考方法和最小灵敏度阈值。随后,MRD评估更为标准化,并作为终点纳入大多数临床试验和许多医院。此外也确立了在 MM 的临床试验中进行此类评估和报告 MRD 数据的协调国际共识建议。最近将 MRD 阴性 CR 作为支持 MM 治疗加速批准的早期终点,也说明了收集高质量和标准化 MRD 数据的价值。
MM 代表着缓解越深、生存持续时间越长的范例。然而,在实现 CR 且 MRD 阴性方面,结果相互矛盾,因为部分具有持续 M 蛋白的患者(因此不符合 CR 标准)无法检测到MRD,并且在一线治疗中,这些患者通常具有与 MRD 阴性 CR 患者相似的生存结局。相比之下,在接受CAR-T或 T 细胞衔接系统 (TCE) 治疗后未检出 MRD 的 RRMM 患者中,生存结局因 CR 状态而异,如上所述,这可能与该人群中 EMD 的患病率较高有关,而与治疗依赖性效应无关。因此,尽管未来的缓解标准应维持“需要 CR 才能定义 MRD 阴性”的要求,但也应提供灵活性来报告 MRD 阴性缓解率(不考虑CR 状态)。
NGF 和 NGS是 MRD 评估的可互换方法,因为当同时进行时,它们具有统计学显著的一致性和相关性,以及几乎相同的预后价值。NGF 和 NGS 在每个样本中都能达到10-5的最低灵敏度。因此,可以通过将当前定义 MRD 阴性的流式细胞术和 DNA 测序标准合并为单一标准(定义为使用 NGF 或 NGS 试验在骨髓穿刺样本中检测不到MRD,且LOD≥105个有核细胞中至少有一个恶性浆细胞),从而简化未来的 MRD 反应标准。
MRD反应标准的实施
2016年IMWG共识标准关于定义MRD阴性反应的灵敏度阈值存在误解。流式细胞术和测序法定义的MRD阴性均要求在≥10⁵个有核细胞中不存在克隆浆细胞。因此,该标准并不意味着MRD阴性必须仅通过10⁻⁵的灵敏度来确定,也可以使用更高的灵敏度定义。在多发性骨髓瘤患者中,任何水平的持续MRD(例如在10⁻⁶对数范围内)与通过相同方法检测到的MRD无法检测相比,PFS均显著较差。例如,Zabaleta等研究发现,在接受CAR-T细胞和T细胞衔接剂(TCE)治疗后,MRD阳性水平在≥10⁻⁴、≥10⁻⁵至<10⁻⁴或≥2×10⁻⁶至<10⁻⁵的患者中,PFS和OS没有统计学显著差异。因此,从预后角度来看,未来在治疗决策制定中应以尽可能高的检测灵敏度来定义MRD无法检测,对于NGF和NGS来说通常为10⁻⁶对数范围内。不过,将MRD阴性CR作为临床试验的早期终点,应依赖于10⁻⁵的定量阈值,与10⁻⁶灵敏度相比,10⁻⁵灵敏度几乎可以在所有样本中实现,因此可以更可靠地在临床试验的不同组之间以及不同研究之间进行比较。
在临床试验中进行MRD评估时,还需要考虑一些实际问题。首先,必须严格遵循IMWG反应标准,MRD数据应根据上述国际共识建议进行报告。其次,应使用意向治疗人群作为分母来报告MRD无法检测的发生率,并建议根据治疗方案在预设的时间点评估MRD(在CR的基础上),以尽量减少MRD数据缺失。第三,每个时间点获得的第一份骨髓穿刺样本应用于MRD评估,以降低血液稀释的风险,从而避免代表性不足的结果。无论检测的是哪一份骨髓穿刺样本,都应始终分析血液稀释的程度,以避免假阴性结果。实际上,严重血液稀释样本中发现的MRD无法检测不应被计算在内。第四,应根据每个样本中实现的细胞或DNA输入的检测下限(LOD)来定义MRD无法检测;在报告特定队列中MRD无法检测的总体率时,报告的灵敏度阈值(例如10⁻⁵或10⁻⁶)应对应于在>90%样本中实现的LOD。第五,鉴于MRD动态变化比单次评估更具预后价值,持续12个月或24个月的MRD阴性率可能更有助于了解可能成为长期生存者的患者比例,并应常规报告。
MRD阴性CR作为早期替代终点
在MM领域,一种矛盾的情境正在出现。过去20年中获批的19种新药显著延长了患者的生存期,并有望治愈部分患者。幸运的是,我们有众多的药物组合和序贯治疗方案可供选择,以改善患者结局,包括生活质量(QOL)。目前获批或正在研究用于二线及以后治疗的新药,如CAR-T细胞和TCEs,如果与一线治疗方案整合,可能会带来额外的价值。然而随着生存率的提高,临床研究也变得更加复杂,需要更大规模、更复杂的试验以及更长的随访时间来证明治疗效果的改善。因此,迫切需要找到新的替代终点,以可靠地预测生存结局,从而加速新型疗法的临床试验,并优先开发最有前景的治疗方案。人们普遍认为,MRD检测可以在一定程度上满足这一需求。
国际骨髓瘤微小残留病终点审批独立团队(International Independent Team for Endpoint Approval of Myeloma Minimal Residual Disease,i2TEAMM)进行的荟萃分析,以及EVIDENCE和美国食品药品监督管理局(FDA)肿瘤药物咨询委员会(ODAC)的荟萃分析结果均支持,在治疗的第一年达到MRD阴性CR(检测灵敏度达到≥10⁻⁵)可作为MM患者在所有疾病状态下获得显著临床获益的预测指标。
i2TEAMM利用来自20项试验的12926例患者数据,发现MRD阴性与生存结局之间存在非常强的关联。例如,总体比值比显示,在治疗的前9-12个月内至少有一次达到MRD阴性CR的患者,与在该12个月期间未达到MRD阴性CR的患者相比,存活且无疾病进展的可能性高出3-16倍。在10⁻⁵灵敏度水平下,对所有三种疾病的汇总分析中,治疗效果(以MRD阴性CR率表示)与治疗效果(PFS)之间的试验水平相关性显示出令人鼓舞的相关性(R²为0.61-0.70),特别是在NDMM人群中(R²为0.67-0.78);OS也观察到类似结果。
EVIDENCE荟萃分析纳入了涉及4907例NDMM患者的八项研究数据。在12个月时间点,MRD阴性与PFS之间的试验水平关联再次显示出令人鼓舞的结果(R²为0.67-0.84)。对12个月MRD阴性与PFS之间的个体水平关联进行评估,得出总体比值比为4.02(95% CI 2.57-5.46)。EVIDENCE荟萃分析还基于四项研究的数据评估了在RRMM中的相关性,发现12个月MRD阴性与PFS之间的个体水平关联的总体比值比为7.67(95% CI 4.24-11.10)。FDA利用i2TEAMM和EVIDENCE研究中所有患者水平数据进行了额外分析,并报告了类似结果。
基于这三项荟萃分析的结果,2024年4月12日,ODAC以12比0的投票结果认为,现有数据总体上支持将MRD阴性CR作为MM患者新治疗方案加速审批的中间终点。
MRD阴性CR作为临床试验终点
除了上述患者层面和试验层面的相关性外,还有另一个重要考虑因素,即多达的MRD阴性CR率差异幅度可预测PFS显著改善。在一项对15项随机临床试验数据的荟萃分析中,MRD的检测灵敏度报告的最低值为10⁻⁵,对于显示出疾病进展或死亡风险降低>40%(即PFS风险比<0.60)的研究,治疗组间MRD阴性率的中位差异为21%,而对于PFS风险比≥0.60的研究,治疗组间MRD阴性率的差异仅为2.5%。这些发现表明,MRD阴性CR率≥20%的差异可能会转化为PFS的显著改善,但在对未来临床试验的实施达成共识之前,仍需要更好地理解这种关系,以确定一个阈值差异。另一个尚未解决的问题在于预测改善生存结局的MRD阴性CR率的cut-off值,解决这一问题对于单臂试验(例如在RRMM中)具有特别的价值。
从实际角度来看,如果假设NDMM患者的标准治疗4年PFS约为85%,且新疗法与标准治疗相比的PFS目标风险比为0.70(比上述PFS风险比0.6的目标更为保守),那么一个两臂试验在最终分析时需要总共331个PFS事件,才能在90%的power下进行分析;因此,这样的试验需要960例患者,在患者入组开始后的7年(未达到完全powered的中期分析)到12年(完全powered的最终分析)之间得出结果。按照每月入组30例患者的典型试验入组速度,总的研究入组时间将是2.7年。再加上12个月以获得最后一例入组患者的MRD反应结果,从试验开始到MRD阴性CR终点(获益)和安全性(风险)分析的数据截止时间将为3.7年。因此,MRD阴性CR终点可能在理论上比PFS的中期分析提前>3年,比PFS的最终分析提前>8年,为新疗法的临床获益提供可靠的指示。值得注意的是,在这个例子中,试验在报告MRD阴性CR终点时,也会为部分患者提供近4年的安全性数据。
从相反角度说,尽快知道新疗法在MRD阴性CR率方面没有优越疗效也同样重要,因为这一信息可以避免虚假期望,并减少未能超越现有标准治疗的治疗方法的开发成本。另一种可能的应用是设计旨在改善生活质量(例如,不太强化或固定持续时间的治疗)的治疗策略的研究,依靠证明非劣效的MRD阴性CR率,从而期望在长期内显示出类似的PFS。
除了可以用MRD阴性CR终点回答的更传统研究问题(例如,三联与四联方案的比较,大剂量化疗后自体干细胞移植与CAR-T细胞的比较,巩固治疗使用与诱导治疗相同的药物或替代药物,以及更强化与不太强化的维持策略)之外,这一早期终点还有潜在的额外用途,可以解决与患者交叉相关的各种问题。MM新疗法的随机临床试验提供了证据,表明OS终点可能因疾病进展时患者交叉而受到干扰,将MRD阴性CR和PFS作为共同主要终点,可能更可靠地表明新方案是否可能带来OS获益(由于患者交叉,这种获益可能无法在临床试验中正式证明)。
借鉴过去、正在进行和未来的临床试验
由于早期研究中可用检测方法的灵敏度和特异性较低,因此对这些研究中的MRD数据需要细致解读。尽管如此,这些研究还是得出了重要发现,例如MRD每增加一个对数单位与生存结果较差相关(例如,MRD水平分别为≥10%、1%至<10%、0.1%至<1%、0.01%至<0.1%和<0.01%时,中位总生存期OS分别为1年、4年、5.9年、6.8年和>7.5年)。这些早期分析还揭示了诊断时存在高危细胞遗传学与持续MRD在预测CR无法持续方面的互补性。另一个有价值的结果在于,在接受大剂量化疗诱导治疗后进行HSCT且MRD无法检测的患者中,被随机分配到仅观察组的患者比接受维持治疗的患者预后更差,也就是说,基于当时可用检测方法的LOD,以MRD阴性为依据停止治疗会导致PFS更差。
更近期且同样重要的观察结果包括个体患者MRD状态的波动性,以及MRD持续无法检测与长期生存之间的关联。因此,持续的MRD阴性反应可能成为一个有意义的治疗终点,特别是在针对特定问题的单臂研究中。一个例子是治疗高危冒烟型骨髓瘤(SMM)患者,其中干预的期望结果是中位PFS持续时间,但永远不会达到;因此需要中间终点来衡量早期干预预防活动性MM的风险-获益比。高危NDMM是另一个例子:在合理的时间内,MRD持续无法检测的比例可能表明,一种新的试验性方法是否有望改善这一人群的生存结局。
过去和正在进行的临床试验中一个有趣的发现在于,使用不同方案达到MRD阴性反应的患者具有相似的PFS结果,尽管也存在例外情况(下文讨论)。因此,基于一种方案与另一种方案相比实现MRD持续无法检测的可能性,为具体患者量身定制治疗是值得考虑的。例如,对于有合并症且根据衰弱评估预计对四联方案耐受性有限的NDMM患者,可以选择三联方案,因为事先知道使用三联方案实现持续MRD反应的可能性很高。西班牙骨髓瘤研究小组发表了一项概念验证研究,证明使用基于细胞遗传学改变、骨髓和外周血中的基线肿瘤负荷以及免疫生物标志物(即髓系前体细胞、CD45low中性粒细胞、成熟B细胞、嗜酸性粒细胞、CD27⁻CD38⁺T细胞和CD56brightCD27⁻ NK细胞)的机器学习算法,可以在71%的患者中预先预测不同治疗的MRD结果。其他研究小组也证实了MRD持续无法检测的免疫关联(例如,CD4⁺T细胞和调节性T细胞百分比)的重要性。随着大数据和人工智能工具的日益普及,根据实现MRD无法检测的可能性为每位患者选择最佳治疗方案,并在1年内确认预测是否准确,可能很快就会在临床实践中成为现实。
MRD反应是否能够指导治疗持续时间是当前正在临床试验中研究的一个关键问题(图3)。
例如,DRAMMATIC(NCT04071457)和RADAR(ISCRTN46841867)等试验正在探索这一问题。其中,GEM2014MAIN试验是最早设计来探讨这一问题的III期研究之一。该试验中,332例患者随机分配接受来那度胺和地塞米松维持治疗,部分患者联合使用伊沙佐米,治疗持续2年。对于通过NGF检测MRD达到10⁻⁶灵敏度阴性的患者,治疗在2年后停止;而对于MRD可检测的患者,则继续使用来那度胺和地塞米松治疗额外3年。该研究得出了三个重要见解:
首先,MRD阴性患者在停止治疗后4年的PFS为83%,这为固定持续时间治疗提供了新的机会。尽管如此,MRD阴性并不意味着治愈,患者在考虑停止治疗时应被告知仍存在疾病复发的风险。然而,根据停止治疗后4年83%的PFS率,大约75%的患者(如GEM2014MAIN试验中入组的患者)可能拥有超过5年的无治疗间隔,这可能会显著减少临床和经济毒性,提高生活质量,并改善挽救治疗的选择和结果(图3)。在目前缺乏确凿证据的情况下可以假设,一例患者基于深度且持久的 MRD反应停止治疗并在10年后复发,可认为是末线治疗的非难治性疾病。该患者将增加挽救治疗的选择,预期疗效会改善,可能会增加额外的5年PFS。达到>15年的总PFS和较长的无治疗间隔将更接近治愈 MM。
其次,早期疾病复发风险较高的患者停止治疗可能会损害其长期生存的机会(尽管MRD无法检测)。因此,前瞻性识别MRD 缓解无法缓解的高风险患者的策略较为重要,该问题已在 PETHEMA/GEM2012MENOS65 和 GEM2014MAIN 试验数据分析和另一项使用 FORTE 试验数据的研究中得到解决。这两项分析的一致结果表明,ISS 3 期疾病、诊断时外周血总白细胞中CTC > 0.01%、伴随≥2种高危细胞遗传学异常和/或晚期达到MRD无法检测(即,相对于巩固治疗前)的患者MRD 转阳和/或疾病进展的风险更大。该结果与 II 期 MASTER 试验的结果一致,在 II 期 MASTER 试验中,合并≥2种高危细胞遗传学异常的患者在10-5灵敏度下连续两次 MRD 阴性后停止治疗,其结局较差(例如,无细胞遗传学异常亚组和有1个异常亚组从停止治疗进展的2年累积发生率分别为47%和9%)。同样,III期 IFM-2009 试验的数据显示,在灵敏度为10-6且MRD无法检测且仅接受维持治疗1年的患者中,高危细胞遗传学患者的 PFS 远低于标危患者。相比之下,在 PETHEMA/GEM2012MENOS65 试验中,对于接受维持治疗至少2年的NGF 无法检测MRD(10-6)患者,高危细胞遗传学异常的存在对生存结局无统计学显著影响。总之,这些结果表明,仅深度 (<10-6) 和持久(>3年)MRD缓解,随后延长维持治疗以巩固此类缓解,可能转化为高危 MM 患者的生存率显著增加。
另一种预测哪些患者存在MRD转阳风险的方法是提高MRD检测方法的灵敏度。MRD2STOP试验评估了在接受≥1年维持治疗且通过PET-CT确认无疾病以及通过NGF检测MRD阴性且灵敏度至少达到10⁻⁵的患者中停止治疗。此外,还使用EasySep(Stem Cell Technologies,加拿大温哥华)对骨髓穿刺样本进行CD138⁺免疫磁性富集,并采用clonoSEQ分析以达到10⁻⁷的MRD灵敏度。共有47例患者在中位36个月后停止维持治疗,45例可评估患者中有11例(24.4%)出现疾病复发(MRD≥10⁻⁶),其中5例(11.1%)出现临床进展。总体上3年疾病进展和/或MRD复发的累积发生率为30%,但在基线时MRD<10⁻⁷的患者中为20%,而在MRD≥10⁻⁷的患者中为75%(亚分布风险比7.8,95% CI 2.2–27.6;P=0.001)。这些数据表明,在MRD灵敏度<10⁻⁶时停止维持治疗与低疾病复发率相关,且MRD<10⁻⁷可能是一个更优的停止治疗阈值,但还需要进一步验证。
GEM2014MAIN试验的第三个教训在于,使用患者在维持治疗前2年以及巩固和诱导方案中使用过的药物(来那度胺和地塞米松)额外延长3年治疗,并不能克服持续MRD的不良预后;与因MRD无法检测而停止治疗的患者相比,持续MRD的患者PFS更差(4年时为50% vs 83%;风险比0.25,95% CI 0.15–0.43;P<0.0001)。该结果表明,在多年密集且有效的治疗后仍持续存在MRD可视为治疗耐药的标志,可能触发不同药物的新治疗线。与等待临床疾病复发相比,治疗相对较少的MRD有望增加清除耐药克隆的可能性,从而延长生存期。该假设正在许多正在进行的临床试验中进行研究,例如ADVANCE(NCT04268498)、GEM2021MENOS65、MASTER-2(NCT05231629)、PREDATOR(NCT03697655)、RADAR(ISCRTN46841867)和REMNANT(NCT04513639)。
MRD评估在常规临床实践中的问题
越来越多的研究描述了在日常临床实践中进行MRD评估的(积极)经验,以及这种策略如何有助于指导临床决策。然而,MRD在日常实践中的实施仍然存在争议。本文讨论了五个反复出现的质疑MRD效用的论点。
第一个问题是关键问题:在目前没有指南涉及如何使用结果进行个性化治疗的情况下,为什么要评估MRD?这种说法暗示,只应该进行与治疗决策有明确关联的实验室检测,而现实情况是,许多常规检测都是为了描述疾病,从而预测个体患者的预后。鉴于MRD是MM中最有意义的预后因素之一,在达到CR的患者中不评估其状态是难以想象的。尽管如此,许多正在进行的临床试验正在研究MRD作为治疗个体化的生物标志物或作为随机分配到不同治疗方案之前的分层因素(包括DRAMMATIC(NCT04071457)、GEM2017FIT(NCT03742297)、MIDAS(NCT04934475)等),这些试验即将得出结果,希望它们能为如何在日常实践中使用MRD提供关键指导。
第二个问题是关于需要多次骨髓穿刺的担忧。应该从白血病领域的经验中学习,其表明经过充分考虑的骨髓检查通常会得到患者认可。作者认为,MRD评估在MM中的预后价值支持考虑在治疗的前3年至少每年进行一次MRD评估,但也可以根据个体患者的情况进行调整。如上所述,新一代检测方法(包括这些方法的更新版本,其灵敏度在10⁻⁷对数范围内)可用于评估骨髓和外周血MRD,联同质谱和各种影像学方式,有望减少对频繁骨髓穿刺的需求,至少对部分患者和时间点是这样。可以预计,PRD评估的逐步实施将改变对MM的监测方式。
第三个问题是意识到在临床实践中,MRD无法检测的患者的生存结局通常比临床试验中的患者要差,这种不一致性可能反映了两种环境中治疗和方法学的差异。在给定检测方法的LOD以下的“MRD阴性”的深度根据所使用的治疗方案的疗效而变化,而且它越低于LOD,生存期可能就越长。因此,如果在日常实践中不可用临床试验中研究的最有效的治疗方案,那么在这两种环境中MRD不可检测的患者的预后结果存在差异是可以合理预期的。同样的原则也适用于方法学。如果日常实践中可用的MRD方法不如临床试验中使用的方法那样灵敏、特异和标准化,那么在这两种环境中MRD不可检测的患者的生存结局也可能会有所不同。应在日常实践中应用IMWG的MRD评估共识标准,以获得最佳结果。
第四个问题是:如果 MRD无法检测的患者仍然可能疾病复发,为什么还要评估MRD?尽管MRD无法检测并不意味着治愈,但这种反应深度可能反映了肿瘤生物学的整体情况以及对治疗的敏感性,以及患者的特点,特别是对治疗的耐受性(图4)。实际上,MRD反应的多因素性质或可解释为什么MRD状态通常是与细胞遗传学风险或治疗方案无关的最重要预后因素。对于达到CR的患者中,更准确地了解特定治疗的效果应该是评估MRD的充分理由,而且更重要的是,通过MRD反应和动态变化的分析来更好地了解该时间点之后所有后续治疗的效果。如果患者达到CR,那么这种状态不太可能因随后的治疗阶段而改变,因此衡量该治疗的风险-获益比的唯一方法是通过分析MRD反应和动态变化。此外,如上所述,深度和持续的MRD反应可能是部分患者安全停止治疗的生物标志物。
最后,还有一些论点涉及持续存在MRD但仍然获得长生存期的少数患者。尽管部分持续存在MRD的患者可以有长期生存,但这不应掩盖大多数患者疾病进展风险增加的事实。尽管如此,仍应认识到这一观察结果的重要性,特别是关于未来基于MRD的治疗策略可能会过度治疗部分这样的患者的风险。诊断时的新生物标志物,如意义不明的单克隆丙种球蛋白病(MGUS)样特征和不可检测的CTCs,或MRD评估时的生物标志物,如增强的非恶性浆细胞恢复并随后产生免疫球蛋白以及肿瘤监测的免疫特征,可能有助于识别可能有良好结局的MRD阳性患者。新出现的数据还表明,MRD动态变化可能有助于识别一组可检测MRD但MRD水平稳定的患者,其生存结局明显优于可检测且MRD水平增加的患者。如果因持续存在MRD而进行治疗强化成为标准实践,那么对这些生物标志物的进一步研究和基准测试将是至关重要的。
除了这些和其他可以提出的反对MRD评估在日常临床实践中发挥作用的论点之外,MM患者对MRD重要性的认识正在增加,阴性与阳性结果可能会产生功能和生理影响。因此,应该与达到CR的患者讨论评估MRD的获益和注意事项,以促进知情和共同决策。对患者的核心信息在于,尽管MRD无法检测是目标,但持续存在的MRD也是驱动治疗决策的因素。患者还应该理解,尽管MRD无法检测是一个非常有希望的结果,但它并不意味着完全的疾病根除,因为其他解剖部位可能存在隐匿性肿瘤细胞。相比之下,阳性结果表明持续存在疾病,类似于手术后发现肿瘤边缘呈阳性一样,可能有机会修改治疗策略,以根除可能导致疾病复发的残留肿瘤细胞。
至关重要的是,将MRD评估实施到日常临床实践中的道路将需要对相关医疗专业人员进行教育,告知他们何时以及如何进行检测(例如,使用第一次骨髓穿刺物以确保高质量样本),正确解释MRD结果(例如,根据分析的样本类型和达到的检测下限),以及如何根据结果采取行动。治疗决策不应仅基于MRD状态这一单一变量,而应综合考虑所有可能影响生存和生活质量的协变量(图4)。
总结
在MM患者中评估治疗反应主要有三个目标:(1)识别对治疗原发耐药的患者,这些患者疾病进展和生存预后较差的风险极高;(2)根据反应深度细化患者预后;(3)在临床试验中比较不同疗法的有效性。由于目前的治疗方案能够实现非常高的R率,持续存在的MRD可能会取代M蛋白的检测,成为原发耐药的生物标志物。实际上,MRD状态是MM患者最强大的预后因素之一,甚至是最强大的预后因素,其在临床试验中的应用作为终点指标正在迅速扩展。此外,许多研究正在探索MRD在个性化治疗方案中的作用,可以相信,这些研究结果的公布将有助于更好地了解MRD如何改善患者预后和QOL,而MRD和PRD评估的结合可能是实现这一目标的关键。
在日常临床实践中使用MRD和PRD应遵循与临床试验中相同的严格方法学标准,应遵循IMWG指南,并符合体外诊断法规。未能使用最敏感的方法来评估治疗反应会带来高估或低估治疗效果的显著风险,可能导致生存率降低以及成本和不良安全结果的显著增加。理想情况下,检测费用应根据各国的医疗政策,由报销或纳入预算来承担。如果正在进行的临床试验最终证明MRD有助于个性化治疗,那么这种风险适应性策略可能带来的社会经济效益,应有助于在日常实践中为MRD检测提供经济支持。还需要进一步的举措来解决MRD检测成本之外的其他挑战和争议(如BOX 1所述)。例如,应努力整合大型试验和真实世界的数据集,以加速识别与个体患者实现MRD无法检测最高几率相关的治疗方案。如果MRD拦截策略要优于在临床疾病进展时更换治疗方案,优化治疗序贯以克服MRD耐药也将至关重要。此外,还需要付出努力来识别那些可以安全停止治疗的患者,因为他们在接下来的10年内疾病复发的可能性较低。
可以乐观地预计,这些目标中的许多将在本世纪内实现。如果实现,四十年的MRD研究将真正改变MM的临床管理。
参考文献
Paiva, B., Shi, Q., Puig, N. et al. Opportunities and challenges for MRD assessment in the clinical management of multiple myeloma. Nat Rev Clin Oncol (2025). https://doi.org/10.1038/s41571-025-01017-x
- 搜索
-
- 1000℃李寰:先心病肺动脉高压能根治吗?
- 1000℃除了吃药,骨质疏松还能如何治疗?
- 1000℃抱孩子谁不会呢?保护脊柱的抱孩子姿势了解一下
- 1000℃妇科检查有哪些项目?
- 1000℃妇科检查前应做哪些准备?
- 1000℃女性莫名烦躁—不好惹的黄体期
- 1000℃会影响患者智力的癫痫病
- 1000℃治女性盆腔炎的费用是多少?
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)