首页 > 医疗资讯/ 正文
摘要:目的通过代谢组学分析,探索缺血性卒中(IS)患者血清代谢物及代谢途径的变化,筛选可靠的IS血清代谢标志物。方法前瞻性连续纳入2022年12月1日至2023年12月31日于苏州市相城人民医院神经内科就诊的IS患者作为IS组,并招募同期的健康体检者,经年龄、性别1∶1匹配后作为对照组。收集所有参与者入组时的年龄、性别、身高、体质量指数及血压等基线资料。采集所有参与者禁食8h后的清晨空腹血样本,完成相关血液指标检测,包括血糖、总胆红素、血清肌酐、尿素氮、总胆固醇、三酰甘油、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇。提取两组参与者的血清代谢物,通过超高效液相色谱和串联质谱分离和检测代谢物。将代谢组学分析产生的数据导入Simca-p软件进行分析,通过无监督主成分分析(PCA)和正交偏最小二乘法判别分析(OPLS-DA)判断代谢组学数据的分离程度及实验稳定性。通过Simca-p软件计算出所有代谢物的变量投影影响(VIP)值,以代谢物的VIP值、IS组与对照组代谢物非参数检验的P值和倍数变化(FC)筛选差异代谢物,差异代谢物筛选标准为VIP值≥1.0、FC≥2.0或≤0.5、P<0.05。将筛选出的代谢物名称或化学式通过人类代谢组数据库(HMDB; https: //hmdb. ca/)和PubChem数据库(https: //pubchem. ncbi. nlm. nih. gov/)进行比对,确定代谢物名称及来源,并排除外源性代谢物(药物来源代谢物)。通过代谢组学数据分析和解释的综合网络应用程序MetaboAnalyst 6.0(http://www. metaboanalyst. ca)对差异代谢物行京都基因与基因组百科全书(KEGG)数据比对后行代谢通路富集分析。使用Python构建机器学习模型。采用最小绝对收缩和选择算子(LASSO)回归和随机森林算法筛选能够有效区分IS患者与对照者的差异代谢物。将上述两种算法共同筛选出的差异代谢物纳入极限梯度提升(XGBoost)算法,构建诊断模型。通过受试者工作特征(ROC)曲线进行五折交叉验证,评价模型的诊断效能。采用典型机器学习方法,将人群样本按照30%的验证比例对诊断模型进行内部验证,分为训练集和验证集,评价差异代谢物的诊断稳定性。结果IS组共纳入患者51例,经年龄、性别1∶1匹配后纳入健康对照者51名。(1)两组血清样本共检测出1255种代谢物,其中正离子模式下964种,负离子模式下291种。正、负离子模式下的PCA图显示,IS组与对照组间代谢物存在差异。与对照组相比,IS组在正离子模式下存在260种代谢物表达水平上调和337种代谢物表达水平下调,负离子模式下存在99种代谢物表达水平上调,34种代谢物表达水平下调。(2)在1255种代谢物中筛选出VIP值≥1.0、FC≥2.0或≤0.5且P<0.05的代谢物259种。通过HMDB和PubChem数据库查询并删除药物来源代谢物后,两组在正、负离子模式下共存在差异代谢物220种,其中IS组存在表达水平上调的代谢物119种,表达水平下调的代谢物101种;220种差异代谢物的表达水平在两组间存在明显差异。(3)将IS组与对照组间的差异代谢物在MetaboAnalyst 6.0中完成KEGG数据比对后行代谢通路富集分析,结果显示,正、负离子模式下,共有5条IS相关代谢通路失调,其中表达水平上调的通路为三酰甘油从头生物合成、甘油磷酸穿梭和心磷脂生物合成;表达水平下调的通路为胆汁酸生物合成和甲基组氨酸代谢。(4)LASSO回归分析结果显示,IS组中存在24种显著变化的差异代谢标志物;经随机森林算法筛选出最能够区分IS组与对照组的30种代谢物。通过上述这两种算法的交集,最终获得4种IS代谢标志物,分别为2-((3R)-3-((3R,5S,7S,9S,10S, 13R,14S,17R)-3,7-二羟基-10,13-二甲基十六氢-1H-环戊[a]菲-17-基)丁酰胺基)乙烷-1-磺酸(质荷比971.57129)、精氨酸结合胆酸(质荷比587.37921)、紫胶酸A(质荷比576.01093)和NCGC00380235-01_C32H48O9_beta-D-木吡喃苷,3,17-二羟基螺甾-5,25(27)-二烯-1-基(质荷比559.32648)。2-((3R)-3-((3R,5S,7S, 9S,10S,13R,14S,17R)-3, 7-二羟基-10, 13-二甲基十六氢-1H-环戊[a]菲-17-基)丁酰胺基)乙烷-1-磺酸(质荷比971.57129)、精氨酸结合胆酸(质荷比587.37921)、紫胶酸A(质荷比576.01093)表达水平上调,NCGC00380235-01_C32H48O9_ beta-D-木吡喃苷,3,17-二羟基螺甾-5,25(27)-二烯-1-基(质荷比559.32648)表达水平下调。经XGBoost算法基于4种代谢标志物联合建立IS诊断模型,其在训练集中的ROC曲线下面积(AUC)为1.000(95%CI:1.000~1.000),在验证集中的AUC为0.988(95%CI:0.963~1.000)。结论IS患者存在明显的代谢紊乱,2-((3R)-3-((3R,5S,7S,9S,10S,13R,14S,17R)-3,7-二羟基-10,13-二甲基十六氢-1H-环戊[a]菲-17-基)丁酰胺基)乙烷-1-磺酸(质荷比971.57129)、精氨酸结合胆酸(质荷比587.37921)、紫胶酸A(质荷比576.01093)和NCGC00380235-01_C32H48O9_beta-D-木吡喃苷,3,17-二羟基螺甾-5,25(27)-二烯-1-基(质荷比559.32648)或为有效识别IS患者的差异代谢标志物。
缺血性卒中(ischemic stroke,IS)是最常见的卒中类型,占所有卒中的80%~85%。代谢物是细胞调节的最终产物,能够反映人体的终端代谢。代谢组学可以对生物体内所有小分子代谢物进行定性和定量分析,以展示代谢物与疾病变化之间的关系。目前临床上对IS的诊断主要依靠神经影像学技术。近年来,多项研究显示,代谢组学可以有效实现IS患者的早期筛查和诊断,但不同研究检测出的代谢物并不相同。本研究拟通过对IS患者进行非靶向代谢组学分析,探索能够有效识别早期IS患者的代谢物,为临床建立代谢组学生物标志物高精度诊断模型提供参考。
1 对象与方法
1.1 对象
前瞻性连续纳入2022年12月1日至2023年12月31日于苏州市相城人民医院神经内科就诊的IS患者作为IS组,并招募同期的健康体检者,经年龄、性别1∶1匹配后作为对照组。根据代谢组学重复性要求,每组不少于30例(名)。本研究方案经中国科学院大学宁波市第二医院人体研究伦理委员会审核批准(伦理号:YJ-NBEY-KY-2021-072-01)。所有参与者签署了研究知情同意书。
1.2 纳入与排除标准
IS组纳入标准:(1)年龄≥18岁;(2)符合《中国急性缺血性脑卒中诊治指南2018》中IS的诊断标准;(3)发病12h内,可配合完成研究内容。
IS组排除标准:(1)经影像学检查明确合并出血性卒中及脑部占位病变;(2)存在糖尿病、心房颤动、冠心病、心力衰竭、心肌梗死、心绞痛、慢性肾脏疾病、恶性肿瘤。
对照组纳入标准:(1)年龄≥18岁;(2)经影像学检查无IS且既往无卒中史;(3)可配合完成研究内容。
对照组排除标准:(1)存在糖尿病、心房颤动、冠心病、心力衰竭、心肌梗死、心绞痛、慢性肾脏疾病、恶性肿瘤;(2)孕期、哺乳期女性。
1.3 基线资料收集
收集所有参与者入组时的年龄、性别、身高、体质量指数及血压等基线资料。
1.4 生物样本采集和处理
采集所有参与者禁食8h后的清晨空腹血样本,完成相关血液指标检测,包括血糖、总胆红素、血清肌酐、尿素氮、总胆固醇、三酰甘油、高密度脂蛋白胆固醇、低密度脂蛋白胆固醇。将血液样本置于血清分离管,并在室温下凝固60min,30min内离心10min(1600×g,4℃)以去除不溶性固体,收集每份样本血清并立即储存于-80℃备用。
1.5 代谢组学分析
将血清样本于冰上解冻,应用50%甲醇缓冲液分别提取两组参与者的代谢物。采用120μl预冷的50%甲醇提取20μl样本,涡旋振荡1min,室温下孵育10min离心(4000×g)20min后,取上清液用于样本上机操作。质量控制(quality control,QC)样本制备:提取两组样本各10μl制成混合液。
通过超高效液相色谱和串联质谱分离和检测代谢物。液相色谱分析:采用Vanquish Flex UHPLC系统(Thermo Fisher Scientific,美国)进行色谱分离。应用液相色谱仪ACQUITY UPLC T3色谱柱(100.0mm×2.1mm, 1.8μm; Waters,美国)进行反相分离。柱温箱维持在35℃。流动相由溶剂A(水+0.1%甲酸)和溶剂B(乙腈+0.1%甲酸)组成,流速为0.4ml/min。梯度洗脱条件设定如下:0~0.5min,5%溶剂B; 0.6~7.0min,5%~100%溶剂B; 7.1~7.9min,100%溶剂B; 8.0~8.1min,100%~5%溶剂B; 8.2~10.0min,5%溶剂B。质谱分析:使用高分辨率串联质谱仪Q-Exactive(Thermo Fisher Scientific,美国)检测从色谱柱中洗脱的代谢物。Q-Exactive在正离子和负离子模式下运行,采集质谱数据。
1.6 代谢组学数据及统计学分析
将代谢组学分析产生的数据导入Simca-p软件(11.0版本;Umetrics,瑞典)进行分析。通过无监督主成分分析(principal component analysis, PCA)和正交偏最小二乘法判别分析(orthogonal partial least squares discriminant analysis, OPLS-DA)评估代谢组学数据的分离程度及实验稳定性,组内代谢组学数据紧密聚集表示实验稳定性良好,组间代谢组学数据清晰分离表示两组间存在显著代谢差异。QC样本组内数据紧密靠拢则表示实验稳定性良好,能够有效解释结果。OPLS-DA图中R2Y表示对Y矩阵的解释率,Q2Y代表模型的预测能力,Q2Y值越高,说明模型越稳定可靠,Q2Y≥0.5表示此模型具有较好的可靠性,通过对模型进行200次响应排列测试评估模型的可靠性,其参数包括预测能力和拟合优度,当预测能力的回归曲线在Y轴的截距<0时,表示模型具有可信性。
通过Simca-p软件计算出所有代谢物的变量投影影响(variable impact on projection,VIP)值,以1.0为截断值选择重要代谢物。通过代谢物的VIP值、IS组与健康对照组非参数检验的P值和倍数变化(fold change,FC)筛选差异代谢物。差异代谢物筛选标准为VIP值≥1.0、FC≥2.0或≤0.5且P<0.05。将筛选出的代谢物名称或化学式通过人类代谢组数据库(human metabolome database, HMDB; https://hmdb.ca/)和PubChem数据库(https:// pubchem. ncbi.nlm.nih.gov/)进行比对,确定代谢物名称及来源,并排除外源性代谢物(药物来源代谢物)。通过代谢组学数据分析和解释的综合网络应用程序MetaboAnalyst 6.0(http://www. metaboanalyst. ca)对差异代谢物进行京都基因与基因百科全书(Kyoto encyclopedia of genes and genomes, KEGG)代谢通路富集分析,进一步深入明确失调代谢通路,了解IS患者的代谢变化方向。通过R编程语言(4.1.3版本)对代谢物进行火山图与聚类热图绘制,将代谢物变化情况与聚类情况进行可视化。
通过R编程语言对基线数据进行统计学分析,计量资料采用K-S检验判断其正态性,符合正态分布的计量资料以x-±s表示,组间比较采用t检验;不符合正态分布的计量资料以中位数和四分位数[M(P25,P75)]表示,组间比较采用Wilcoxon秩和检验。计数资料以[例/名(%)]表示,组间比较采用χ2检验。以P<0.05为差异有统计学意义。使用Python(2.0.1版本)编程语言构建机器学习模型。采用最小绝对收缩和选择算子(least absolute shrinkage and selection operator, LASSO)回归和随机森林算法筛选能够有效区分IS患者与健康对照者的差异代谢物。制作LASSO回归图与随机森林重要性点图及两种方法所得的差异代谢物交叉韦恩图,将交叉韦恩图得到的差异代谢物纳入极限梯度提升(extreme gradient boosting, XGBoost)算法,构建诊断模型,通过受试者工作特征(receiver operating characteristic, ROC)曲线进行五折交叉验证,评价模型的诊断效能。通过典型机器学习方法,将入组样本按照30%的验证比例进行内部验证,分为训练集和验证集,测试差异代谢物的诊断稳定性。
2 结果
2.1 基线资料及相关血液指标比较
IS组共纳入患者51例,经年龄、性别1∶1匹配后纳入对照者51名。两组参与者基线资料及相关血液指标情况见表1。
2.2 代谢物失调情况
PCA结果显示,QC样本的散点紧密聚集。
基于液相色谱和质谱分析的代谢物定量检测结果显示,两组样本共检测出1255种代谢物,其中正离子模式下964种,负离子模式下291种。正离子和负离子模式下的PCA图显示,IS组与对照组代谢物存在差异(图1)。火山图分析显示,与对照组相比,IS组在正离子模式下存在260种表达水平上调代谢物和337种表达水平下调代谢物,负离子模式下存在99种表达水平上调代谢物和34种表达水平下调代谢物(图2)。
2.3 代谢物鉴定情况
正、负离子模式下OPLS-DA与200次响应排列测试结果显示,IS组与对照组代谢物存在差异,模型数据稳定性良好(图3)。在1255种代谢物中筛选出VIP值≥1.0、FC≥2.0或≤0.5且P<0.05的代谢物259种。通过HMDB和PubChem数据库查询并删除药物来源代谢物后结果显示,在正、负离子模式下IS组与对照组共存在差异代谢物220种,其中IS组存在表达水平上调的代谢物119种,表达水平下调的代谢物101种。聚类热图显示220种差异代谢物的表达水平在两组间存在明显差异(图4)。
2.4 IS组代谢通路失调情况
将IS组与对照组间的差异代谢物在KEGG数据库中比对进行代谢通路富集分析,结果显示,正、负离子模式下,共有5条IS相关代谢通路失调,其中表达水平上调的通路为三酰甘油从头生物合成、甘油磷酸穿梭和心磷脂生物合成(图5a);表达水平下调的通路包括胆汁酸生物合成和甲基组氨酸代谢(图5b)。
2.5 IS相关生物标志物评估
LASSO回归分析结果显示,IS组中存在24种显著变化的差异代谢标志物(图6a)。经随机森林算法筛选出最能够区分IS组与对照组的30种代谢物(图6b)。通过上述这两种算法的交集,最终获得4种IS代谢标志物(图6c),分别为2-((3R)-3-((3R,5S, 7S,9S,10S,13R,14S,17R)-3, 7-二羟基-10, 13-二甲基十六氢-1H-环戊[a]菲-17-基)丁酰胺基)乙烷-1-磺酸(质荷比971.57129)、精氨酸结合胆酸(质荷比587.37921)、紫胶酸A(质荷比576.01093)和NCGC00380235-01_C32H48O9_beta-D-木吡喃苷,3, 17-二羟基螺甾-5,25(27)-二烯-1-基(质荷比559.32648)。4种IS代谢标志物在IS组及对照组中表达水平的箱线图见图7。其中2-((3R)-3-((3R,5S,7S,9S,10S, 13R,14S,17R)-3,7-二羟基-10,13-二甲基十六氢-1H-环戊[a]菲-17-基)丁酰胺基)乙烷-1-磺酸(质荷比971.57129)、精氨酸结合胆酸、紫胶酸A表达水平上调,NCGC00380235-01_C32H48O9_ beta-D-木吡喃苷,3,17-二羟基螺甾-5,25(27)-二烯-1-基(质荷比559.32648)表达水平下调。采用机器学习XGBoost算法对4种IS代谢标志物进行联合分析,结果显示,基于4种代谢标志物联合建立的模型在71例训练集中对于IS具有良好的诊断性能,ROC曲线下面积(area under the curve,AUC)为1.000(95%CI:1.000~1.000),在30例验证集中的AUC为0.988(95%CI: 0.963~1.000)。见图8。
3 讨论
识别IS患者的代谢物改变,探索精确的代谢标志物具有重要的临床意义。本研究通过非靶向代谢组学识别并注释了IS组和对照组的差异代谢物,并通过MetaboAnalyst 6.0鉴定显示,这些差异代谢物主要与脂质代谢、组氨酸和胆汁酸代谢途径有关。
本研究结果显示,在IS组和对照组中存在220种差异代谢物,其主要富集在与脂质代谢相关的途径。三酰甘油从头生物合成、甘油磷酸穿梭和心磷脂生物合成均在IS患者中表现出代谢水平上调。
三酰甘油从头生物合成是肝脏中一条关键的代谢途径,其表达水平上调可导致高甘油三酯血症,高甘油三酯血症是IS的独立危险因素(HR=1.07,95% CI:1.05~1.09,P<0.01)。甘油磷酸穿梭是细胞质和线粒体之间维持氧化还原平衡和支持脂质合成的重要途径,对腺苷三磷酸的产生十分重要。甘油磷酸穿梭的代谢紊乱可导致腺苷三磷酸生成减少,进而引发神经细胞能量供应不足,进一步加重IS后脑血管缺血-再灌注损伤。心磷脂生物合成对于维持线粒体内膜的完整性和生物能量功能发挥着重要作用,其功能障碍与IS发生后缺血-再灌注损伤引发的神经细胞凋亡密切相关。
胆汁酸生物合成是本次研究中负离子模式下IS患者紊乱程度最严重的代谢途径,其与肝癌、卒中、肥胖、高血压病、糖尿病肾病等疾病的发生、发展密切相关。该代谢途径的紊乱可影响脂质代谢进而引起全身炎症反应。早期对胆汁酸生物合成通路进行干预可能有利于减缓炎症反应,稳定血糖,降低血压,减轻IS患者的脑损伤。甲基组氨酸代谢的紊乱则与肌肉减少症的发生存在相关性,是肌肉量与肌肉功能退化的重要标志。监测该途径的代谢变化或有助于IS患者肢体肌肉功能的预后评估,有利于开展针对性的营养和运动干预,以促进患者康复。
在220种差异代谢物的基础上,本研究进一步明确了4种IS代谢标志物。精氨酸结合胆酸是由胆汁酸与氨基酸精氨酸结合形成的复合物。目前对氨基酸与胆汁酸结合产物的相关研究有限。2023年,Ma等通过表征胆汁酸与包括精氨酸在内的18种常见氨基酸之间的结合,扩展了半经验串联质谱数据库,首次正式合成了精氨酸结合胆酸。但这些结合物与特定疾病的关联尚需进一步研究。
有研究显示,胆汁酸可加重肝脏损伤,并与胆固醇共同促进动脉粥样硬化、脂质过氧化和血脂异常的发展,上述均为IS的重要病理因素。也有研究显示,胆汁酸和L-精氨酸(一种精氨酸螯合物)的结合产物可减轻因胆固醇升高引起的肝损伤,并能够对抗脂质过氧化和高脂饮食引起的细胞损伤。本研究结果显示,精氨酸结合胆酸表达水平在IS组中显著上调,这可能是对缺血事件后细胞损伤和氧化应激的一种代谢适应。精氨酸结合胆酸在IS中的具体作用和机制有待进一步的研究探索。
紫胶酸A是一种天然蒽醌化合物,存在于着色剂紫胶染料中,可用作胭脂红染料的替代品。紫胶酸A对于人群健康具有一定的影响,如皮肤或饮食暴露引起的过敏反应及临床症状,包括唾液分泌过多、唾液腺肿胀和腮腺腺泡细胞弥漫性肥大,并伴有超微结构改变。此外,紫胶酸A已被证明对胎鼠肝细胞具有高度细胞毒性,可能增加γ-谷氨酰转肽酶活性并引起肝脏炎症。另有体外实验表明,紫胶酸A在小鼠骨髓细胞中具有包括染色体断裂在内的致突变性,具有遗传毒性,但该结果仍需要进一步研究以阐明其机制。也有研究显示,紫胶酸A可通过抑制或干扰脱氧核糖核酸甲基转移酶发挥治疗作用,影响肿瘤增殖、细胞侵袭和异常分化,还可以通过降低肿瘤坏死因子α、白细胞介素1β和白细胞介素6等炎性细胞因子的表达减轻胰岛素抵抗。本研究中,紫胶酸A在IS组中表达水平上调,其在IS病理生理中的作用值得进一步研究。
除精氨酸结合胆酸和紫胶酸A外,本研究结果还显示存在另外两种代谢物与IS有相关。这两种代谢物的质荷比分别为971.57129和559.32648,其或可成为识别IS的潜在生物标志物。未来尚需进一步研究以明确其在诊断IS方面的价值。
XGBoost作为新型机器学习手段,相较于既往其他的回归方法(如Logistic回归等)能够更好地对模型进行解释,使诊断模型更加精准、高效。本研究将筛选出的4种IS代谢标志物纳入XGBoost算法建立了1个诊断模型,最终结果显示,该诊断模型在训练集的AUC为1.000(95%CI:1.000~1.000),在验证集的AUC为0.988(95%CI:0.963~1.000),表明4种代谢标志物对IS患者的诊断精确度较高,可有效区分IS人群与正常人群。近期有研究通过Logistic回归方法构建了基于类固醇、皮质醇、孕烯醇酮硫酸盐、三羧酸循环中间体、柠檬酸和苹果酸、氨基酸、脯氨酸、核苷腺苷、鸟苷和肌苷等16种代谢物的IS诊断模型,其AUC为0.92(95%CI:0.86~0.98)。聚焦于IS患者氨基酸代谢变化,基于鸟氨酸、天冬酰胺、缬氨酸、瓜氨酸和半胱氨酸构建的Logistic回归诊断模型的AUC为0.96(95%CI:0.92~0.98)。上述两项研究结果均未进行内部或外部验证。目前尚无明确大脑或血液代谢物被认定为IS生物标志物,本研究结果显示的IS生物标志物或可为IS的代谢组学诊断提供一定的数据参考。
本研究存在一定的局限性:(1)本研究样本量较小,可能会影响结果的普适性;(2)本研究建立的诊断模型仅完成了内部验证,未进一步行外部验证以证实模型的严谨性,可能无法进行普适性的评价;(3)由于疾病进展的复杂性,本研究中的代谢物在IS进展过程中是否持续存在尚不能确定;(4)本研究并未分析中成药对代谢组学的影响,可能导致研究结果存在偏倚。未来研究应尽可能全面地评估内源性和外源性代谢物,以促进针对性诊断标志物的开发。
- 搜索
-
- 1000℃李寰:先心病肺动脉高压能根治吗?
- 1000℃除了吃药,骨质疏松还能如何治疗?
- 1000℃抱孩子谁不会呢?保护脊柱的抱孩子姿势了解一下
- 1000℃妇科检查有哪些项目?
- 1000℃妇科检查前应做哪些准备?
- 1000℃女性莫名烦躁—不好惹的黄体期
- 1000℃会影响患者智力的癫痫病
- 1000℃治女性盆腔炎的费用是多少?
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)