首页 > 健康资讯/ 正文

【协和医学杂志】睡眠与肺结节恶性风险的多源数据验证研究:问卷、队列与孟德尔随机化证据

来源 2026-06-27 22:01:58 健康资讯

深度解析医学证据,lxfs.net为你支撑决策

肺癌是全球病死率最高的恶性肿瘤[1],其早期症状缺乏特异性[2],临床上相当一部分肺癌病例在体检或影像学检查中以肺结节形式被发现[3],而肺结节良恶性鉴别直接影响后续随访策略与干预时机。归因风险分析显示,在控制吸烟、职业暴露和环境污染等传统肺癌风险因素后[4],个体间风险差异仍较为显著,提示可能存在其他可干预的生活方式相关肺癌影响因素。

睡眠作为重要的可干预行为暴露,与昼夜节律、免疫炎症及代谢稳态密切相关。近年来大量研究显示,异常的睡眠时长和失眠症状可能参与多种肿瘤的发生发展进程[5-6]。然而,既往关于睡眠与肺癌风险的流行病学证据存在异质性。部分研究表明短时间睡眠和失眠可增加肺癌风险[5,7],但也有研究未见此种关联[8-9],这可能与单一研究设计通常难以同时兼顾“现实世界可解释性”与“因果稳健性”有关。因此,确切结论仍需通过多维度研究设计进行交叉印证,以提供高质量证据支持。

本研究以“肺结节恶性风险”为核心临床问题,基于单中心连续入组的肺结节就诊人群,构建可解释的多维睡眠表型,系统评估其与肺结节良恶性结局之间的关联,并在充分控制影像学特征及心理因素后,检验结果的稳健性。鉴于横断面研究在时间序列推断及反向因果方面的固有局限,本研究进一步引入一般人群队列数据及遗传层面的分析,作为探索性补充证据,从不同证据来源对主要发现进行方向性佐证与一致性对照。

1 资料与方法

1.1 研究设计与对象

本研究围绕“睡眠异常与肺癌相关结局”的研究假设,采用多源证据设计:以临床肺结节人群横断面分析为主,并以一般人群队列与遗传流行病学分析作为补充探索,旨在从不同研究设计的偏倚结构出发进行一致性验证。研究内容包括基于肺结节人群的横断面研究、基于一般人群的前瞻性队列研究及基于公开数据库的遗传因果分析(图1)。

图片

图1 研究设计图

PSQI:匹兹堡睡眠质量指数;CHARLS :中国健康与养老追踪调查;MR:孟德尔随机化;LDSC :连锁不平衡评分回归

其中横断面研究对象来源于中国医科大学附属第一医院,该部分研究已通过中国医科大学附属第一医院伦理审查委员会审批(审批号:科伦审〔2024〕2024-591-2),研究对象均签署知情同意书。前瞻性队列研究对象来源于中国健康与养老追踪调查(CHARLS)公开队列(https://charls.charlsdata.com)。遗传因果分析采用孟德尔随机化(MR)及连锁不平衡评分回归(LDSC)两种方法,数据均来源于公开可获得的全基因组关联研究(GWAS)汇总统计数据。后两部分研究无需额外伦理审批及患者知情同意。

1.2 研究方法

1.2.1 横断面研究

横断面研究为单中心、连续入组的观察性研究。以2024年11月至2025年12月中国医科大学附属第一医院胸外科和肿瘤内科就诊、经胸部CT提示肺结节的所有患者为研究对象。对于符合纳入标准者,在门诊就诊阶段进行问卷调查及相关信息收集。

纳入标准:(1)胸部 CT 显示肺结节;(2)年龄≥18 岁;(3)结节大小≤30 mm;(4)可完成问卷调查并签署知情同意。

排除标准:(1)因严重精神或认知障碍导致无法配合调查;(2)研究相关关键信息缺失。

本研究主要采用多因素Logistic回归进行分析,预期肺恶性结节比例约为35%,主模型拟纳入约18个参数。按照每个参数至少需要15个结局事件进行样本量估算,至少需270例肺恶性结节事件,对应的样本总量约为772例。

通过自制问卷收集人口学特征(年龄、性别等)、吸烟、既往肺部疾病史、结节直径。采用中文版匹兹堡睡眠质量指数(PSQI)评估睡眠状况[10]。将不同频率的答案统一归一化记分(0~3分),并按预先定义的规则合并为9个睡眠板块。对于双条目板块,以两条目得分相加形成0~6分的严重度评分;对于单条目板块,为统一量纲,将原始0~3分乘以2缩放至0~6分。鉴于9个板块分别反映睡眠的不同维度,整体上不以追求“高内部一致性”为目标。对于双条目板块,计算条目间Spearman秩相关系数(rS)与Cronbach's α系数以描述内部一致性,对于单条目板块,报告其分布特征,并额外提供板块间的Spearman相关矩阵,用于描述维度结构。

本研究主要统计分析采用多因素Logistic回归,将9个睡眠板块的严重度评分作为连续变量同时纳入模型,报告“每增加1分”所对应的校正后比值比及其95%置信区间(CI)。模型按递进方式控制混杂因素:模型1校正年龄、性别、体质量指数(BMI)、吸烟状态及睡眠总体状况;模型2进一步加入影像学特征;模型3进一步加入焦虑与抑郁评分(其中抑郁评分采用去除睡眠条目的量表版本,以降低因量表条目重叠所带来的共线性与过度校正风险)。主要分析以连续趋势效应作为主要效应指标,剂量-反应分组分析与样条分析则作为探索性补充分析。

肺结节的性质依据病理结果及临床随访综合判定,分为良性组与恶性组。恶性结节均经手术或穿刺病理结果确诊;对于未接受病理取材的病例,若结合影像学表现、临床诊疗过程及随访结果综合评估为良性,则归入良性组。

1.2.2 前瞻性队列研究

前瞻性队列研究在一般人群中开展,数据来源于CHARLS 队列。CHARLS是一项面向我国≥45岁人群的全国代表性纵向队列研究,于2011年完成基线调查,并于2013、2015、2018及2020年进行随访。本研究纳入CHARLS 2011年基线及后续补充入组人群,排除入组时年龄<45岁、基线存在肺癌/肺部恶性肿瘤史及基线睡眠时长缺失者,构建生存分析的随访队列。

主要暴露为基线自报的夜间睡眠时长。鉴于美国国家睡眠基金会建议老年人每天睡眠时间为7~8 h[11],因此本研究将基线睡眠时长分为<6 h、6~8 h和>8 h三组(以6~8 h为参照)。在剂量-反应分析中,将睡眠时长作为连续变量(每增加1 h),并以7 h作为参考点,采用线性模型及限制性立方样条探索睡眠时长与新发肺癌风险之间潜在的非线性关系[12]

主要结局为随访期间新发肺癌。肺癌事件依据受试者或其家属报告“医生诊断为肺癌/肺部恶性肿瘤”,由调查员记录诊断时间;对死亡者收集主要死因信息。随访时间自入组时计算,至首次报告肺癌、死亡、失访或末次随访(以先发生者为准)。协变量包括年龄、性别、受教育程度、居住地(城镇/农村)、吸烟状况(从不/既往/当前)、午睡情况、呼吸系统疾病等。对于存在缺失的协变量,采用链式方程多重插补(MICE)进行处理,并按照Rubin法则合并估计量[13]

为检验结果的稳健性,进行两类敏感性分析:

(1)更新吸烟信息:在±3 年窗口内选取与入组时间最近一次随访记录更新吸烟变量,并对吸烟与受教育程度同时进行多重插补;

(2)2年landmark分析:在上述基础上,排除/延迟计入入组2年内发生的肺癌事件,以减弱反向因果关系的潜在影响。

1.2.3 遗传因果分析

遗传因果分析包括两样本MR和LDSC。两样本MR分析在 R 4.5.1 软件中完成,主要使用 TwoSampleMR(v0.6.22)与 ieugwasr(v1.1.0)提取并协调公开的GWAS汇总统计数据;MR的多效性敏感性分析采用 MRPRESSO(v1.0)[14-15],用于识别和校正工具变量的水平多效性。MR分析主要用于从遗传工具角度评估睡眠相关表型与肺癌风险之间的潜在因果关联,以作为观察性研究结果的补充证据。LDSC分析用于估计睡眠相关表型与肺癌之间的全基因组遗传相关性,从整体遗传结构层面评估二者是否存在共享遗传基础。

暴露变量包括:

(1)失眠/入睡困难(GWAS ID:ukb-b-3957);

(2)睡眠时长(GWAS ID: ukb-a-9)。

结局变量为肺癌全癌种(GWAS ID: ebi-a-GCST90018875)。

MR分析中,工具变量为与暴露因素显著相关的遗传变异位点。工具变量的选择与质控如下:首先,选取与暴露显著相关的遗传变异(P<5×10-8),其次,基于 1000 Genomes 欧洲人群参考面板进行连锁不平衡剪枝(r2<0.001,窗口 10 000 kb),以确保所纳入工具变量之间近似独立;最后,对暴露与结局汇总数据进行等位基因一致性协调,剔除无法可靠判定效应方向的回文位点以降低等位基因错配风险。为降低弱工具变量偏倚风险,进一步计算各工具变量的F统计量。一般认为F>10提示工具变量强度较好、弱工具变量偏倚风险较低;本研究纳入工具变量的F值均>10。

主要分析采用逆方差加权法(IVW),以比值比(OR)及其 95% CI为报告结果。为评估结果稳健性,同时采用MR-Egger 回归、加权中位数法、简单众数法和加权众数法作为补充估计方法[16-18]。若不同方法的效应方向总体一致且未提示明显偏倚,则认为结果具有一定的方向稳定性;若仅IVW方法达到统计学显著水平,而其他替代方法未能提供一致性证据支持,则将结果解释为方向性信号,而非稳健的因果证据。

异质性采用Cochran's Q 统计量进行评估;定向水平多效性通过MR-Egger截距检验(截距显著偏离0提示存在定向多效性);同时采用 MR-PRESSO 全局检验识别潜在的异常位点。进一步进行逐一剔除分析,以评估单一位点对总体效应的影响。

为评估睡眠性状与肺癌在全基因组层面的遗传关联性,采用LDSC进行双变量遗传相关(rg)估计。失眠/入睡困难(GWAS ID:ukb-b-3957)和睡眠时长(GWAS ID: ukb-b-4424)的GWAS汇总统计数据均来源于OpenGWAS数据库;肺癌数据采用IEU OpenGWAS数据库中的肺癌GWAS汇总数据(ebi-a-GCST004748)。

数据处理流程如下:

首先,原始GWAS-VCF(genome-wide association study variant call format)格式文件经bcftools软件进行预处理,仅保留双等位单核苷酸多态性(SNP);

其次,提取效应值、标准误、P值与样本量等必要字段,并整理为LDSC输入格式;再次,使用LDSC提供的 munge_sumstats.py脚本将各性状汇总统计信息统一映射至HapMap3(HM3)参考集合,剔除存在等位基因歧义的位点,以确保不同性状间等位基因方向的一致性。

最后,进行LDSC回归分析时使用欧洲人群连锁不平衡评分与权重文件(eur_w_ld_chr)作为参考(--ref-ld-chr 和 --w-ld-chr),输出遗传相关系数rg及其标准误、P 值,同时关注LDSC截距,以评估系统性偏倚及样本重叠可能带来的影响[19-20]

1.3 统计学处理

采用R和RStudio(version 4.5.1)进行数据处理。计量资料以均数±标准差表示,组间比较采用t 检验;计数资料以频数(百分数)表示,组间比较采用χ2检验。在横断面研究中,以结节良恶性为二分类结局变量,采用多因素Logistic回归模型估计暴露因素与结局之间的关联强度,并计算OR及其95% CI。趋势性检验(P-trend)通过将各分组的中位数代表值作为连续变量纳入回归模型获得。由于同时评估多个睡眠维度及其多种建模形式,存在Ⅰ类错误膨胀风险;因此,本研究将预设的主暴露-主结局检验作为主要推断依据,其余分析结果仅作为探索性呈现。限制性立方样条分析以0分(或指定的参考值)为参照,绘制OR曲线及95% CI带,并同时报告整体关联性及非线性检验P值。

在前瞻性队列研究中,采用Cox比例风险模型估计睡眠时长与肺癌发生风险的关联,结果以风险比(HR)及其95% CI表示[21]。模型构建采用分层递进策略(基于既往文献、临床与流行病学先验知识进行选择):模型0为睡眠分组模型,并按入组年份进行分层;模型1在模型0基础上进一步调整年龄(连续变量)与性别;模型2为主分析模型,在模型1基础上进一步调整吸烟状态、受教育程度等混杂因素,其中缺失值采用多重插补方法处理[22]。所有LDSC预处理及回归分析均基于LDSC v1.0.1、Python 3.10及相关科学计算库(pandas 1.5.3、numpy 1.23.5、scipy 1.10.1)完成。文中所有检验均为双侧检验,以P<0.05为差异具有统计学意义。

2 结果

2.1 横断面研究:失眠/入睡困难与肺恶性结节的关联性

2.1.1 一般临床资料

共纳入肺结节患者800例。其中,恶性组(经病理确诊)288例(36.0%);良性组512例(64.0%),包括经病理证实的良性患者44例及通过临床随访综合判定的良性患者468例。总体人群年龄为(60.31±12.36)岁,女性占比63.1%,BMI为(23.84±3.34)kg/m2

合并慢性呼吸系统疾病者占比32.3%。吸烟史分布:从不吸烟者占比66.6%,既往吸烟者占比15.3%,当前吸烟者占比18.0%。结节直径分层:<6 mm(22.1%)、6~8 mm(17.9%)及>8~30 mm(59.8%)。恶性组和良性组年龄、吸烟史、结节直径差异具有统计学意义(P均<0.05),见表1。

表1 800例肺结节患者一般临床特征

图片

2.1.2 睡眠板块评分的信度、分布特征及相关结构

睡眠相关条目按发生频率进行归一化记分(0~3分),然后依据预先定义的映射规则归为9个睡眠板块并形成0~6 分的板块严重度评分(附录1)。在信度评估方面,对由两条目构成的板块计算条目间Spearman秩相关系数(rS)和Cronbach's α,以评估内部一致性(表2)。

表2 双条目睡眠板块的条目相关与内部一致性(n=800)

图片

结果显示,四个双条目板块的条目间Spearman秩相关系数均为中等水平(rS分布于0.306~0.477),提示同一板块内的两个条目能反映共同的维度,且并非重复提问。单条目板块的分布情况见表3。

表3  单条目睡眠板块严重度分布[n(%)]

图片

其中“催眠药物使用”“其他影响睡眠因素”“疼痛不适”3个板块呈明显的零膨胀现象(0分者占比85.0%~93.2%),若将其按0~6分连续计分方式纳入回归模型,可能导致估计结果不稳定。为此,针对上述零膨胀明显的单条目板块,进行二值化敏感性分析(0分比>0分),以检验主模型对稀疏变量线性建模假设的依赖程度。需强调的是,二值化仅用于提高稀疏变量的建模稳定性,并不改变主分析的预设效应定义。

在将零膨胀现象明显的单条目板块(疼痛不适、其他影响睡眠因素、催眠药物使用)由0~6连续计分改为二值化变量后,失眠症状板块(0~6分连续,每增加1分)的效应量与连续模型基本一致(OR由1.07变为1.06),提示失眠板块的估计结果不依赖于稀疏板块的线性建模假设(附录2)。板块间的Spearman相关矩阵(图2)显示,各板块之间整体呈低至中等程度相关,符合“多维板块”的预期。其中,相关性最强的是“失眠症状”与“夜间起夜”(rS=0.55)。

图片

图2 板块间Spearman相关矩阵

2.1.3 睡眠相关表型与肺结节恶性风险关联性的多因素Logistic回归分析

在将9个睡眠板块严重度评分同时纳入的多因素Logistic回归模型(表4),失眠症状板块严重度与肺结节恶性风险升高呈显著关联;进一步调整影像学特征及焦虑、抑郁评分后,该关联仍保持稳定(充分校正模型:每增加1分,OR=1.147,95% CI:1.034~1.272,P=0.010)。

表4 多因素Logistic回归中9个睡眠板块严重度评分与肺结节良恶性的关联(同时入模)

图片

需注意,将失眠症状板块严重度评分作为连续变量纳入模型时,其与肺结节恶性风险之间存在统计学关联,但不宜将其直接理解为稳定的递增风险梯度。其余睡眠板块与肺结节恶性风险之间未见独立关联。在影像学变量中,结节直径与肺结节恶性风险呈显著相关。为评估同时纳入多变量时的共线性问题,对最终充分校正的模型3中自变量进行方差膨胀因子(VIF)诊断。由于模型3纳入的协变量最多、结构最复杂,因此可作为共线性评估的主要依据。结果显示,各变量的VIF总体处于较低水平(最大值约3.76),未见明显多重共线性,提示模型估计相对稳定(附录3)。

分层分析显示(表5),失眠症状板块严重度与肺结节恶性风险的关联性在大多数亚组中方向一致,但效应强度存在差异:其中在结节直径>8 mm者中关联性更为明显,而结节直径≤8 mm者中未见显著关联;在磨玻璃/部分实性结节中,该关联达统计学意义,而在实性/肿块型结节中未达显著水平。交互分析中,失眠症状板块严重度与吸烟状态的交互项达到名义上统计学显著性(P交互=0.032),提示可能存在效应异质性。鉴于交互分析属于探索性结果,且存在多重比较背景,应谨慎解释;其余分层变量均未见显著交互作用。

表5 失眠症状板块严重度与肺结节恶性风险的分层分析及交互检验

图片

围绕失眠症状板块严重度进一步开展剂量-反应分析。分组比较显示(附录4、附录5),1~2分组相对于0分组结节恶性风险较低,而3~4分组和5~6分组未见结节恶性风险显著升高,整体趋势检验不显著(P=0.227);将失眠严重度作为连续变量纳入模型亦未达统计学显著水平(OR=1.04,95% CI:0.97~1.12,P=0.273)。限制性立方样条分析中,整体关联性与非线性检验均未提示有明确的剂量-反应关系(附录6、附录7)。综上,失眠症状板块严重度与结节恶性风险之间的关系在不同建模方式下并未呈现一致的单调递增模式,提示该关联可能受分布偏态、样本量及残余混杂的影响,需在前瞻性研究中进一步验证。

在仅限严格病理子集的简化敏感性分析中(病理证实的恶性组288例、良性组44例),失眠症状板块与结节恶性风险未见显著关联(校正的OR=0.97,95% CI:0.83~1.13)。考虑到病理良性病例数较少,该结果主要作为补充性的方法学核查。

2.2 前瞻性队列研究:基于 CHARLS队列的睡眠时长与肺癌发生风险分析

在CHARLS队列中,共纳入35 159名年龄≥45岁的参与者(附录8),累计随访时间约8.0×104人年,共观察到96例入组后新发肺癌,粗发病率为1.15/1000人年;全队列中位随访时间为2(0,5)年。以6~8 h睡眠时长作为参照组,短睡眠时长组(<6 h)肺癌风险呈升高趋势(HR=1.45,95% CI:0.55~3.83, P=0.452),但未达统计学显著性水平;长睡眠时长组(>8 h)未见肺癌风险增加(HR=0.82,95% CI:0.50~1.33, P=0.414),见表6。

表6 睡眠时长与新发肺癌风险的Cox比例风险回归分析

图片

将睡眠时长作为连续变量,以7 h为参考水平进行线性剂量-反应分析(图3),结果显示风险曲线整体较为平缓。在约5~6 h区间内,新发肺癌相对风险略高于1;随着睡眠时长增加,肺癌发生风险逐渐下降,其中8~9 h区间内相对风险略低于1。然而,各区间95% CI普遍跨越无效线,提示在本研究的事件数和随访时间条件下,仅能观察到新发肺癌风险随睡眠时长变化略呈“U”形或单调下降趋势,尚难以精细刻画确切的非线性模式。

图片

图3 睡眠时长与肺癌风险的剂量-反应分析(以睡眠时长7 h 为参照)

敏感性分析结果与主分析方向一致(附录9):短睡眠时长组(<6 h)肺癌风险比在不同模型设定下均保持大于1的方向;长睡眠时长组(>8 h)肺癌风险比总体≤1或接近1。总体而言,观察性结果支持“短睡眠时长可能与肺癌风险轻度升高相关”的趋势,而长睡眠时长未显示明确的肺癌风险上升信号。

2.3 遗传因果分析:失眠/入睡困难与肺癌的遗传相关性

如图4A所示,失眠/入睡困难(GWAS ID:ukb-b-3957)共纳入39个独立的遗传工具变量,工具变量强度良好(F 统计量中位数约为39.80,最小值约为29.80)。睡眠时长(GWAS ID: ukb-a-9)共纳入42个独立遗传工具变量,工具变量强度亦良好(F 统计量中位数为33.04,最小值为29.92),提示弱工具变量偏倚风险较低。

图片

图4 失眠/入睡困难、睡眠时长与肺癌遗传相关性的孟德尔随机化分析

A.失眠/入睡困难和睡眠时长与肺癌风险关联的主要MR分析结果

IVW:逆方差加权法;SNP:单核苷酸多态性;MR:同图1

针对失眠/入睡困难,IVW主分析结果显示,遗传预测的失眠/入睡困难与肺癌风险呈正向关联(OR=1.76,95% CI:1.00~3.10,P=0.049)。在敏感性分析中,加权中位数法的效应方向与主分析一致,但未达统计学显著水平(OR=1.33,95% CI:0.61~2.90,P=0.472);MR-Egger估计结果显示此种关联性亦不显著(OR=0.39,95% CI:0.05~3.22,P=0.394)。

简单众数法与加权众数法估计结果总体上也未提示二者具有显著关联(OR=1.22,95% CI:0.27~5.59,P=0.799;OR=1.13,95% CI:0.33~3.84,P=0.849)。基于Cochran's Q检验,未观察到工具变量效应估计之间存在显著异质性(图4B,IVW:Q=32.714,P=0.727;MR-Egger:Q=32.694,P=0.641)。MR-Egger截距检验未提示工具变量存在显著的定向水平多效性(截距=0.026,P=0.436,图4C)。

图片

图片

图4 失眠/入睡困难、睡眠时长与肺癌遗传相关性的孟德尔随机化分析

B.失眠/入睡困难的异质性检验散点图;C.失眠/入睡困难的MR-Egger 截距检验未提示定向水平多效性

IVW:逆方差加权法;SNP:单核苷酸多态性;MR:同图1

对于睡眠时长,IVW 主分析结果显示,遗传预测的长睡眠时长与肺癌风险升高相关(OR=1.61,95% CI:1.02~2.56,P=0.042)。在敏感性分析中,加权中位数法与MR-Egger回归估计的此种关联性方向总体上与IVW一致,但均未达统计学显著水平(OR=1.75,95% CI:0.86~3.56,P=0.124;OR=1.57,95% CI:0.25~9.75,P=0.632)。简单众数法与加权众数法估计结果亦未见二者呈显著关联(OR=1.97,95% CI:0.74~5.29,P=0.185;OR=1.61,95% CI:0.72~3.61,P=0.254)。基于Cochran's Q检验,未观察到工具变量效应估计之间存在显著异质性(图4D,IVW:Q=35.130,P=0.718;MR-Egger:Q=34.501,P=0.639)。MR-Egger 截距检验未提示存在定向水平多效性(截距=-0.018,P=0.469,图4E)。

图片

图4 失眠/入睡困难、睡眠时长与肺癌遗传相关性的孟德尔随机化分析

E.睡眠时长的MR-Egger 截距检验未提示定向水平多效性

IVW:逆方差加权法;SNP:单核苷酸多态性;MR:同图1

逐一剔除分析显示,逐一剔除单个SNP后,失眠/入睡困难(图4F)和睡眠时长(图4G)与肺癌风险之间整体遗传效应估计的方向保持稳定,提示MR主分析观察到的遗传关联结果不太可能由单一位点驱动。

图片

图片

图4 失眠/入睡困难、睡眠时长与肺癌遗传相关性的孟德尔随机化分析

F.失眠/入睡困难的逐一剔除分析,依次剔除单个SNP以检验结果稳健性;G.睡眠时长的逐一剔除分析,依次剔除单个SNP以检验结果稳健性

IVW:逆方差加权法;SNP:单核苷酸多态性;MR:同图1

MR-PRESSO 全局检验提示未见异常位点或显著多效性(P=0.919),因此未进行异常位点校正。综合而言,MR分析在工具变量强度、异质性、多效性和单一位点影响等方面未见明显异常,提示结果具有一定方向稳定性。由于主要显著性来自IVW分析,而替代估计方法未提供一致的统计学支持,因此当前结果更适宜解释为失眠/入睡困难及长睡眠时长与肺癌风险之间存在正向遗传关联信号,而非稳健的因果效应证据。

LDSC分析显示,失眠/入睡困难与肺癌风险之间存在稳定的正向遗传相关:在自由截距模型下,rg=0.096(SE=0.0384,P=0.0128);在约束截距模型下,rg=0.1177(SE=0.0225,P=1.68×10-7)。两种模型设定下方向一致,提示二者可能共享部分遗传基础。相比之下,睡眠时长与肺癌的遗传相关性较弱且不稳定:自由截距模型下呈负向但未达显著水平(rg=-0.054,P=0.150);在约束截距模型中遗传相关系数方向一致(rg=-0.054,P=0.015)。由于不同模型下统计学显著性不一致,提示该关联稳定性有限,仍需谨慎解释。

3 讨论

肺结节是胸部影像学检查中常见的异常表现,其良恶性的准确判断直接关系到后续随访策略的选择、侵入性检查的必要性以及患者的心理负担。除结节大小、密度及边缘特征等传统影像学指标外[21],近年来,越来越多的研究开始关注睡眠障碍等可干预因素在肿瘤发生发展中的潜在作用。既往流行病学研究表明,失眠、短睡眠时长及昼夜节律紊乱可能与多种肿瘤的发生风险升高相关,但现有证据多来源于一般人群,且主要聚焦于肺癌的发病风险[22],针对肺结节人群,特别是围绕肺结节恶性风险分层的研究仍较为有限。与此同时,不同研究中睡眠相关暴露的测量方式、人群构成及统计建模策略存在较大差异[23],导致现有结论尚不一致。关于睡眠相关表型与肺结节恶性风险之间是否存在独立关联,以及该关联是否具有前瞻性证据和遗传学层面的支持,目前仍缺乏系统的研究证据。基于此,本研究整合横断面分析、一般人群前瞻性队列分析及遗传流行病学分析,从多个层面探讨睡眠相关表型与肺结节恶性风险之间的关系,以期为相关机制研究及临床风险管理提供补充依据。

本研究围绕“肺结节恶性风险”这一临床问题展开分析。首先针对肺结节人群进行横断面研究,结果显示在同时纳入9个睡眠相关板块,并控制年龄、性别、BMI及吸烟等混杂因素后,失眠相关症状严重度与结节恶性风险呈正向关联;进一步调整影像学特征及焦虑、抑郁评分后,该关联依然保持稳定。上述结果表明,失眠相关症状可能与肺结节恶性风险存在一定相关性,且该关联不完全由影像学差异或心理因素所解释。

需指出的是,本研究剂量-反应分析未支持失眠症状板块严重度与肺结节恶性风险之间存在明确、稳定的递增关系。分组分析显示,与0分组相比,1~2分组恶性风险反而降低(OR=0.61,95% CI:0.38~0.96,P=0.036),而3~4分组(OR=1.00,95% CI:0.68~1.46,P=0.983)和5~6分组(OR=1.22,95% CI:0.80~1.85,P=0.359)均未达统计学显著水平;基于分组中位数代表值的趋势检验亦未见显著性(P=0.227);将失眠症状板块严重度作为连续变量纳入模型时未达统计学显著水平(OR=1.04,95% CI:0.97~1.12,P=0.273)。

上述结果提示,失眠症状板块严重度与肺结节恶性风险之间并非呈清晰的单调剂量-反应关系,简单的线性假设可能并不成立。考虑到失眠相关暴露主要依赖量表或患者自报信息,上述不一致结果也可能受测量误差、样本波动、分组后信息损失及残余混杂等因素的影响。因此,对失眠症状板块评分的解释应保持谨慎,现阶段更适宜将其视为一种探索性的统计关联信号,而不宜直接外推为可用于临床风险分层的稳定递增指标。

为进一步验证睡眠相关表型与肺结节恶性风险的关联性,本研究整合了基于一般人群的前瞻性队列与遗传流行病学分析作为方向性线索,以期从不同层面提供补充证据。在CHARLS队列中,短睡眠时长(<6 h)组新发肺癌风险呈升高趋势,但受肺癌事件数较少及结局核验方式的限制,估计精度不足,统计学证据较为有限,因此更适合作为睡眠与肺恶性结节风险关系的方向性提示。

遗传流行病学分析则从终生遗传倾向角度提供了补充信息:MR主分析显示,遗传预测的失眠/入睡困难及长睡眠时长与肺癌风险均呈正向关联趋势,但未见明显异质性和定向水平多效性;替代估计方法亦未提供一致的统计学支持,提示结果的稳健性仍受限。LDSC分析提示,失眠/入睡困难与肺癌风险的相关性状之间可能存在一定的共享遗传基础,但遗传相关性本身并不能直接证明二者的因果关系。此外,本研究所用工具变量主要来源于欧洲人群,跨祖源外推存在不确定性。基于上述局限性,本研究将队列分析与遗传分析的结果定位为对横断面发现的补充性线索,而非对肺结节结局的直接验证。

本研究中,不同证据链中“睡眠时长”与肺癌风险的关联性结果并不完全一致[22]。CHARLS队列分析提示短睡眠时长与肺癌风险升高的方向一致,而在长睡眠时长人群中未见明确的肺癌风险升高;在遗传因果推断中,遗传预测的睡眠时长与肺癌风险呈正向关联[24]。笔者认为,此种结果不一致并非意味着其中一方可“否定”另一方,而更可能反映了研究设计、暴露定义、人群背景及方法学假设的差异。

首先,前瞻性队列研究评估的是特定时间点自报睡眠时长这一行为表型与后续肺癌发生风险之间的关系,易受测量误差、行为改变及随访期间暴露改变的影响;而遗传分析反映的是遗传预测的终生睡眠时长倾向,其所代表的暴露内涵与一次性自报的现实行为表型并不等同。

其次,遗传工具主要来自欧洲人群,而CHARLS队列为中国中老年人群,祖源差异及环境暴露差异可能带来效应异质性。

再次,尽管多效性检验未提示明显的定向偏倚,睡眠时长相关遗传变异仍可能与其他行为或代谢表型相关,从而影响对肺癌这一受强环境因素驱动结局的解释[25]

基于上述考虑,本文不再将睡眠时长的遗传结果表述为对队列发现的“验证”,而将其定位为方向性补充线索。未来仍需在样本更大、结局核验更严格的前瞻性研究中,结合更客观的睡眠测量手段,进一步澄清睡眠时长与肺癌相关结局之间的关系[26]

关于潜在机制,既往研究显示睡眠障碍可通过多条生物学通路影响肿瘤相关结局。其一,睡眠不足和睡眠碎片化可引发慢性低度炎症反应并导致免疫监视功能弱化,从而影响肿瘤发生发展相关的微环境[27-28]。其二,昼夜节律紊乱可导致神经内分泌轴持续激活与交感神经兴奋性增强,进而影响细胞增殖、凋亡及损伤修复等关键进程[29]。其三,睡眠异常亦与氧化应激、代谢紊乱等改变相关,可能进一步参与肿瘤相关过程的调控[30]

从临床管理角度出发,基于本研究在肺结节人群中观察到的关联信号,建议在肺结节初诊评估中适度纳入简短的睡眠症状询问,重点关注入睡困难、夜间易醒或早醒等失眠相关表现,并结合结节大小、影像表现、吸烟史及合并呼吸系统疾病等信息构建高风险人群画像。对于合并明显失眠或持续短睡眠时长的患者,建议在遵循现行肺结节管理指南的前提下,加强随访依从性评估与共病管理,并结合戒烟等健康行为干预。干预策略应优先采用循证的非药物措施[27],必要时在专科指导下规范用药。需要强调的是,上述建议旨在优化健康管理与随访流程,其对降低肺结节恶性风险的直接获益尚缺乏因果证据,仍有待进一步研究确认。

本研究存在一些局限性。首先,临床横断面研究基于单中心连续入组人群,其结局构成反映真实世界就诊谱系,而非人群代表性分布,因此可能存在选择偏倚与残余混杂(如焦虑/疼痛、合并症谱系、就诊动机等难以完全量化的因素)[31]。同时,横断面研究主分析的结局事件定义并非完全依据病理结果。由于临床实践中并非所有肺结节患者均接受侵入性取材,部分未取得病理但经临床评估或随访判断为良性的病例被归入良性组,这可能引入一定程度的结局误分风险。尽管文中进行了仅限严格病理子集的简化敏感性分析,但未重复出主分析中的显著关联;鉴于病理良性病例数较少,相关估计的稳定性有限,应谨慎解释。其次,CHARLS队列中肺癌事件数相对有限,导致估计精度不足(置信区间较宽)[32-33]。再次,MR与LDSC分析基于公开的GWAS汇总数据,反映了遗传相关的终生倾向与平均效应。MR分析可能受工具变量多效性、弱工具变量及样本重叠等因素影响[34];且研究所用工具变量主要来源于欧洲人群GWAS,跨祖源外推需审慎[35]。LDSC虽可提示遗传相关性,但不能直接证明因果关系,亦需考虑群体结构等潜在混杂因素[19]。最后,剂量-反应分析未呈现清晰的单调趋势,提示睡眠与肺癌风险的关联模式可能受暴露分布偏态、样本量及未测量因素的影响,应避免过度推断。

综上所述,在肺结节患者中,失眠症状板块与肺结节恶性风险呈现一定相关信号,且在控制影像学特征及心理因素后此种相关性仍保持稳定。前瞻性队列分析与遗传流行病学分析从不同层面提供了方向性补充线索,但其证据强度和结果一致性均有限,尚不足以构成对横断面发现的直接验证。因此,现阶段上述结果更宜作为提示性证据,用于支持进一步实证研究与临床风险管理探索。未来仍需多中心、前瞻性研究,结合更客观的睡眠测量方式及更严格的结局核验手段,以进一步验证失眠表型与肺结节恶性风险之间的关系及其潜在的临床应用价值。

参考文献

[1]Sung H, Ferlay J, Siegel R L, et al. Global cancer statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA Cancer J Clin, 2021, 71(3): 209-249.

[2]王丽爽, 昌国华, 丁晶, 等. 低剂量CT联合三维重建在鉴别肺结节性质中的应用价值[J]. 现代医用影像学, 2025, 34(10): 1841-1844.

[3]谷电雷, 章卫国, 陈山. 术前CT三维重建联合CT引导下医用胶注射定位在肺结节胸腔镜肺段切除术中的应用效果[J]. 临床和实验医学杂志, 2023, 22(12): 1323-1327.

[4]Inoue M, Sawada N, Matsuda T, et al. Attributable causes of cancer in Japan in 2005--systematic assessment to estimate current burden of cancer attributable to known preventable risk factors in Japan[J]. Ann Oncol, 2012, 23(5): 1362-1369.

[5]Yeo B S Y, Koh J H, Shi B Y, et al. The association between sleep quantity, insomnia and lung cancer risk-A systematic review and meta-analysis[J]. Sleep Breath, 2024, 28(6): 2325-2334.

[6]Zhao H, Yin J Y, Yang W S, et al. Sleep duration and cancer risk: a systematic review and meta-analysis of prospective studies[J]. Asian Pac J Cancer Prev, 2013, 14(12): 7509-7515.

[7]Xie J X, Zhu M, Ji M M, et al. Relationships between sleep traits and lung cancer risk: a prospective cohort study in UK Biobank[J]. Sleep, 2021, 44(9): zsab089.

[8]Khawaja O, Petrone A B, Aleem S, et al. Sleep duration and risk of lung cancer in the physicians' health study[J]. Chin J Lung Cancer, 2014, 17(9): 649-655.

[9]Shi T T, Min M, Sun C Y, et al. Does insomnia predict a high risk of cancer? A systematic review and meta-analysis of cohort studies[J]. J Sleep Res, 2020, 29(1): e12876.

[10]Mollayeva T, Thurairajah P, Burton K, et al. The Pittsburgh sleep quality index as a screening tool for sleep dysfunction in clinical and non-clinical samples: A systematic review and meta-analysis[J]. Sleep Med Rev, 2016, 25: 52-73.

[11]Hirshkowitz M, Whiton K, Albert S M, et al. National sleep foundation's updated sleep duration recommendations: final report[J]. Sleep Health, 2015, 1(4): 233-243.

[12]Desquilbet L, Mariotti F. Dose-response analyses using restricted cubic spline functions in public health research[J]. Stat Med, 2010, 29(9): 1037-1057.

[13]Patrician P A. Multiple imputation for missing data[J]. Res Nurs Health, 2002, 25(1): 76-84.

[14]Davey Smith G, Hemani G. Mendelian randomization: genetic anchors for causal inference in epidemiological studies[J]. Hum Mol Genet, 2014, 23(R1): R89-R98.

[15]Burgess S, Scott R A, Timpson N J, et al. Using published data in Mendelian randomization: a blueprint for efficient identification of causal risk factors[J]. Eur J Epidemiol, 2015, 30(7): 543-552.

[16]Bowden J, Davey Smith G, Burgess S. Mendelian randomization with invalid instruments: effect estimation and bias detection through Egger regression[J]. Int J Epidemiol, 2015, 44(2): 512-525.

[17]Bowden J, Davey Smith G, Haycock P C, et al. Consistent estimation in Mendelian randomization with some invalid instruments using a weighted median estimator[J]. Genet Epidemiol, 2016, 40(4): 304-314.

[18]Hartwig F P, Davey Smith G, Bowden J. Robust inference in summary data Mendelian randomization via the zero modal pleiotropy assumption[J]. Int J Epidemiol, 2017, 46(6): 1985-1998.

[19]Bulik-Sullivan B K, Loh P R, Finucane H K, et al. LD Score regression distinguishes confounding from polygenicity in genome-wide association studies[J]. Nat Genet, 2015, 47(3): 291-295.

[20]Bulik-Sullivan B, Finucane H K, Anttila V, et al. An atlas of genetic correlations across human diseases and traits[J]. Nat Genet, 2015, 47(11): 1236-1241.

[21]Glandorf J, Vogel-Claussen J. Incidental pulmonary nodules-current guidelines and management[J]. Rofo, 2024, 196(6): 582-590.

[22]Zhou T, Wang Z C, Qiao C X, et al. Sleep disturbances and the risk of lung cancer: a meta-epidemiological study[J]. BMC Cancer, 2023, 23(1): 884.

[23]Wu J H, Zhuang W T, Xu H J, et al. Investigation on sleep quality and psychological distress in patients with pulmonary nodules[J]. BMC Psychol, 2023, 11(1): 258.

[24]Wang J, Tang H B, Duan Y M, et al. Association between sleep traits and lung cancer: a Mendelian randomization study[J]. J Immunol Res, 2021, 2021: 1893882.

[25]Verbanck M, Chen C Y, Neale B, et al. Detection of widespread horizontal pleiotropy in causal relationships inferred from Mendelian randomization between complex traits and diseases[J]. Nat Genet, 2018, 50(5): 693-698.

[26]Chen Y H, Tan F W, Wei L P, et al. Sleep duration and the risk of cancer: a systematic review and meta-analysis including dose-response relationship[J]. BMC Cancer, 2018, 18(1): 1149.

[27]Lanza G, Mogavero M P, Salemi M, et al. The triad of sleep, immunity, and cancer: a mediating perspective[J]. Cells, 2024, 13(15): 1246.

[28]Huang J, Song P W, Hang K B, et al. Sleep deprivation disturbs immune surveillance and promotes the progression of hepatocellular carcinoma[J]. Front Immunol, 2021, 12: 727959.

[29]Munteanu C, Turti S, Achim L, et al. The relationship between circadian rhythm and cancer disease[J]. Int J Mol Sci, 2024, 25(11): 5846.

[30]Ball L J, Palesh O, Kriegsfeld L J. The pathophysiologic role of disrupted circadian and neuroendocrine rhythms in breast carcinogenesis[J]. Endocr Rev, 2016, 37(5): 450-466.

[31]Vandenbroucke J P, Von Elm E, Altman D G, et al. Strengthening the reporting of observational studies in epidemiology (STROBE): explanation and elaboration[J]. Int J Surg, 2014, 12(12): 1500-1524.

[32]Peduzzi P, Concato J, Feinstein A R, et al. Importance of events per independent variable in proportional hazards regression analysis. Ⅱ. Accuracy and precision of regression estimates[J]. J Clin Epidemiol, 1995, 48(12): 1503-1510.

[33]Riley R D, Snell K I, Ensor J, et al. Minimum sample size for developing a multivariable prediction model: Part Ⅱ-binary and time-to-event outcomes[J]. Stat Med, 2019, 38(7): 1276-1296.

[34]Burgess S, Davey Smith G, Davies N M, et al. Guidelines for performing Mendelian randomization investigations: update for summer 2023[J]. Wellcome Open Res, 2019, 4: 186.

[35]Peterson R E, Kuchenbaecker K, Walters R K, et al. Genome-wide association studies in ancestrally diverse populations: opportunities, methods, pitfalls, and recommendations[J]. Cell, 2019, 179(3): 589-603.

阅读全文

小提示:本篇资讯仅在梅斯医学APP中开放阅读,请扫描二维码直接下载APP

-->

Tags: 【协和医学杂志】睡眠与肺结节恶性风险的多源数据验证研究:问卷、队列与孟德尔随机化证据  

搜索
网站分类
标签列表