首页 > 医疗资讯/ 正文
不同种类细胞中基因组构象的差异决定了基因表达的特异性,进而决定不同细胞类型的功能差异。长久以来,从原位杂交到高通量检测如Hi-C、micro-C技术,基因组构象检测的实验方法通常耗时耗力、成本高昂且有很强的技术局限性。这些方法极大地限制了这些实验技术在基因组构象研究领域的广泛应用,尤其是研究稀有细胞类型以及需要大规模验证基因组构象调控的因果关系等方面。这些方法的局限性也长期限制三维基因组构象调控领域里的新发现。
2023年1月9日,纽约大学医学院(NYU Grossman School of Medicine)Aristotelis Tsirigos实验室和博德研究所(Broad Institute of MIT and Harvard)夏波实验室合作,在 Nature Biotechnology 期刊发表了题为:Cell type-specific prediction of 3D chromatin organization enables high-throughput in silico genetic screening 的研究论文。
这项研究中,第一作者纽约大学医学院博士生谭济民与夏波博士首先提出了新型多模态机器学习模型 C.Origami 来预测特定细胞类型的染色质构象,并基于遗传筛选的原理提出了全新的高通量计算遗传筛选(in silico genetic screening,ISGS)方法,用以鉴定细胞类型特异性的功能基因组元件,助力发现新的染色质构象调控机理。

研究团队首先构建了应用于基因组数据的新型多模态深度学习框架,Origami,使其能有效地整合DNA序列信息以及细胞特异性的功能基因组信息,进而预测新的基因组信息。通过反复调试及模型训练,研究者发现整合DNA序列、CTCF结合状态、及ATAC-seq信号作为输入信息可以准确地预测染色质构象,并以二维的Hi-C矩阵作为预测输出目标。这一预测染色质构象的模型则被称为——C.Origami。

C.Origami能够准确地预测(de novo prediction)从未接触过的新细胞类型的染色质构象。例如,在IMR-90细胞(肺成纤维细胞)上训练的模型能够准确预测出GM12878细胞(B淋巴细胞)里特定的染色质构象。

结构变异(structural variant)——比如染色体易位——在肿瘤中非常常见,并经常改变染色质相互作用模式,进而可能影响癌基因或抑癌基因的表达。研究这些结构变异对染色质构象及基因表达的影响对理解肿瘤发生和进展的机理有重要作用。这类研究通常需要借助4C-seq或Hi-C等实验来分析结构变异位点的染色质构象,但又往往受限于资源和时间的限制,难以大规模开展。
这项研究中,C.Origami 可以在输入变量中模拟DNA序列的变异,然后预测变异后的癌症基因组中新的染色质相互作用。之前的研究发现T细胞急性淋巴细胞白血病(T-ALL)细胞模型CUTLL1有一个chr7-chr9的染色体易位。通过计算模拟染色体易位变异,C.Origami准确预测了在变异位点的新TAD结构,并检测到从chr9延伸到chr7的‘互动束’(chromatin stripe)结构。

鉴于C.Origami的精准预测效果,并受到反向遗传筛选原理的启发,研究者提出了全新的高通量计算遗传筛选(in silico genetic screening,ISGS)方法,用以系统鉴定细胞类型特异性的功能基因组元件,并助力发现新的染色调控分子。研究者们基于C.Origami模型开发了用于系统性鉴定染色质构象所需的顺式调控元件(cis-regulatory element)的计算遗传筛选ISGS的框架。通过对全基因组1kb分辨率的ISGS,作者分离出对染色质构象有重要影响的顺式调控元件(占约1%的基因组)。这些染色质构象调控序列呈现出对CTCF结合和ATAC-seq信号的不同依赖度。
ISGS框架可以对细胞或疾病特异性的染色质构象进行高通量筛选。研究者在CUTLL1、Jurkat 和正常T细胞中分别进行了ISGS,并发现了一个在 CHD4基因附近的顺式调控元件 (CHD4-insu) 在T-ALL细胞里特异性丢失。筛选结果表明,T-ALL细胞中CHD4-insu的绝缘性缺失可能使CHD4基因建立新的染色质相互作用,进而上调CHD4表达并促进白血病细胞增殖。
ISGS也可以用来系统地发现调控染色质构象的新型反式作用因子(trans-acting factors)。通过对细胞类型特异性的重要调控序列与转录因子结合部位的富集分析,研究者确定了有助于细胞类型特异的基因组构象的调控因子。有意思的是,之前研究发现MAZ可能与CTCF一起调控染色质构象。通过ISGS及转录因子富集分析,作者发现MAZ极大地富集于开放染色质区域,而在CTCF结合的非开放染色质区域仅显示微弱结合。这一结果预示MAZ可能独立于CTCF调节基因组构象。
研究团队在染色质结构预测中看到了结合DNA序列与染色质信息的多模态机器学习模型的巨大潜力。而该模型的底层多模态架构Origami可以推广到其他基因组学数据的应用,例如表观遗传修饰、基因表达、突变功能性筛查等。研究团队预测,未来的基因组学研究将更多的转向使用利用深度学习模型作为工具来进行主要计算遗传筛选,并辅以生物实验验证的新一代高通量研究方法。
论文链接:
https://www.nature.com/articles/s41587-022-01612-8
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)