首页 > 医疗资讯/ 正文
导读
端粒是一种复杂的核蛋白结构,可以区分染色体的自然末端和DNA断裂,并保护基因组的编码区不因染色体末端的不完全复制而丢失。在哺乳动物和植物中,端粒酶的活性在发育过程中受到严格调控,并且仅限于具有高增殖能力的组织。端粒DNA通常由短序列重复的基序组成,从广义上说,这些基序遵循一定的规律。但在真实世界中,端粒的真正差异比最初想象的要多得多。
自发现第一个端粒序列(TTGGGG)以来,已经过去了40多年。期间人们发现了酵母端粒序列的多样性,也建立了主要分类“规范”端粒序列的基本观点。目前,端粒酶数据库和植物rDNA数据库均提供了有关端粒序列多样性的信息。植物rDNA数据库主要关注rDNA及其染色体的位置和排列;相比之下,端粒酶数据库包含植物界以外其他类群的信息。但目前还没有一个数据库可以覆盖关于端粒的所有信息。
为了填补这一空白,来自捷克马萨里克大学等单位的研究团队经过文献检索,并从NCBI数据库中公开可得的NGS数据中进一步搜索潜在的端粒序列,扩大了目前已知端粒序列的物种数量。为了高效利用所有的可用数据,研究团队创建了TeloBase数据库。该数据库包含9000多个物种的端粒序列,不仅提供交互式操作和数据可视化的图形,还允许基于用户的管理,避免了今后数据更新对管理员的过度依赖,以确保数据库更新的及时性。该研究发表在Nucleic Acids Research上,文章题为“TeloBase: a community-curated database of telomere sequences across the tree of life”。

文章发表在Nucleic Acids Research
首先,研究人员使用谷歌学术收集了大量与端粒序列相关的数据,并对相关文献进行了系统的综述。虽然有大量的搜索条目,但其中很多并非同行评议文章。最终,研究团队通过文献检索发现了1619篇相关论文,这比在植物rDNA数据库和端粒酶数据库中引用的文献分别高20和26倍。
为了增加目前已知或预测的端粒序列的物种数量,研究人员在SRA库(NCBI)中存储的原始测序数据中寻找候选端粒数据,利用串联重复查找分析(TRFi),在数据集内增加了136%的物种。相比之下,文献搜索识别出2940个处于实验状态的物种和889个处于模型状态的物种。来自原始数据搜索的另外810个物种与来自文献搜索的结果相匹配。这些额外的数据可以进一步证实和验证已知的序列。通过这两种方法鉴定出的大部分端粒序列属于动物界和植物界。

图1. 数据收集的汇总统计
为了更好地使用该数据集,研究团队开发了数据库TeloBase,包含了9000多个物种的端粒序列。

图2. TeloBase数据库原理图
1.输入数据,即由研究人员新提交或管理员新收集的数据,存储在“端粒数据标签”。每个条目都提供了名称、序列、位置、状态、出版物或NCBI的链接。
2.基于可视化的端粒序列分布在一个各自的分类单元。TeloBase使用户能够以热树图的形式为选定的端粒序列分布着色。由于计算的限制,只绘制了从所选分类名称开始的两个递减分类等级,这一功能有助于分析端粒序列中普遍存在的潜在关联。

图3. TeloBase操作界面图。
3.端粒新序列的应用及序列管理。添加到TeloBase的其他条目不依赖于管理员,任何用户都可以在注册后对提交的条目进行查看后添加。为了加快提交过程,可以根据内部分类信息和外部分类信息的组合自动填写分类信息。TeloBase还自动将输入的序列转换为数据库中已经存在的迭代序列。

图4. 端粒新序列的应用及管理
研究团队利用曲霉属证明了TeloBase的有效性,其中NGS数据分析中具有潜在状态的端粒序列在物种之间显示出潜在的巨大多样性。此外,研究团队在金壳果科科的维管植物中发现了一种新的端粒序列(TTTATTAGGG)。以上结果显示TeloBase为端粒多样性带来了新的见解。
综上所述,该团队从文献和NGS数据搜索中构建了一个相对完整的端粒序列数据集,并在TeloBase数据库中实现应用。TeloBase允许数据的交互操作和可视化,以及对新条目的简单应用和管理。基于这些特征,研究人员认为TeloBase能够为未来端粒序列多样性和端粒进化提供可靠和可行的信息来源,有望带来深入了解,特别是由于可用测序数据的数量不断增加。

图5.TeloBase数据库的内容和功能总结
TeloBase数据库:
http://cfb.ceitec.muni.cz/telobase/
参考资料:
Martin Lyčka., et al. TeloBase: a community-curated database of telomere sequences across the tree of life, Nucleic Acids Research, 2023;, gkad672.
https://academic.oup.com/nar/advance-article/doi/10.1093/nar/gkad672/7246534
- 搜索
-
- 1000℃Nutrients:真实世界数据,纤维肌痛患者的饮食与运动自适应规律
- 1000℃D-二聚体升高诊治与管理专家共识(2026)
- 1000℃专家论坛|文良志:门静脉血栓的诊断和治疗
- 1000℃首例儿童NF2驱动型胸膜间皮瘤,多方法学检测锁定NF2双等位基因失活和14/22号染色体缺失,提示与成人胸膜间皮瘤不同
- 1000℃打破误区:干扰素追求CHB功能性治愈,HBsAg为何“不降反增”?
- 1000℃迷惑性极强的肝内病灶!影像表现疑点重重,最终病理竟查出两种不同肝脏恶性肿瘤
- 1000℃指南共识|原发性肝癌分子靶向药物相关蛋白尿中西医结合诊疗专家共识
- 1000℃Diabetologia:意大利北部社区 1~100 岁人群胰岛自身抗体与乳糜泻 TGA-IgA 的年龄分布及检测方法学验证
- 精J Child Psychol Psychiatry:12种罕见神经发育障碍儿童沟通能力谱系
- 精研究发现:爱吃辣的人,心血管病和癌症死亡风险都会显著降低
- 精Nursing in Critical Care:别再指责护士了!ICU 里被遗漏的护理,根源在系统而非个人
- 精Acta Obstet Gynecol Scand:罕见病女性的妊娠并发症与母婴结局,一项单中心434种罕见病的回顾性队列研究
- 精【爱儿小醉】儿科患者术前对流层臭氧暴露与围手术期呼吸系统不良事件之间的关系:一项单中心回顾性队列研究
- 精eBioMedicine:牙龈下微生物组与脑健康存在连续关联梯度,牙周炎或成认知衰退可干预靶点
- 精军事医学研究院《自然·通讯》:自适应IrPtCu纳米酶水凝胶实现耐药菌感染伤口序贯治疗
- 精能够逆转萎缩性胃炎的两个中成药,该怎么选择?
- 荐Lancet子刊:国产CRVIAAI精准识别胰腺癌血管侵犯,准确率超越资深影像专家
- 荐Pharmacol Res:胃癌耐药的 "双重密码",细胞因子与表观遗传的异常对话
- 荐新一代ICU体系:德尔格持续升级整体解决方案能力,实现更智能、安静、高效的诊疗环境!
- 荐论文解读│经由多组学视角更新法布雷病重要靶器官病理生理机制
- 荐【醉翁之艺】小胶质细胞激活通过CXCL10介导的CD8+T细胞募集促进衰老相关白质退化
- 荐《柳叶刀》重磅:奥瑞珠单抗显著延缓原发进展型多发性硬化老年及重度残疾患者进展
- 荐STTT:派安普利单抗联合化疗为复发转移性鼻咽癌带来持久生存获益
- 荐ASCO 2026:中国领衔LIBRETTO-432研究,塞普替尼引领RET融合阳性非小细胞肺癌早期治疗新突破,降低83%的疾病复发或死亡风险
- 标签列表
-
- 星座 (702)
- 孩子 (526)
- 恋爱 (505)
- 婴儿车 (390)
- 宝宝 (328)
- 狮子座 (313)
- 金牛座 (313)
- 摩羯座 (302)
- 白羊座 (301)
- 天蝎座 (294)
- 巨蟹座 (289)
- 双子座 (289)
- 处女座 (285)
- 天秤座 (276)
- 双鱼座 (268)
- 婴儿 (265)
- 水瓶座 (260)
- 射手座 (239)
- 不完美妈妈 (173)
- 跳槽那些事儿 (168)
- baby (140)
- 女婴 (132)
- 生肖 (129)
- 女儿 (129)
- 民警 (127)
- 狮子 (105)
- NBA (101)
- 家长 (97)
- 怀孕 (95)
- 儿童 (93)
- 交警 (89)
- 孕妇 (77)
- 儿子 (75)
- Angelababy (74)
- 父母 (74)
- 幼儿园 (73)
- 医院 (69)
- 童车 (66)
- 女子 (60)
- 郑州 (58)