厦门免费医学论文发表-揭示了真核生物端粒序列变异的进化基础

2025-06-19

厦门免费医学论文发表-揭示了真核生物端粒序列变异的进化基础

苏尔比·库马瓦特,阿斯汗·沙梅托夫,利亚·瓦列耶娃,朱允河,艾琳·马丁内斯,Dhenugen Logeswaran,陈洪飞,詹恩·考夫兰,朱利安 J.-L.陈袁耀武,詹姆斯·索贝尔,Dal-Hoe Koo,尤金·沙基罗夫,崔在英

发布时间:2025 年 6 月 16 日



抽象

端粒是核蛋白复合物,具有保护染色体末端的关键作用。由于其重要功能,端粒的组成部分,包括其序列,应该受到强大的进化约束。然而,在整个生命之树中,有许多端粒序列变异的例子,驱动这种多样化的进化机制尚不清楚。在这里,我们通过研究非编码端粒酶 RNA (TR) 来研究 Mimulus 中的端粒,TR 是端粒维持复合物的核心成分,决定了真核生物中的端粒序列。我们对 18 个物种进行了从头转录组学和基因组分析,发现 Mimulus 至少进化了三种不同的端粒序列:(AAACCCT)n, (AAACCCG)n和 (AAACCG)n.我们发现了几个具有 TR 重复的物种,这意味着可能影响端粒进化的功能后果。例如,M. lewisii 携带两个序列不同的 TR 旁系同源物,而其姊妹物种旁系同源物已经假基因化。纳米孔测序和荧光原位杂交表明 M. lewisii 具有序列异质端粒,端粒重复扩增方案结合末端限制性片段分析证实端粒酶可以使用两种 TR 旁系同源物进行端粒合成。有趣的是,在密切相关的物种 M. cardinalis,TR 也是重复的,并且两个旁系同源物都表达,但其端粒由单个端粒重复组成。进化分析表明 TR 旁系同源物源于古老的重复,这也是具有不同端粒序列的多个 Mimulus 物种的进化起源的基础。我们提出真核生物端粒中的序列变异源于涉及 TR 复制、序列分歧和 TR 旁系同源物丢失的进化过程。


作者总结

进化生物学中最迷人的现象之一是整个生命树中具有保守功能的分子复合物的快速进化。研究这些复合物为普遍重要的分子系统的功能和进化带来了新的见解。这项研究调查了端粒的进化,端粒是一种保护所有真核生物染色体末端的核蛋白复合物。端粒在基因组稳定性和保护中起着至关重要的作用,因此端粒复合体的组成部分被认为受到强大的进化限制。然而,在植物中,它们的端粒已经进化出了很大范围的序列变异,原因在很大程度上是未知的。在这里,我们展示了 Monkeyflower (Mimulus) 的结果,并提出了一个进化模型来解释为什么植物中的端粒序列会发生变化。我们通过研究长非编码端粒酶 RNA (TR) 来研究端粒的进化,TR 是端粒维持复合物的核心成分,决定了端粒 DNA 序列。我们假设 TR 中涉及转座介导的基因复制的复杂进化变化导致植物物种进化出具有混合重复序列的端粒。


数字

Fig 10Fig 1Fig 2Fig 3Fig 4Fig 5Fig 6Fig 7Fig 8Fig 9Fig 10Fig 1Fig 2Fig 3

   

引文: Kumawat S, Shametov A, Valeeva LR, Ju Y, Martinez I, Logeswaran D, et al. (2025) Monkeyflower (Mimulus) 揭示了真核生物端粒序列变异的进化基础。PLoS 基因 21(6): e1011738。 https://doi.org/10.1371/journal.pgen.1011738


编辑 器: Ian R. Henderson,剑桥大学,大不列颠及北爱尔兰联合王国


收到: 2024 年 4 月 4 日;接受: 2025 年 5 月 20 日;发表: 6月 16, 2025


版权所有: © 2025 Kumawat et al.这是一篇根据知识共享署名许可条款分发的开放获取文章,该许可允许在任何媒体上不受限制地使用、分发和复制,前提是注明原作者和来源。


数据可用性: 原始测序数据(包括总 RNA 转录组 FASTA 文件)已存储在标识符 PRJNA1049363 下的序列读取档案 (SRA) 中。用于下游分析的数据,包括 FASTA 格式的 TR 多序列比对和 NEWICK 格式的系统发育关系树,存放在 Zenodo (doi:10.5281/zenodo.10266656)。本研究中使用的生物信息学脚本和命令可在我们的 github 存储库中找到:https://github.com/jychoilab/Mimulus_TR_evolution。


资金: 这项工作得到了美国国家科学基金会 (https://www.nsf.gov/) 的资助,奖励编号为 IOS-2204729 和美国国立卫生研究院 (https://www.nigms.nih.gov/) R35GM154595、堪萨斯州 INBRE P20 GM103418 和 P30 GM145499 JY 国家科学基金会MCB2046798 JL 的支持。C. 美国国立卫生研究院国家普通医学科学研究所 R01GM127402 至 EVS资助者在研究设计、数据收集和分析、发表决定或手稿准备方面没有任何作用


利益争夺: 作者已声明不存在相互竞争的利益。


介绍

所有线性真核染色体的末端都需要特别注意。由于 DNA 复制是一个半保守的过程,因此在没有任何干预的情况下,染色体末端会随着每一轮 DNA 复制而逐渐被侵蚀(即末端复制问题)[1,2]。此外,裸露的染色体末端会触发细胞中的 DNA 损伤反应,并导致细胞衰老和染色体融合等有害后果 [3]。为了抵消这些高度有害的基因组不稳定性,染色体末端被一种称为端粒的核蛋白复合物覆盖。端粒由富含 TG 的微卫星 DNA 序列 [4] 组成,这些序列由端粒酶维持,端粒酶是一种核糖核蛋白酶复合物,可确保染色体末端的正确复制 [5]。其他专门的端粒结合蛋白也与端粒结合,并保护染色体末端不被检测为受损的 DNA [6,7]。


所有具有线性染色体的真核生物都需要端粒来获得适当的染色体末端保护 [8]。由于这一关键功能,端粒被认为受到强大的进化限制并且对分子变化有抵抗力。例如,所有脊椎动物都有一个相同的端粒重复基序 TTAGGG,它在染色体末端多次出现 [我们用核苷酸序列 TTAGGG 在染色体末端重复 n 次来象征端粒结构,如 (TTAGGG)n] [这些数据表明,对于脊椎动物来说,强大的净化选择阻止了端粒序列的进化变化。然而,在整个生命之树中,脊椎动物只是进化上的例外,因为有许多动物谱系已经进化出新的端粒序列类型。例如,线虫已经进化 (TTAGGC)n和 (TTAGAC)n端粒 [10] 不同于 (TTAGGG)n脊椎动物端粒。在昆虫中,在Dipetera类群中观察到端粒序列的高周转率[11,12],而在其他无脊椎动物中,例如蜘蛛[13],端粒序列结构是未知的。真菌还以其端粒序列的多样性而闻名,其中重复序列的内容和长度在许多真菌谱系中变化很大[14]。


在整个植物界中,端粒也显示出多种端粒重复序列[4,15]。拟南芥是第一个将其端粒序列解码为 (TTTAGGG) 的植物物种n [16] 及其与动物端粒序列的相似性(仅单个核苷酸变化)表明 (TTTAGGG)n是植物中可能的祖先端粒序列。随后的研究显示,许多植物物种也具有相同的拟南芥型端粒序列[17]。但也存在多个植物谱系偏离拟南芥型端粒重复,共有序列可分为三大类型:(1) 胸腺嘧啶或鸟嘌呤核苷酸的延伸或收缩 [例如,(TTAGGG)n在天门冬科 [18],(TTTTTTAGGG)n在秀丽隐杆线虫 [Solanaceae] [19], (AATGGGGGG) 中n在 Cyanidioschyzon merolae [Cyanidiaceae] [20]]中,(2) 插入或取代非胸腺嘧啶或鸟嘌呤核苷酸 [例如,(TTCAGG)n和 (TTTCAGG)n在 Genlisea [21]] 中,以及 (3) 与拟南芥型序列的较大变化,相似性最小 [例如,(CTCGGTTATGGG)n在 Allium [22]] 中。还有一些完整的植物分支(例如,Aquifoliales 和 Boraginales)完全失去了拟南芥型端粒重复 [17],这表明端粒的序列转换通常发生在植物界内。


许多动植物谱系中端粒重复序列的显着多样性表明,真核生物端粒序列变异可能存在共同的进化机制。但是,真核生物端粒进化涉及哪些进化过程在很大程度上是一个悬而未决的问题。这个问题可以通过研究端粒酶来部分回答,端粒酶的作用是维持端粒并在染色体末端合成端粒 DNA。端粒酶由两个主要成分组成(分子模型见图 1):1) 合成端粒 DNA 序列的端粒酶逆转录酶 (TERT) 和 2) 端粒酶 RNA (TR) 亚基,这是一种长链非编码 RNA 基因,在 DNA 合成过程中用作模板 [23,24]。从进化上讲,TERT 在真核生物界中是一种基本保守的蛋白质 [25]。另一方面,TR 是一个快速进化的序列,在真核生物分支中表现出其大小、序列和结构的多样性 [4]。这种显著的序列多样性是TR的一个特征,因此基于简单核苷酸BLAST的方法很难确定TR序列的正交,即使在密切相关的属的物种之间也是如此[26–29]。这种水平的序列多样性对于许多已知正在快速进化的长链非编码RNA基因也很常见[30,31]。


thumbnail下载:

PPT的PowerPoint 幻灯片

PNG放大图片

国际电影节原始图像

图 1. Mimulus 端粒酶活性周期的假设模型。


图改编自 [32],活动模型基于 [33]。该模型的一个主要总结是 TR 模板序列(紫色字母)决定了端粒 DNA 序列(红色字母)的合成,因此可以研究 TR 序列进化以了解端粒序列进化的生物学基础。核心端粒酶核糖核蛋白复合物由 TERT 和 TR 组成,其功能是用物种特异性端粒 DNA 序列延伸染色体末端。TR 模板区域包含两个序列,即退火序列(蓝绿色字母)和模板序列(紫色字母)。TR 退火序列与端粒 DNA 的 3' 单链末端形成 DNA/RNA 双链体。然后,使用 TR 模板序列作为指导,TERT 蛋白使用逆转录将脱氧核糖核苷酸合成到端粒 DNA 的 3' 端(红色字母)。到达模板序列的末端后,DNA/RNA 双链体分离,TR 模板结构域滑过并与端粒 DNA 重新退火,为下一轮端粒重复合成打开模板序列。我们在这项研究中发现的可变端粒 DNA 序列在 TR 模板序列区域形成的 DNA/RNA 双链体中突出显示为放大的字母。


https://doi.org/10.1371/journal.pgen.1011738.g001


TR 还包含高度保守的区域,这些区域参与将一级序列折叠成高级二级结构 [27, 34],并与 TERT 相互作用以获得适当的端粒酶活性 [27,35–38]。其中一个保守区域对应于模板结构域,并包含两个直接参与端粒 DNA 合成的序列基序(参见图 1 的 TERT-TR 活性模型摘要)。第一个基序是与单链端粒 DNA 结合的退火序列(图 1 蓝绿色序列),第二个基序是模板序列(图 1 紫色序列),作为 TERT 合成端粒 DNA 序列的模板 [39]。由于 TR 模板序列决定了在染色体末端合成的端粒重复序列,因此 TR 是深入了解真核生物端粒序列变异背后的进化过程的关键。例如,过去对动物和植物的研究发现,进化出不同端粒序列的谱系也在TR模板序列中进化出相同的变化[27\u201229,34,40]。此外,TR 序列的进化变化预示着与 TR 分子物理或遗传相互作用的蛋白质也可能发生协同进化变化。为了验证这一预测,真菌研究利用了强大的酵母遗传系统,发现具有非经典端粒重复序列的物种也进化出了新的端粒结合蛋白(例如Rap1和Taz1)[14]。


很明显,TR 中的序列变化是新型端粒重复序列进化的基础,但仍然神秘的是 TR 模板序列是如何从其祖先端粒重复进化成新的重复序列的。这是一个令人费解的问题,因为 TR 模板序列中的突变将产生系统性后果,其中每个端粒复制事件都会受到突变模板序列的影响。突变TR模板序列的研究观察到影响端粒酶活性的异常后果,包括异常的端粒延伸速率[41,42]和端粒酶卡顿,导致端粒末端合成的序列不正确[43]。突变模板序列的适应性结果很少被测试[44],但考虑到端粒的关键功能,TR模板序列中出现的突变可能对大多数生物体有害。这也反驳了遗传漂变可能导致端粒序列多样性的假设。那么,在 TR 模板序列中产生遗传变异并最终产生真核端粒序列变异的进化过程是什么?


我们对 TR 和端粒进化的进化理解主要源于专注于不同系统发育分支物种之间端粒序列变化的研究。虽然这些比较对于调查遥远分类群的端粒序列变化是富有成效的,但深层进化尺度阻碍了参与端粒序列进化的精细尺度进化过程的建立。换句话说,有必要进行研究来检查端粒序列分化的密切相关物种(最好来自同一属)的端粒进化。这种方法可以 “捕捉到行为中的进化”,并提供对从一种端粒重复类型过渡到另一种端粒重复类型所涉及的进化过程的见解。在这项研究中,我们通过研究 Mimulus sensu lato 属的端粒来研究端粒序列变异的进化基础 [45,46]。Mimulus是一种流行的生态学和进化生物学研究系统,为适应和物种形成的遗传学和生态学提供了关键的基础见解[47,48]。我们的研究结果提供了一种进化机制来解释 Mimulus 中的端粒序列周转,并且随着最近发现跨多个植物谱系的 TR 复制 [49],我们的进化模型可以解释可能适用于所有真核端粒的序列周转。


结果与讨论

基因组分析揭示了 Mimulus 物种之间的端粒序列变异。

该项目最初的动机是试图表征 Mimulus 物种之间的端粒长度变化。在我们之前的研究中[50],我们使用计算方法k-Seek [51,52]来计算原始未定位全基因组测序读长中的k-mer重复次数,并使用端粒重复k-mer计数作为一种高度准确的方法来估计单个植物内的端粒重复次数。我们使用 k-Seek 分析了来自三个不同部分(即形态分组)的 Mimulus 物种的已发表全基因组重测序数据:来自 Diplacus 部分的 M. aurantiacus [53]、来自 Simiolus 部分的 M. guttatus [54] 和来自 Erythranthe 部分的 M. verbenaceus [55]。最近的系统发育分析表明,Mimulus属[56]是多系的,分类学修订将这些重点物种分为不同的属,即Diplacus和Erythranthe [45]。然而,根据 Phrymaceae 的其他最新工作,我们选择保留 Mimulus 这个名字的使用,因为它具有历史意义和可识别性(见 [46])。


我们使用群体基因组数据分析了 Mimulus 物种,以量化每个物种的多个基因型的 k-mer 计数(按基因组覆盖率标准化)的自然变化(M. aurantiacus 为 n = 43,M. guttatus 为 n = 228,M. verbenaceus 为 n = 54)。最初,我们预计 Mimulus 物种之间的端粒不会有任何序列变化,因此尝试使用 k-mer 丰度作为量化端粒长度变化的近似值。请注意,对于 M. aurantiacus,种群基因组数据来自六个密切相关的亚种,为了方便起见,我们将其统称为 M. aurantiacus,仅用于 k-mer 分析,重要的是,我们的 k-mer 结果不取决于潜在的亚种分类。结果显示,对于所有三个物种,大多数大尺寸的 k-mer (k > 3) 的丰度相对较低(每 1 ×基因组覆盖率 ~100 个拷贝),表明全基因组串联重复变异主要是由小尺寸的 1-、2-或 3-mer 驱动的(S1 图)。但在 M. aurantiacus(图 2)中,k-mer AAACCCT 对于大尺寸的 k-mer 具有相当大的丰度(每 1 ×基因组覆盖率 ~13,190 个拷贝),并且该序列对应于经典的拟南芥型端粒重复序列(注意 AAACCCT 是 TTTAGGG [即 CCCTAAA] 的反向互补的偏移,后跟串联重复)。


thumbnail下载:

PPT的PowerPoint 幻灯片

PNG放大图片

国际电影节原始图像

图 2. 基于 K-mer 的基因组测序分析确定了三种 Mimulus 物种的候选端粒序列重复的变化。


对于每个物种,只有类似于端粒序列的前三个 k-mer 的丰度以 log10 刻度显示。这三个物种之间的系统发育关系及其分化时间如下所示 [57]。在一个物种中,最丰富的 k-mer 被假设为物种端粒序列,而其他两个 k-mer 可能是低丰度的间质重复序列。请注意,在 k-mer 重复序列中观察到的变异性既代表自然变异,也代表潜在的测量或测序错误。


https://doi.org/10.1371/journal.pgen.1011738.g002


k-Seek 方法无法区分 k-mer 重复序列的来源基因组位置。由于在染色体末端之外发现了间质端粒序列[58],我们采用了一个独立的数据集来检查AAACCCT k-mer是否位于末端并与端粒重复序列相对应。我们分析了从亚种 puniceus 测序的 M. aurantiacus 染色体水平参考基因组组装 [53],并专注于组装染色体末端的序列以识别端粒重复基序。k-mer AAACCCT 的染色体末端丰富(S2 图),证实 M. aurantiacus ssp. puniceus 具有经典的拟南芥型端粒序列。


另一方面,M. guttatus 和 M. verbenaceus 的基因组测序 k-mer 分析未检测到 AAACCCT 是最丰富的 7 聚体重复序列(图 2)。事实上,AAACCCT 在 M. guttatus 中几乎不存在,而在 M. verbenaceus 中的丰度相对较低。这表明 M. guttatus 和 M. verbenaceus 的端粒序列基序发生了变化。为了鉴定替代端粒基序,我们搜索了与拟南芥型端粒序列相似且在原始基因组测序数据中具有高丰度的 k-mer。在 M. guttatus 中,k-mer AAACCCG 7-mer 的丰度最高 (每 1 × 基因组覆盖率 ~645 个拷贝),而这种 k-mer 在 M. aurantiacus 和 M. verbenaceus 中基本不存在。同时,在 M. verbenaceus 中没有高丰度的 7 聚体序列,但 6 聚体 AAACCG 特别丰富 (每 1 × 基因组覆盖率 ~6,070 个拷贝)。此外,这种 k-mer 在 M. aurantiacus 和 M. guttatus 中基本不存在。


为了研究两个 k-mer AAACCCG 和 AAACCG 是否对应于端粒重复,我们分析了 M. guttatus 和 M. verbenaceus 的染色体水平参考基因组组装。我们专注于染色体末端的序列,发现 M. guttatus 组装体在 AAACCCG 重复序列中富集,而马鞭草 M. verbenaceus 组装体在 AAACCG 重复序列中富集(S2 图)。这些数据表明,来自 M. guttatus 和 M. verbenaceus 原始基因组测序数据(图 2)的大量 k-mer 类似于端粒样重复序列,可能与这些物种的真实端粒序列相对应。


用参考基因组注释 Mimulus 物种中的端粒酶 RNA 基因

我们的 k-mer 分析表明,Mimulus 属的端粒序列至少发生了两次变化 (即 AAACCCT、AAACCCG、AAACCG)。为了验证这一观察结果,我们研究了 Mimulus TR 基因的进化。TR 中的模板序列决定了端粒 DNA 序列(图 1),因此通过研究 TR 基因的进化,我们旨在更深入地了解 Mimulus 属的端粒序列进化。


我们首先用参考基因组 (M. aurantiacus ssp. puniceus, M. cardinalis, M. guttatus, M. lewisii, M. parishii, 和 M. verbenaceus) 分析了 Mimulus 物种,以鉴定 TR 基因。Mimulus cardinalis、M. lewisii 和 M. parishii 是我们的 k-mer 分析中未分析的物种,属于 Erythranthe 部分,其中包括我们的 k-mer 分析中包含的 M. verbenaceus(图 2)。对于每个参考基因组,我们使用位置权重矩阵 [59] 和基于二级结构的算法 [60] 来搜索和注释 TR 基因位置(基因组坐标见 S1 表)。已鉴定的TR基因大小在278 bp至317 bp之间,与植物界中发现的其他TR大小相似(范围为234-390 bp)[27,28]。在 TR 注释过程中,我们还获得了一个有趣的结果,其中来自 M. aurantiacus ssp. puniceus、M. cardinalis 和 M. lewisii 的参考基因组有证据证明存在两个独立的 TR 基因旁系同源物。这一有趣的发现和这些 TR 重复体的演变将在后面的部分中进一步讨论。


为了检查注释的 TR 的潜在功能,我们在 TR 转录本的预测起始位点上游 100 bp 处提取,以寻找保守调节元件的存在。以前的研究发现,陆地植物TR的上游遗传区包含一个高度保守的III型启动子基序,称为上游序列元件(USE)和一个TATA盒基序[28,61]。我们所有的候选 TRs,包括重复的 TRs,在上游区域内都有经典的 USE 基序 TCCCACAT(S3 图)。该序列与在所有调查的 Lamiales 物种中发现的 USE 基序相同 [28]。一个例外是 M. cardinalis,其 TR 重复项之一在保守的 USE 基序中有一个核苷酸替换 (TCCCACGT;核苷酸差异以粗体表示),我们用 Sanger 测序验证了这种核苷酸变化。对于所有候选 TR 序列,我们还发现了 USE 基序下游 28-30 bp 处的 TATA 框(S3 图)。总之,高度保守的转录起始序列的存在表明我们注释的 TRs 很可能被表达。


通过多个 Mimulus 物种的总 RNA 转录组鉴定端粒酶 RNA

我们的目标是通过从头转录组学从多个 Mimulus 物种中获得 TR 序列,并从总 RNA 库中组装 TR 转录本。我们选择了 3 个不同的 Mimulus 物种 (M. aurantiacus ssp. puniceus、M. guttatus 和 M. verbenaceus),并从成熟叶、根和花分生组织中提取的总 RNA 合成 cDNA,并进行 RT-PCR 分析。先前的研究发现,TR 在具有活跃分裂细胞的植物组织中高表达 [27,61],我们还在所有三种 Mimulus 物种的花分生组织中检测到 TR 基因的表达(图 3A)。当使用原始总 RNA 进行 RT-PCR 实验时,我们观察到没有 PCR 条带(S4 图),表明 RT-PCR 阳性条带并非源自基因组 DNA 污染。还有一些证据表明 TR 在主要由分化细胞 (根和成熟叶) 组成的其他组织中表达。


thumbnail下载:

PPT的PowerPoint 幻灯片

PNG放大图片

国际电影节原始图像

图 3. 模拟端粒酶 RNA (TR) 基因的分子进化分析。


(A) RT-PCR 结果扩增了三种组织(根、成熟叶和花分生组织)的 RNA 提取产生的 cDNA 上的 TR 转录本。基因组 DNA 的 PCR 显示为阳性对照。(B) 由 18 个 Mimulus 物种/亚种组装的整个 TR 序列的系统发育。序列来自总 RNA 转录组测序或通过注释来自参考基因组 (即 M. aurantiacus ssp. puniceus、M. cardinalis、M. parishii 和 M. verbenaceus) 的 TR 序列。支持 bootstrap >95% 的节点用红色圆圈表示。系统发育组根据三个 Mimulus 部分进行着色。箭头指向 M. cardinalis 和 M. lewisii TR 重复。蓝色箭头表示 TR1,红色箭头表示 TR2。(C) TR 模板区域的对齐(参见图 1 关于端粒 DNA 合成过程中模板序列参与端粒酶复合物的情况)。序列根据 (B) 的配色方案高亮显示。基于模板序列,Diplacus 部分将合成 TTTAGGG 端粒重复序列,Simiolus 部分将合成 TTTCGGG 端粒重复序列。在 Erythranthe 部分,所有物种都将合成一个 TTTCGG 端粒重复序列。然而,由于除了 TR1 之外,M. cardinalis 和 M. lewisii 还具有具有 TTTCGGG 模板序列的 TR2,因此这两个物种都可能具有潜在的序列异质端粒序列(但参见图 4 了解红衣主教分枝杆菌和 M. lewisii TR 复制对端粒序列的影响的结果)。


https://doi.org/10.1371/journal.pgen.1011738.g003


根据 RT-PCR 结果,我们靶向花分生组织进行总 RNA 转录组测序,目标是在多个 Mimulus 物种中组装 TR 序列。我们检查了来自 16 个 Mimulus 物种/亚种的花分生组织转录组,其中包括来自 Diplacus 部分的 8 个(亚)种(M. aurantiacus ssp. aridus、M. aurantiacus ssp. aurantiacus、M. aurantiacus ssp. calycinus、M. clevelandii、M. aurantiacus ssp. grandiflorus、M. aurantiacus ssp. longiflorus、红花生态型 M. aurantiacus ssp. puniceus,和黄色花生态型 aurantiacus ssp. M. puniceus),来自 Simiolus 部分的 7 个(亚)种(M. decorus、M. glaucescens、沿海多年生 M. guttatus、内陆多年生 M. guttatus、内陆一年生 M. guttatus、M. nasutus 和 M. tilingii),以及来自 Erythranthe 的 1 个物种部分 (M. lewisii)。我们还从参考基因组(在 S1 表中列出)中获取了注释的 TR 序列,总共有 19 个(亚)物种(参见 S2 表)可用于下游分析的 TR 序列。


在质量控制修剪测序读数后,我们使用 trinity 管道 [62] 进行从头转录组组装。重叠群 N50 范围为 617-2619 bp,组装的转录本数量范围为 117,776-266,437 (S3 表)。计算 BUSCO 分数,范围为 26.4-70.4%。这些低 BUSCO 评分可能与我们基于总 RNA 的测序策略有关。我们耗尽了 rRNA,但省略了多聚腺苷酸化转录物选择步骤,以富集非编码 RNA 序列,例如 TR,但这并不能控制大量未多聚腺苷酸化的细胞器(叶绿体和线粒体)转录本 [63]。因此,核基因转录本可能采样不足,可能导致编码序列的组装不理想。尽管存在这一限制,我们还是采用了从头转录组组装,并使用来自参考基因组组装的 TR 基因注释,基于 BLAST 的核苷酸相似性分析能够从 15 个测序转录组中识别出 TR 直系同源物(没有成功鉴定出内陆多年生 M. guttatus的 TR)。最后,我们从转录组数据中确定了 15 个 Mimulus 物种的 TR 序列,以及从基因组组装中注释的 3 个 Mimulus 物种(M. cardinalis、M. parishii 和 M. verbenaceus)的额外 TR 序列,总共 18 个独特的 Mimulus 物种。


端粒酶 RNA 基因已在几种 Mimiulus 物种中复制。

Mimulus TR 序列用 MUSCLE [64] 彼此比对,多序列比对用于构建基于最大似然的系统发育树来推断进化关系(图 3B)。该树对按 Mimulus 部分对物种进行分组的内部节点具有很高的 bootstrap 支持(1,000 次 bootstrap 重复后 >99%),并且部分之间的内部分支长度很深。该系统发育证据表明,来自不同部分的物种的 TR 序列之间存在很大的核苷酸差异。这在 TR 基因的多序列比对中也很明显(S5 图),它显示了 Mimulus 切片之间大小不一的几个插入和缺失(插入缺失)。


在对 TR 基因进行基因组注释和基于转录组的分析过程中,我们发现 TR 基因在几种 Mimulus 物种(M. aurantiacus ssp. puniceus、M. cardinalis 和 M. lewisii)中重复。然后,我们将分析重点放在 Mimulus TR 旁系同源物上,以了解复制事件的进化起源。


在 M. aurantiacus ssp. puniceus 中,参考基因组包含两个 TR 基因拷贝,但我们来自每个 Diplacus 物种的从头组装显示只有一个 TR 基因的证据。我们将来自 M. aurantiacus ssp. puniceus 参考基因组的两个 TR 拷贝随机命名为 TR1 和 TR2。在 M. aurantiacus ssp. puniceus TR1 和 TR2 序列之间的 244 个对齐碱基对中,有 11 个核苷酸差异和一个仅在 TR2 中发现的 50 bp 插入(S5 图)。我们研究了来自参考基因组的 M. aurantiacus ssp. puniceus TR1 和 TR2 与 Diplacus 部分 TR 的其余部分之间的系统发育关系,但 bootstrap 支持太低,无法做出任何可信的进化推断(图 3B)。这表明 M. aurantiacus ssp. puniceus 中可能的 TR 重复是最近的进化起源。此外,我们的 RT-PCR 结果(图 3A)仅检测到单个条带的存在,并且鉴于来自参考基因组的 M. aurantiacus ssp. puniceus TR1 和 TR2 基因的大小相差 50 bp,如果两个基因都表达,我们预计会看到两个条带。然而,单个 TR 条带的存在表明可能只有一个 TR 旁系同源物被表达。


M. cardinalis 和 M. lewisii 是另一对物种,它们的参考基因组组装有两个 TR 基因注释。对于 M. lewisii,我们进行了总 RNA 转录组学分析,我们能够从头组装两个 TR 基因,表明两个 TR 旁系同源物在 M. lewisii 花分生组织中表达。有很强的系统发育支持 (1,000 次 bootstrap 重复后 >95%),按旁系同源物而不是物种对 TR 进行分组。我们将与 M. parishii 和 M. verbenaceus 归为一组的 TR 旁系同源物命名为 TR1,而仅在 M. cardinalis 和 M. lewisii 中发现的重复项为 TR2。由于 TR1 及其直系同源物在所有四个 Erythranthe 物种中都被发现,因此 TR1 旁系同源物被假设为祖先副本(参见后面的系统发育外群分析,进一步表明 TR1 是祖先旁系同源物),而 TR2 被认为是最近衍生的副本。分隔 TR1 和 TR2 的分支长度较深。在 M. lewisii TR1 和 TR2 之间有 241 个碱基对与 31 个核苷酸差异对齐,而在 M. cardinalis TR1 和 TR2 之间有 251 个碱基对与 33 个核苷酸差异对齐。TR1 和 TR2 之间的分化时间估计为 ~ 930 万年前,这比 M. cardinalis 和 M. lewisii 之间的物种分化时间(550 万年前)要早 [57]。


Mimulus 家族端粒序列进化

TR 基因中的功能域(即保守区域)[27] 在 Mimulus TR 多序列比对中基本保守(S5 图),然后我们将分析重点放在 TR 模板结构域上,因为它决定了端粒序列(图 1)。在模板结构域内,所有 Mimulus 物种的退火序列都是相同的,并且对应于核苷酸 AACC。鉴于退火序列对于端粒 DNA 和 TR RNA 序列之间的正确模板移动和双链结合至关重要,因此预计退火序列将保持保守。但模板序列包含核苷酸差异,特别是来自不同部分的 Mimulus 物种之间的差异。我们发现所有 Diplacus 切片物种都具有模板序列 AACCCTA,所有 Simiolus 切片物种都具有模板序列 AACCCGA,在 Erythranthe 切片中,具有 TR1 直系同源物的物种具有模板序列 AACCGA(图 3C)。


总之,我们的结果表明 Mimulus 属的端粒序列基序至少有两次突变变化。同一部分的物种具有相同的端粒序列基序,但不同部分的物种之间存在端粒序列基序的变化,表明进化变化发生在每个部分的共同祖先中。基于这些进化变化,我们提出了一种端粒序列进化的单步突变模型来解释 Mimulus 端粒内的遗传变异。端粒序列基序 AAACCCT 是植物中最常见的序列,因此它很可能是 Mimulus 中的祖先端粒序列,因此存在于 Diplacus 部分物种中。然后,单个核苷酸变化将祖先序列转换为 Simiolus 和 Erythranthe 切片的共同祖先中的 AAACCCG。随后在 Erythranthe 切片中,单个核苷酸缺失导致 AAACCG 端粒序列的形成。在真菌中也提出了类似的进化模型(即称为分步模型),其中祖先端粒序列的渐进变化导致酵母端粒重复序列的多样性 [14]。重要的是,这种情况表明,一个共同的进化机制或约束可能是所有真核生物端粒上端粒序列变化的基础。该模型还预测,随着端粒序列的分化,端粒结合蛋白将表现出互补的进化变化,正如之前提出的那样[65]。对端粒蛋白-DNA 复合物中的这种协同进化特征的进一步详细分析将是一项有趣的未来研究。


M. lewisii TR 复制导致序列异质端粒

接下来,我们检查了具有 TR 重复的 Mimulus 物种中的模板结构域。如果 TR 旁系同源物之间的模板序列表现出自然遗传变异,这可能导致该物种携带具有混合重复基序(即异质序列结构)的端粒。对于来自 M. aurantiacus ssp. puniceus 参考基因组的 TR 序列,TR1 和 TR2 旁系同源物具有相同的模板序列。但在 M. cardinalis 和 M. lewisii 中,两个 TR 旁系同源物在模板序列上有所不同。TR1 旁系同源物具有模板序列 AACCGA,而 TR2 旁系同源物具有模板序列 AACCCGA。这一观察结果表明,M. cardinalis 和 M. lewisii 可能合成了一个具有由 AAACCG 和 AAACCCG 重复序列组成的异质序列的端粒。


我们首先对三种不同组织 (根、成熟叶和花分生组织) 中的重复基因进行 RT-PCR,研究了 M. cardinalis 和 M. lewisii TR 重复基因的可能功能。我们首先比较了 M. cardinalis 和 M. lewisii 中 TR 基因的表达谱,它们与 M. parishii 和 M. verbenaceus 有 TR 重复,它们也属于同一个 Erythranthe 部分,但没有 TR 重复。马鞭草 TR 表达谱和端粒序列基序分析如图 2 、 3 和 S2 所示;和 M. parishii 与 M. verbenaceus 的结果相同(图 4 底部和 S6)。总之,M. parishii 和 M. verbenaceus 合成了一个单一的基序端粒序列 (AAACCG)n来自其单拷贝 TR 基因。


thumbnail下载:

PPT的PowerPoint 幻灯片

PNG放大图片

国际电影节原始图像

图 4. Erythranthe 切片端粒酶 RNA (TR) 基因复制及其与端粒序列的关联。


来自三个组织(根、成熟叶和花分生组织)的端粒序列丰度(上图)和来自三个组织(根、成熟叶和花分生组织)的端粒序列丰度(下图)显示为 (A) M. lewisii、(B) M. cardinalis和 (C) M. parishii 的阳性对照。总 RNA 的 RT-PCR 结果见 S6 图。注 M. verbenaceus 也是来自 Erythranthe 部分的一个物种,其结果已经显示在图 3A 和 S2 中,并在很大程度上证实了 M. parishii 的结果。


https://doi.org/10.1371/journal.pgen.1011738.g004


对于 M. cardinalis 和 M. lewisii,TR1 和 TR2 在多个组织中表达(图 4 底部),在花分生组织中表达特别相关,花分生组织含有丰富的活跃分裂细胞。M. cardinalis 和 M. lewisii 之间相似的 TR 基因表达谱表明,这两个物种可能具有具有异质序列结构的端粒。我们通过量化 M. cardinalis 和 M. lewisii 染色体水平参考基因组组装染色体末端的端粒重复基序来研究这种可能性,发现这两个物种具有对比鲜明的端粒序列。在 M. cardinalis 中,仅在染色体末端发现 AAACCG 序列,而在 M. lewisii 中,AAACCG 和 AAACCCG 序列都存在于末端染色体位置(图 4 顶部)。M.cardinalis 的这一结果与 TR1 是端粒酶利用的唯一 RNA 亚基的情况一致,而 TR2 虽然表达,但不会促进端粒重复合成,因此在功能上仍然无效


M. lewisii 有一个序列异质端粒,由两个端粒重复组成。

鉴于 M. lewisii 染色体水平的基因组组装表明染色体末端同时存在 AAACCG 和 AAACCCG 重复序列,我们使用 Oxford 纳米孔测序平台对 M. lewisii 端粒结构进行了详细检查。这使我们能够提取和分析跨越整个端粒-亚端粒区域的长读长序列。我们对 M. lewisii 及其两个密切相关的物种 M. cardinalis 和 M. verbenaceus 进行了纳米孔测序,并生成了 1.11 Gbp、0.74 Gbp 和 1.66 Gbp 的测序数据,其中包括 M. cardinalis、M. lewisii 和 M. verbenaceus 的 15,990,860 个读数、10,699,772 个读数和 24,581,417 个读数(更多测序信息见 S4 表)。


我们将测序文库与其物种特异性参考基因组匹配,提取长度超过 10 kbp 的读数并将它们与染色体末端对齐。对于这三个物种,与端粒区域对齐的纳米孔长读长总数分别为 82、102 和 126 个读长,红衣支原体、刘易斯分枝杆菌和马鞭草分枝杆菌的中位读长分别为 24,995 bp、22,733 bp 和 20,784 bp(图 5A)。然后,我们从端粒序列的起点(即,在染色体起点或终点,取决于染色体的臂)开始进行滑动窗口分析,并检查 6 聚体 AAACCG 或 7 聚体 AAACCCG 重复序列的分布和数量。由于与纳米孔读长相关的预期测序错误 [66],计数完全匹配的 6 聚体或 7 聚体端粒重复序列会低估测序读长中的端粒重复数。相反,对原始端粒读数的视觉分析表明,每个物种在 CC(及其补体 GG)和 CCC(及其补体 GGG)重复的数量上都有显着差异(S7 图)。前者可能代表 6 聚体重复序列,而后者代表 7 聚体重复序列。


thumbnail下载:

PPT的PowerPoint 幻灯片

PNG放大图片

国际电影节原始图像

图 5. 选定 Erythranthe 切片物种中端粒的纳米孔长读长测序。


(A) 密度图显示了与染色体末端对齐的测序读数的长度。仅分析长度超过 10 kbp 的读数。垂直线显示的平均读长,M. cardinalis为 28,627 bp,M. lewisii 为 28,744 bp,M. verbenaceus 为 23,402 bp。(B) 对红衣支原体、刘易斯分枝杆菌和马鞭草分枝杆菌计数 CC/GG 和 CCC/GGG 重复的 500 bp 滑动窗口分析。红色星号表示 CC/GG 重复计数显著减少(Mann-Whitney U 检验 p 值< 0.05)的窗口。(C) CCC/GGG 重复计数的总和,直至 3,000 bp 窗口。显著差异(Mann-Whitney U 检验 p 值< 0.05)用黑色星号表示。


https://doi.org/10.1371/journal.pgen.1011738.g005


对每个端粒读数进行 500 bp 窗口滑动窗口分析,并在窗口内计算 CC/GG 和 CCC/GGG 重复序列的总数(图 5B)。结果显示,对于所有三个物种,CC/GG 重复序列是所有三个物种中最丰富的类型 (每个窗口 ~58 计数),表明 6 聚体 AAACCG 是主要的端粒重复序列。这一发现与我们基于参考基因组的分析结果一致(图 4)。此外,与 M. cardinalis 和 M. verbenaceus 相比,M. lewisii 的 CCC/GGG 重复计数显着更高(图 5B 和 5C;Mann-Whitney U 检验 p 值 < 0.05)。值得注意的是,CCC/GGG 重复计数在整个窗口上升高,并上升到候选端粒-亚端粒边界区域(图 5B)。这表明 6 聚体和 7 聚体重复序列散布在整个 M. lewisii 端粒中。


然后,我们测试了 CC/GG 重复计数显着减少的窗口,以检测对应于端粒-亚端粒边界的区域。在 M. cardinalis 和 M. verbenaceus 中,它被映射到 2,500 bp 的窗口,而在 M. lewisii 中,它要大得多,对应于 3,000 bp 的窗口(图 5B,在 Mann-Whitney U 检验 p 值< 0.05 后确定显着减少)。这表明 M. lewisii 的端粒可能比 M. cardinalis 和 M. verbenaceus 长 20%。我们通过对红衣支原体、马鞭草分枝杆菌和刘易斯分枝杆菌 DNA 进行末端限制性片段 (TRF) 分析,验证了我们从基因组测序数据中得出的端粒长度估计值。在用 Tru1I 限制性蛋白酶对所有 3 个物种的基因组 DNA 进行限制性消化后,我们首先将膜与 32P 标记的探针杂交以靶向 AAACCG 重复序列(图 6A,左图)。该探针与来自所有物种的消化 DNA 样品杂交,证实了我们的预测,即 AAACCG 重复序列普遍存在于所有测试的 Mimulus 物种的染色体末端。此外,使用WALTER软件[67]对TRF信号进行定量分析表明,M. lewisii的平均端粒长度(3,511 bp)比M. cardinalis和M. verbenaceus(分别为2,543 bp和2,594 bp)长1,000 bp(图6B,双尾Student's t-t预计 p 值 < 0.01)。这一发现进一步证实了我们从纳米孔长读长测序中获得的端粒长度估计(图 5B)。


thumbnail下载:

PPT的PowerPoint 幻灯片

PNG放大图片

国际电影节原始图像

图 6. M. cardinalis、M. verbenaceus 和 M. lewisii DNA 的末端限制性片段 (TRF) 分析。


(A) 来自 M. cardinalis (n = 3)、M. verbenaceus (n = 3) 和 M. lewisii (n = 4) 物种的 DNA 样品的 TRF Southern 印迹,这些物种与 AAACCG 特异性探针杂交(左图)或在剥离为 AAACCCG 特异性探针后再杂交(右图)。显示了分子量 DNA 标记物(以 kb 为单位)。(B) (A) 中每种基因型 ≥3 个生物学重复中的端粒长度(平均 TRF)分布显示在箱线图中。数据点表示与 AAACCG 探针杂交后用 WALTER 分析的相应物种(生物重复)的单个植物的平均 TRF 值。须线表示最大值到最小值;方框代表下四分位数和上四分位数(25 和 75%);水平线表示平均 TRF 值的中位数。** 表示双尾学生 t-t est后 p 值<显著差异为 0.01。


https://doi.org/10.1371/journal.pgen.1011738.g006


为了测试三种 Mimulus 物种的染色体上是否存在 AAACCCG 端粒重复序列,我们然后剥离了 AAACCG 特异性探针(S8 图)并将膜与 AAACCCG 特异性探针重新杂交(图 6A,右图)。值得注意的是,AAACCCG 特异性探针与 M. lewisii DNA 的杂交效果相同,表明该 Mimulus 物种中的染色体含有 AAACCG 和 AAACCCG 端粒重复序列的混合物。此外,马鞭草分枝杆菌 DNA 中几乎没有 AAACCCG 特异性探针的信号,这证实了我们之前的预测,即该物种的端粒由 AAACCG 重复序列独特组成(图 2)。最后,我们还在该物种中检测到与 AAACCG 探针相比,红衣主教 DNA 的 AAACCCG 特异性信号要弱得多。这一观察结果与 M. cardinalis 染色体上存在非常少量的 AAACCCG 端粒重复一致。


总体而言,我们使用 AAACCG 和 AAACCCG 特异性探针的 TRF 分析证实,M. lewisii 在测试的 Mimulus 物种中是独一无二的,因为它可以互换使用两种类型的端粒模板(来自两个不同的 TR 分子),并且它的端粒明显长于其他两种分析的 Mimulus 物种(双尾学生 t 检验 p 值< 0.01)(图 6B).这些实验测量与我们之前获得的基于基因组测序的估计值非常相似(M. lewisii 为 ~3,000 bp,而 M. cardinalis 和 M. verbenaceus 为 ~2,500 bp)。


然后使用荧光原位杂交 (FISH) 实验对纳米孔测序结果和 TRF 数据进行额外验证,以标记 M. lewisii 染色体的端粒重复序列,并将其与其他 Mimulus 物种进行比较。我们使用 AAACCG 探针或 AAACCCG 探针标记 Mimulus 物种的端粒,并在中期染色体上杂交(图 7)。最初,我们在马鞭草和古塔图斯的染色体传播上杂交探针,因为这两个物种似乎都有一个端粒重复变异(图 2),使我们能够测试探针的特异性。结果显示,在马鞭草中,AAACCG 探针与染色体末端杂交,但 AAACCCG 探针没有显示任何信号(图 7 左图)。相反,对于 M. guttatus,AAACCCG 探针与染色体末端杂交,但 AAACCG 探针没有显示任何信号(图 7 中图)。这表明 AAACCG 探针和 AAACCCG 探针具有特异性,并与匹配探针序列的相应端粒杂交。然而,在 M. lewisii 中,两种探针都在染色体末端检测到,进一步证实了在这个 Mimulus 物种中,端粒由两种不同重复序列的混合物组成(图 7 右图)。


thumbnail下载:

PPT的PowerPoint 幻灯片

PNG放大图片

国际电影节原始图像

图 7. 使用 (A) AAACCG 探针或 (B) AAACCCG 探针对马鞭草 (2n = 16)、M. guttatus (2n = 28) 和 M. lewisii (2n = 16) 的中期染色体进行荧光原位杂交 (FISH)。


对于每个探针,顶部面板显示端粒特异性 FISH 信号,底部面板显示具有端粒特异性 FISH 信号的 DAPI(4',6-二脒基-2-苯基吲哚)染色的中期染色体。条形代表 5 μm。


https://doi.org/10.1371/journal.pgen.1011738.g007


端粒酶在 M. lewisii 中合成 AAACCG 和 AAACCCG 端粒重复,但在 M. cardinalis 中不合成。

M. lewisii 端粒与 AAACCG 和 AAACCCG 端粒重复的异质性表明端粒酶能够在体内合成两种重复类型(图 5B、6 和 7)。我们对叶片和分生组织中 TR1 和 TR2 转录物进行了 RT-qPCR,发现与带有 AAACCCG 模板的 TR2 基因相比,带有 AAACCG 模板的 TR1 基因具有显着更高的表达 (Mann-Whitney U 检验 p 值< 0.05) (S9 图)。我们假设 M. lewisii 端粒的重复组成是由 TR1 和 TR2 基因的转录丰度水平驱动的。


我们通过端粒重复扩增方案 (TRAP) 测定来研究端粒酶的活性 [68]。TRAP 是一种用于检查端粒酶活性的体外测定法,涉及端粒酶介导的非端粒底物的延伸。我们对 M. lewisii、M. cardina 和 M. verbenaceus 蛋白提取物进行了 TRAP 研究,并对 TRAP 产物进行了测序,以研究每个物种的端粒酶合成的重复序列。我们使用了一种先前发表的底物引物(即TS21),该引物适用于多种植物物种,以及两种先前发表的反向引物(即TelPr和HisPr_long),它们用AAACGGG样重复序列扩增了TRAP产物[49]。我们还设计了一种反向引物,用于扩增具有 AAACCG 重复序列(即 MvV1)的 TRAP 产物。所有三种反向引物均显示出阳性 TRAP 产物,当在 RNAse A 处理后重复反应时,未观察到这些产物,表明 TRAP 测定是 RNA 依赖性的(图 8 上的左图)。然后克隆 TRAP 产物用于 Sanger 测序,并且仅分析同时具有引物序列(即 TS21 底物引物和反向引物)和两者之间串联重复序列的克隆。在马鞭草中,我们总共筛选了 13 个克隆 (TelPr = 3, MvV1 = 5, HisPr_long = 5),发现了 17 个 AAACCG 串联重复序列和 1 个 AAACCCG 重复序列(每个反向引物的示例见图 8)。这是意料之中的,因为在 M. verbenaceus 中,预计端粒酶会合成 AAACCG 重复序列。在 M. lewisii 中,我们共筛选了 12 个克隆 (TelPr = 4、MvV1 = 3 和 HisPr_long = 5),并发现了 9 个 AAACCG 串联重复序列和 26 个 AAACCCG 重复序列。这表明 M. lewisii 端粒酶可能同时使用 TR1 和 TR2 模板进行合成,并解释了序列异质性 M. lewisii 端粒。在 M. cardinalis 中,我们共筛选了 15 个克隆 (TelPr = 5, MvV1 = 5, HisPr_long = 5),发现了 28 个 AAACCG 串联重复序列和 3 个 AAACCCG 重复序列。尽管 TR1 和 TR2 都在 M. cardina 中表达,但端粒酶似乎优先合成 TTTGCC(即 AAACGG 的反向互补)重复序列。M. cardinalis 端粒酶可能优先与 TR1 结合,或者它可能优先合成 TTTGCC 重复序列,而不管 TR 基因如何。这种偏好也与我们的 TRF 数据一致,也可能解释了为什么尽管 TR1 和 TR2 在该物种中都表达,但 M. cardinalis 端粒主要由 AAACCG 重复组成。


thumbnail下载:

PPT的PowerPoint 幻灯片

PNG放大图片

国际电影节原始图像

图 8. 端粒酶活性的 TRAP 测定和克隆 TRAP 产物的测序结果。


分析了 (A) M. verbenaceus、(B) M. lewisii 和 (C) M. cardinalis 花分生组织的蛋白质提取物。(左)将 TRAP 产物在聚丙烯酰胺凝胶上分离并染色成像。(-) 泳道表示未添加 RNAse A 的 TRAP 产物。(+) 泳道表示来自 2 ng RNAse A 的检测的 TRAP 产物,(++) 泳道表示来自 5 ng RNAse A 的检测的 TRAP 产物。(右)由 TRAP 阳性检测生成的克隆的 Sanger 测序的代表性图像。端粒基序用彩色箭头表示,其中 AAACCG(即 TTTCGG)基序用蓝色箭头表示,AAACCCG(即 TTTCGGG)基序用绿色箭头表示,两个基序都用灰色箭头表示。


https://doi.org/10.1371/journal.pgen.1011738.g008


TR 复制事件是古老的,由于功能原因,两个拷贝都保留在 M. lewisii 中。

M. parishii 和 M. verbenaceus 可能也有 TR2 基因,但随后丢失了。这种情况将支持 M. lewisii TR 重复是进化上古老的事件的观点。我们对 M. cardinalis 和 M. lewisii 的 TR2 基因区域进行了比较基因组分析,还检查了 M. parishii 和 M. verbenaceus 的同线区域。结果显示,TR2 基因周围基因组区域的 4 个物种之间有明显的同线,所有 4 个物种都位于 7 号染色体上(S10 图)。我们使用 TR2 序列作为查询进行核苷酸原始细胞分析,并在 M. parishii 和 M. verbenaceus 的共线区域寻找 TR2 的存在。在 M. parishii 中,我们发现了 36 bp 的命中 (97% 同一性),在 M. verbenaceus 中发现了 80 bp 的命中 (88% 同一性),但没有观察到与绝大多数 TR2 基因的匹配。这些结果表明 M. parishii 和 M. verbenaceus 没有功能性 TR2 旁系同源物,并且保留在基因组中的序列可能是潜在的假基因化基因残余。


为了更深入地了解M. lewisii TR重复背后的进化历史,我们分析了来自两个密切相关的外群物种M. bicolor和M. primuloides的基因组组装草稿[69]。在进化上,M. bicolor (Monimanthe科) 是Erythranthe科的系统发育姐妹,而 M. primuloides (Monantha科) 是第三个外群。这两个物种的基因组是通过短读长 (150 bp) Illumina 测序生成的,它们的组装是碎片化的,但通过原始细胞搜索,我们能够在两个物种中发现 TR 基因,并与 Erythranthe 切片 TR 序列一起重建了一个系统发育树(S11 图)。我们还使用图 3B 中的所有 Mimulus TR 序列数据集构建了一个系统发育树,双色分枝杆菌和报春分枝杆菌与 Erythranthe 截面形成了一个单系群(S12 图)。双色分枝杆菌有 3 个 TR 基因拷贝和 1 个旁系同源物与 TR1 旁系同源物分组,而另外两个与 TR2 旁系同源物分组。在外群 M. primuloides 中只有一个 TR 基因,并且在系统发育上它与 TR1 旁系同源物聚集(但具有低引导)。M. primuloides 元春蚂蚁TR 具有模板序列 AACCGA,表明所有三个 Erythranthe、Monimanthe、Monantha 部分 Mimulus 物种 (AAACCG)n是祖先端粒,TR1 旁系同源物是祖先 TR 序列。此外,我们的证据表明 TR2 旁系同源物源于进化上古老的重复事件,发生在 Erythranthe 和 Monimanthe 部分的共同祖先(~820 万年前)[57]。大多数基因重复变得无功能[70],这解释了TR2旁系同源物在Cardinalis、M. parishii和M. verbenaceus中的假基因化。但在 M. lewisii 中,TR2 旁系同源物显然具有功能,并且似乎直接参与合成 M. lewisii 端粒。最初的 TR 复制事件是古老的,早于 M. lewisii 的物种形成,这表明两个 TR 旁系同源物自 M. lewisii 进化起源以来一直在 M. lewisii 中发挥作用。


TR 重复通过转座产生,祖先副本最终丢失。

在分析 M. lewisii TR 基因复制的过程中,我们注意到 TR 旁系同源物位于两条不同的染色体上。在 M. lewisii 中,TR1 基因位于 6 号染色体,而 TR2 基因位于 7 号染色体 (S1 表)。有趣的是,这两个重复项位于物理上遥远的基因组位置,我们使用同线分析研究了导致这种模式的进化机制。


M. lewisii TR1 基因周围的基因组区域与其姊妹种 M. cardinalis、M. parishii 和 M. verbenaceus 高度同步(S10 图和 S1 表)。我们注意到红衣主教的TR1位于7号染色体上,这似乎与刘易斯分枝杆菌中6号染色体的TR1位置相矛盾,但这是由于TR1基因位于6号和7号染色体之间的自然染色体易位中[71]。然后,我们研究了进化上不同的 M. guttatus 和 M. aurantiacus ssp. puniceus 参考基因组中 M. lewisii TR1 基因的同线关系,发现这两个物种在同线区域没有 TR 基因(S1 表)。事实上,对于所有三个物种(M. aurantiacus、M. lewisii 和 M. guttatus),TR 基因位于非同线位置和不同的染色体上(S1 表和图 9)。M. lewisii TR2 基因具有相同的结果,而 M. guttatus 和 M. aurantiacus ssp. puniceus 参考基因组中的同线区域没有 TR 基因。综上所述,同一部分的物种共享 TR 同线,但在不同部分的物种之间,TR 位于非同线染色体位置 (S1 表)。解释这些结果的一种可能情况是,如果 TR 基因能够通过转座介导的基因复制机制复制并移动到不同的染色体上 [72]。我们假设这种转座事件发生在每个 Mimulus 部分的共同祖先中,但随后祖先 TR 旁系同源物丢失,衍生的 TR 旁系同源物存活下来,这解释了为什么来自不同 Mimulus 部分的物种不共享 TR 基因同源。TR 基因旁系同源物的这种周转最终解释了 Mimulus 中端粒序列变异的进化基础。有趣的是,每个具有衍生端粒序列的 Mimulus 切片在不同的染色体上也具有 TR 基因,这表明它可能是始终保留的衍生 TR 旁系同源物。目前我们对这一观察没有进化上的解释,但衍生的 TR 旁系同源物的保留表明该过程可能涉及未知的选择机制。一种假设可能与遗传冲突有关[73,74],因为两种TR旁系同源物都会与端粒酶复合物相互作用以使其正常运作,这可能导致端粒结合蛋白的竞争。


thumbnail下载:

PPT的PowerPoint 幻灯片

PNG放大图片

国际电影节原始图像

图 9. 端粒酶 RNA (TR) 基因周围的同线图。


每个面板都显示了一个焦点物种 (A) M. aurantiacus ssp. puniceus、(B) M. guttatus和 (C) M. verbenaceus,其 TR 染色体位置(用红色箭头表示)绘制在中心位置并用红色字母突出显示。橙色箭头表示基因,灰色框表示基因之间的正字。对于每个焦点物种 TR 基因,我们用正交显示上游和下游的五个基因。在每个样地中,围绕焦点物种 TR 基因的物种之间存在明显的同线,但在非焦点物种中没有 TR 基因,而是位于不同的染色体上(比较图 A、B 和 C 中的 TR 位置)。


https://doi.org/10.1371/journal.pgen.1011738.g009


导致 TR 基因转座的分子机制尚不清楚,但我们推测可能涉及转座因子。在我们在参考基因组中注释 TR 基因的 9 个 Mimulus 物种中的 6 个物种中,在 TR 基因注释的 2,000 bp 范围内有一个转座因子序列,并且所有 6 个物种都是 DNA 转座子(S5 表)。在植物中,DNA 转座子被假设为基因复制的主要介质,通过转座子转座机制的直接或间接后果 [75]。因此,我们假设 TR 基因的转座和复制可能是通过 DNA 转座子介导的。


结论

本研究旨在了解 Mimulus 端粒序列变异的进化基础。具体来说,目标是了解 TR 序列如何进化并导致在生命树中通常观察到的可变端粒序列。为了实现这一目标,我们研究了 Mimulus 属,因为我们的初步基因组分析发现,在密切相关的 Mimulus 物种之间,端粒序列与祖先的 AAACCCT 重复序列至少发生了两次变化。端粒序列变异的进化基础由每个物种 TR 基因模板序列内的遗传变化来解释。重要的是,我们还发现在特定的 Mimulus 物种中,TR 基因是重复的,模板序列在旁系同源物之间发生了分歧。这导致了像 M. lewisii 这样的情况,其中 TR 重复导致其端粒具有 AAACCG 和 AAACCCG 重复的异质混合物。但在姐妹物种 M. cardinalis 中,重复的旁系同源物可能没有功能,它们的端粒由单个重复序列(即 AAACCG)组成。这表明复制后 TR 旁系同源物的功能和进化周转在决定端粒的序列进化中起关键作用。


根据我们的结果,我们提出了端粒酶 RNA 基因转座、复制和分化模型(详见图 10)作为 Mimulus 中端粒序列变异的基础,并可能跨越各种真核生物谱系。从本质上讲,我们假设 TR 基因可以通过转座介导的复制机制插入新的染色体位置,这在 Mimulus 属基因组的进化过程中已经发生过多次。这种重复为序列突变在旁系同源物之间积累提供了机会,导致某些物种出现异质端粒序列。我们认为 TR 旁系同源物之间产生的这些序列变化具有功能影响,并且正在被选择,导致 TR 旁系同源物在进化上保留。另一方面,Mimulus 物种的存在和假基因化 TR 旁系同源物的证据表明,非功能性 TR 重复在进化过程中迅速丢失。TR 复制引起的功能后果尚不清楚,但一种结果是复制可能影响了端粒的长度。我们发现,与具有单一重复类型的端粒的姊妹类群相比,具有 TR 重复的 M. lewisii 具有更长的端粒和异质序列(图 10)。长端粒的选择可能是 TR 复制和序列进化的潜在进化驱动因素。以前,在植物中,端粒长度变化被认为是生活史策略的进化产物[32],例如,快速开花的植物通常具有较长的端粒[50]。需要进一步的研究来检验我们的假设,但我们认为端粒序列进化可能是生命史进化和生命节奏植物策略的产物。


thumbnail下载:

PPT的PowerPoint 幻灯片

PNG放大图片

国际电影节原始图像

图 10. 提出的端粒酶 RNA (TR) 转座、复制和发散模型来解释真核生物端粒的进化变化。


该图基于我们的 Mimulus 结果,但我们认为可以应用于整个真核生物王国。显示了本研究中检查的三个 Mimulus 部分(Diplacus、Erythranthe 和 Simiolus)之间的系统发育关系。在导致每个 Mimulus 部分的分支中,在该部分的共同祖先中塑造 TR 基因的进化事件用彩色条表示。在每个分支中,我们还显示了 TR 基因的染色体位置和最终决定端粒重复的 TR 模板序列。在进化模型中,我们假设 Mimulus 中的祖先端粒序列是 AAACCCT,并且在 Mimulus 属的端粒序列中观察到的进化变化以红色突出显示。我们假设祖先 TR 基因位于未知的染色体位置,该位置在每个 Mimulus 部分的进化分裂过程中转座并插入到新的染色体位置。在 Diplacus 切片中,祖先 TR 转座到 2 号染色体上,并且 TR 模板序列没有突变,因此所有 Diplacus 切片物种都具有祖先端粒序列。在 Simiolus 和 Erythranthe 切片中,除了切片特异性的 TR 转座事件外,TR 模板序列还发生了突变,导致这些切片中的物种具有分别是 AAACCCG 和 AAACCG 的端粒序列。在 Erythranthe 切片(放大如下)中,在 Erythranthe 和 Monimanthe 切片的共同祖先中发生了 TR 基因复制,导致 TR1 和 TR2 基因重复。我们假设 TR2 是最近衍生的旁系同源物,它起源于转座介导的基因复制过程。两个 TR 旁系同源物编码不同的模板序列,并且 M. lewisii 在端粒合成过程中利用这两个旁系同源物,这导致序列异质端粒由 AAACCG 和 AAACCCG 重复组成。虽然 M. lewisii 导致 TR2 基因进化保留的功能机制尚不清楚,但我们假设这可能与端粒长度调节有关(与 M. cardinalis 和 M. verbenaceus 相比,M. lewisii 的端粒长度更长)。另一方面,在 M. parishii 和 M. verbenaceus 中,TR2 重复已经假生化,而在 M. cardinalis 中它可能正在发生假生化,因此在所有三个物种中,端粒主要由单个端粒重复序列 AAACCG 组成。* 表示基于 M. lewsii 基因组坐标的 TR 的染色体位置。


https://doi.org/10.1371/journal.pgen.1011738.g010


虽然我们的结果基于 Mimulus 端粒,但我们认为 TR 的复制和序列分歧可能是最终导致真核端粒序列进化的关键进化机制。我们的发现也证实了Závodník等[49]最近的研究,该研究报道了几个不同植物科中TR重复的证据,表明TR旁系同源物的进化可能是一种常见的植物进化现象。此外,在真菌热带念珠菌中,一些菌株的端粒由两种重复类型组成,这两个重复类型由单个核苷酸不同,并且有人提出序列异质性是由两种不同的端粒酶 RNA 等位基因引起的 [76]。总之,测试我们提出的模型的通用性需要对不同的真核生物谱系进行更多研究,包括同一属的密切相关物种。


材料和方法

分析的参考基因组

所有 Mimulus 参考基因组均从 Mimubase (http://mimubase.org/) 下载。具体来说,分析的基因组版本是 M. guttatus v2.0 [77]、M. aurantiacus ssp. puniceus v1.0 [53]、M. cardinalis v2.0、M. lewisii v2.0、M. parishii v2.0 和 M. verbenaceus v2.0。我们注意到 M. cardinalis、M. lewisii、M. parishii 和 M. verbenaceus 的基因组序列是早期访问的公开版本,描述这些基因组生物学特性的手稿将在其他地方发表。


基于 k-Seek 的端粒序列分析。

我们从 NCBI SRA 下载了 M. aurantiacus、M. guttatus 和 M. verbenaceus 全基因组重测序数据 [53–55],标识符为 PRJNA549183、PRJNA344904 和 PRJNA813304。使用 BBTools (https://jgi.doe.gov/data-and-tools/bbtools/) bbduk.sh 脚本 v39.01 修剪原始读数,参数为 minlen = 25 qtrim = rl trimq = 10 ktrim = r k = 25 mink = 11 hdist = 1 tpe tbo。然后用 k-Seek [51\u201252] 分析修剪的读数,以定量串联重复序列的总拷贝数。K-Seek 可识别原始测序读数中高达 20 bp 的串联重复基序。它将测序读数分解成更小的片段(即 k-mer)并将其分组为序列同一组。这允许通过分析所有测序读数来鉴定 k-mer 及其随后的定量。


k-Seek 要求 k-mer 重复序列长度至少为 50 bp,以避免过度计算散布在基因组中的小串联重复序列。为了解释样本之间基因组覆盖度的差异,我们按样本的基因组覆盖率中位数对每个样本的 k-mer 计数进行标准化。首先使用 bwa-mem v0.7.16a-r1181 [77] 将全基因组重测序读数与相应物种的参考基因组进行比对,然后使用 bedtools v2.25.0 [78] 计算每个样本的平均覆盖率。


基于参考基因组的端粒序列分析

所有 Mimulus 物种都有一个组装成染色体(即连锁组)的参考基因组,因此如果组装端粒序列,它将位于每个染色体组装的末端。我们用samtools v1.14 [79]从每个物种的参考基因组中提取了组装染色体序列的起始和结束500 bp。对于每个提取的序列,我们使用带有选项 -aob 的 bash 命令 grep 搜索端粒重复序列 AAACCCT、AAACCCG 或 AAACCG,并计算匹配数。在 R v4.3.1 (RStudio 2020) 中使用 ggplot2 包 [80] 对数据进行可视化。


植物材料

S2 表中提到了本研究中使用的具有生长条件的 Mimulus 物种。使用改良的CTAB方法从红衣主教、古塔图、金刚果、教区、马鞭草和刘易斯的叶子中分离出总基因组DNA [81]。


RNA 分离和逆转录聚合酶链反应 (RT-PCR)。

根据制造商的方案,使用 TRIzol (Invitrogen) 从 100 mg 花分生组织、根和叶中提取总 RNA。进一步用 DNaseI(无 RNase,New England Biolabs)处理 RNA,然后使用 Monarch 总 RNA 小量制备试剂盒 (New England Biolabs) 进行柱纯化。ProtoScript 第一链 cDNA 合成试剂盒 (New England Biolabs) 用于使用制造商的方案合成 cDNA。使用随机引物对 1 μg RNA 进行逆转录。


对 M. cardinalis、M. guttatus、M. aurantiacus ssp. puniceus、M.parishii、M. verbenaceus 和 M. lewisii 的根、叶和花分生组织进行 RT-PCR。在 20 μl 反应混合物中使用 4 μl 10X 稀释的 cDNA。在以下条件下,使用含标准 Taq 缓冲液 (New England Biolabs) 的 Taq DNA 聚合酶扩增 TR:95°C 下 10 分钟;95°C 下 30 秒;30 个循环,95°C 下 30 秒,55°C 下 30 秒,68°C 下 15 秒;最后在 68°C 下延伸 5 分钟。用于 RT-PCR 的引物列在 S6 表中。在溴化乙锭染色的 2% 琼脂糖凝胶上,使用 95 伏凝胶电泳 40 分钟分离 PCR 产物。


RNA-seq 文库制备

使用 RNA ScreenTape (Agilent Technologies) 检查从 S2 表中列出的物种的花分生组织中提取的总 RNA 的质量,并使用 Qubit 2.0 荧光计测定浓度。使用 QIAseq FastSelect–rRNA Plant Kit 去除总 RNA 中的核糖体 RNA (rRNA)。使用去除 rRNA 的 RNA 样品,根据制造商的方案,使用 NEBNext Ultra II 定向 RNA 文库制备试剂盒制备 RNA-seq 文库。堪萨斯大学基因组测序核心在 Illumina NextSeq 2000 平台上使用 P3 试剂对 RNA-seq 文库进行测序,并以 2 × 100 bp 双端读长的形式进行测序。


每个转录组生成的原始读取总数在 102-1.82 亿个读取之间,其中超过 98% 的读取在质量控制修剪以去除接头和低质量序列区域后被回收(S3 表)。然后,我们将质量控制修剪的 reads 与参考基因组进行比对,以检查源自基因组的 reads 的比例。使用 M. aurantiacus ssp. puniceus 参考基因组进行 Diplacus 物种转录组,使用 M. guttatus 参考基因组进行 Simiolus 物种转录组,使用 M. lewisii 参考基因组进行转录组,我们确定有 50.0-99.7% 的读数与参考基因组对齐。某些物种的比对百分比较低可能是由于参考基因组与具有 RNA-seq 读数的物种差异太大而无法进行定位。


De novo transcriptome assembly

从原始测序读长中,使用 fastqc v0.11.8 (https://www.bioinformatics.babraham.ac.uk/projects/fastqc/) 分析读长的质量。使用 BBMap 软件包 v39.01 (https://sourceforge.net/projects/bbmap/) 中的 bbduk.sh 脚本对读数进行质量控制修整。处理后的数据使用 Trinity 管道 v2.8.5 [62] 并按照他们的组装教程 (https://github.com/trinityrnaseq/trinityrnaseq/wiki) 进行从头转录组组装。从头程序集作为配对端选项运行,命令为:Trinity --seqType fq --left “$FQ 1” --right “$FQ 2” --CPU 40 --max_memory 140G --output “$OUTDIR”。为了将读数与参考基因组进行比对并检查读数比对统计数据,我们使用了 Bowtie2 v2.3.5.1 程序 [82]。来自 Trinity 管道的 TrinityStats.pl 脚本用于计算转录文本重叠群 N50 值。为了量化转录组组装的完整性,使用以下命令执行了基准通用单拷贝直系同源物 (BUSCO) v3.0.2 [83]:run_BUSCO.py -c 20 -o OUTPUT_NAME --in SEQUENCE_FILE -l eudicotyledons_odb10 -m 转录组。


端粒酶 RNA 基因生物信息学分析

候选 TR 基因注释使用先前实施的生物信息学方法进行,该方法用于检测各种陆地植物物种中的 TR [27]。我们使用来自先前注释植物的 TR 序列生成位置权重矩阵 (PWM),以使用 fragrep2 [59] 在 Mimulus 参考基因组中搜索候选 TR 序列,并使用程序 Infernal [60] 使用二级结构和序列相似性搜索候选 TR。


为了在从头转录组组装中搜索 TR 序列,我们使用了使用 fragrep2 和 Infernal 从参考基因组注释的 TR 基因。使用独立的 blast+ v2.9.0 [84] 使用以下命令鉴定转录组组装中的候选 TR 基因:blastn -query “$QUERY_FASTA” -db “$REF_DB” -task blastn -outfmt 6。来自同一部分的密切相关的 Mimulus 物种被用作查询序列。使用 MUSCLE [64] 从每个 Mimulus 物种中检测到的 TR 基因彼此比对,默认参数为 MEGA v5.0 [85]。


注释 Mimulus TR 中的保守区域和功能区域

对于具有参考基因组的物种,检索每个物种 TR 基因的 100 bp 上游区域,用于分析保守的调节元件。使用 MUSCLE [64] 将序列彼此对齐,默认参数为 MEGA [85]。我们特异性扩增了 M. cardinalis TR2 上游区域,并使用 S6 表中提到的引物对 Sanger 进行了测序。此外,我们使用 A. thaliana TR 序列用 Mimulus TR 序列注释功能域。由于之前的拟南芥研究已经实验验证了 TR 的二级结构和功能域 [27],我们将拟南芥 TR 序列与 Mimulus TR 多序列比对进行了比对,并注释了 Mimulus TR 功能域。


系统发育分析

使用 RAxML v8.2.5 [86] 将多物种 TR 基因比对用于系统发育分析,以构建基于最大似然的树。我们使用了具有 γ 分布速率变化的通用时间可逆 DNA 替换模型,并对 1000 个重复进行了 bootstrap 分析。


使用 Nei 的遗传距离 (Nei 1972) 估计两个 TR 重复之间的分歧时间 (D = 2μT,其中 D 是基因旁系同源物之间的遗传分化,μ 是每代突变率,T 是世代数)。我们使用了拟南芥的突变率估计值(每代每个位点 7E-9 个碱基替换)[87],并假设每年 1 代。


用于纳米孔测序的 DNA 分离和文库制备

为了提取 DNA,收集了 M. lewisii、M. cardinalis 和 M. verbenaceus 的叶子。使用 Wizard HMW DNA 提取试剂盒 (Promega) 进行高分子量 DNA 分离。根据 Oxford Nanopore Technologies (ONT) 的连接测序试剂盒 V14 (SQK-LSK114) 方案进行文库制备。对于每个文库,使用 1 μg DNA 作为 DNA 修复和接头附着末端制备的起始量。用 NEBNext FFPE DNA 修复混合物 (NEB, M6630) 和 Ultra II 末端制备酶混合物 (NEB, E7546) 处理 DNA,然后使用 AMpure XP 珠子 (AXP) 纯化,并用 61 μl 无核酸酶水洗脱。为了将测序接头连接到 DNA 末端,使用 NEBNext Quick T4 DNA 连接酶(NEB,E6056)在室温下将上一步中洗脱的 60 μl DNA 与 5 μl 连接接头连接 10 分钟。加入 AXP 微珠,并用长片段缓冲液 (LFB) 洗涤两次。用 15 μl 洗脱缓冲液洗脱最终文库,测序前使用 Qubit 定量 DNA 量。将文库保存在冰上,直到准备好加载到 MinION 设备上。


MinION 测序

在 Mk1C (Oxford Nanopore Technologies) 测序仪上对 MinION 流动槽(FLO-MIN114 R10.4.1 版本)对文库进行测序。在序列运行开始之前,执行流通池检查以确定流通池中可用的活性孔数。在启动端口上加载总共 1000 μl 流动池引发混合物,在 SpotON 样品端口上加载总共 75 μl 文库与文库珠 (LIB) 混合的文库。


数据分析

MinION 碱基检出由 Guppy v3.6.1 + 249406c (https://nanoporetech.com/software/other/guppy) 执行。使用以下命令使用 minimap2 v2.25 [88] 将读数比对回参考基因组:“minimap2 -L -t ”$CPU“ -ax map-ont ”$refgenome“ ”$fastq“ > ”$FILENAME“.sam。用 samtools 提取与参考基因组端粒序列区域比对的纳米孔读数,并使用 grep 命令分析读数以计数端粒序列重复。


末端限制性片段 (TRF) 分析

端粒长度通过末端限制性片段 (TRF) 分析 [89] 测量,并稍作修改。用 Tru1l (ThermoFisher Scientific) 限制性内切酶消化来自单个植物的基因组 DNA,并通过凝胶电泳在 0.8% 琼脂糖凝胶中于 55V 下在 1X TAE 缓冲液中分离 18 小时,然后转移到 Hybond-N+ 尼龙膜上(GE Healthcare,芝加哥,伊利诺伊州,美国)。将消化的 DNA 与 32P 标记的 CGGTTTCGGTTTCGGTTTCGGTTTCGGT 探针杂交,进行端粒 DNA 序列检测。随后从膜上剥离 CGGTTT 特异性探针(通过在 42°C 下与 0.2N NaOH、0.1% SDS 一起孵育,振荡 20 分钟两次),并用 5' 端标记的 CGGGTTTCGGGTTTCGGGTTT 探针重新探测。使用 Amersham Typhoon IP PhosphorImager (Cytiva, Wilmington, DE, USA) 扫描放射性信号。使用 ImageQuantTL v10.2-499 软件(Cytiva,Wilmington,DE,USA)对图像进行可视化,并使用 WALTER 程序计算每个 DNA 样品的平均端粒长度值(平均 TRF)[67]。


实时定量 PCR (qPCR)

在 M. lewisii 叶和花分生组织中进行定量实时 PCR,以检查 TR 旁系同源物的表达水平。在 QuantStudio 3 实时荧光定量 PCR 系统 (Applied Biosystems) 上使用 PowerUp SYBR Green 预混液 (Applied Biosystems) 进行 qPCR。每个 10 μl 反应由 5 μl PowerUp SYBR Green 预混液 (2X)、1 μl 每种引物、2 μl cDNA 和 1 μl 无核酸酶水组成。S6 表中提到了 qPCR 中使用的引物的详细信息。反应设置如下:在 50 °C 下初始活化 2 分钟,在 95 °C 下 2 分钟,然后在 95 °C 下变性 40 次循环 15 秒,并在 60 °C 下退火/延伸 1 分钟在 96 孔光学反应板中。最后,解离步骤分 3 个步骤进行,首先在 95 °C 下以 1.6°C/秒的升温速率持续 15 秒,第二次在 60 °C 下持续 1 分钟,最后在 95 °C 下以 0.15°C/秒的速度持续 15 秒。使用实时 PCR (DART-PCR) 数据分析计算 PCR 效率 [90]。


端粒酶重复扩增方案 (TRAP) 检测

将 M. lewisii、M. verbenaceus 和 M. cardinalis 的芽顶分生组织和花芽置于研钵和研杵中,使用液氮进行蛋白质分离。将 100 mg 粉碎的组织加入 800 μl 缓冲液 W(50 mM Tris-乙酸盐 (pH 7.5),5 mM MgCl2、100 mM 谷氨酸钾、20 mM EGTA、1.5% (wt/vol) 聚乙烯吡咯烷酮和 10% 甘油),含有 0.6 mM 核糖核苷钒复合物和 1.0 mM DTT。将提取物在旋转器上于 4°C 下孵育 10 分钟,然后在 4°C 下以 13,000 rpm 离心 15 分钟。 在上清液中加入 350 μL 50% PEG (6000 MW),并在旋转器上于 4°C 孵育 30 分钟。 然后将产物在 4°C 下以 8,000 rpm 离心 5 分钟,弃去上清液。加入 100 μl 缓冲液 W,轻轻重悬沉淀,并在 4°C 下置于旋转器上 30 分钟 [91]。提取的蛋白质在 -80°C 下储存直至使用。使用 Bradford 试剂测定提取样品的蛋白质浓度。


使用 TRAP 测试提取的蛋白质的端粒酶活性。简而言之,将 500 ng 总蛋白与 1 μl 10 μM TS21(列于 S6 表)、1X Taq PCR 预混液(货号.不。ID:201445)并在 37 °C 下孵育 45 分钟。延伸后,加入 1 μl 10 μM 反向引物(列于 S6 表中),然后进行 TRAP 测定的 PCR 步骤(94°C 15 分钟,94°C 30 秒,60°C 30 秒,72°C 60 秒,最后 72°C 延伸 1 分钟)。对于对照实验,添加了两种不同浓度的 RNase,即 40 mg (+) 和 80 mg (++)。在 0.5x TBE 缓冲液中的 10% 天然聚丙烯酰胺凝胶上分离 PCR 产物,用 SYBR Green I 核酸凝胶染料 (Invitrogen, S7567) 染色后进行观察,并使用 LI-COR Odyssey M 进行观察 [92,93]。使用 TOPO TA 克隆试剂盒 (Invitrogen, K450002) 将 TRAP 测定的反应产物克隆到 pCR2.1-TOPO 质粒中。阳性克隆被送去进行 Sanger 测序。


荧光原位杂交 (FISH) 分析

染色体制备和 FISH 程序遵循以前的方法 [94] 进行,并进行了少量修改。从活跃生长的 Mimulus 植物的根尖制备有丝分裂染色体扩散,将其置于一氧化二氮气室中 1.5 小时。然后将根尖在乙醇和冰醋酸 (3:1) 的溶液中固定过夜,并用一滴 45% 乙酸压碎。所有制剂均在 -70°C 下储存直至使用。


用双刃剃须刀小心地取下盖玻片后,用 20 μg/mL 胃蛋白酶和 10 mM HCl 溶液在 37°C 下预处理玻片 3 分钟,然后浸入蒸馏水中 1 分钟以终止胃蛋白酶反应。然后用 2x SSC(300 mM 柠檬酸钠、30 mM NaCl,pH 7.0)洗涤预处理的载玻片 3 次,每次 5 分钟。随后,用 4% 甲醛的 2x SSC 溶液处理载玻片 5 分钟,通过分级乙醇系列(70%、90% 和 100%,各 2 分钟)脱水,然后风干。


靶向 AAACCCG 和 AAACCG 重复序列的端粒特异性 DNA 探针是在不存在模板 DNA 的情况下通过 PCR 开发的 [95,96]。使用 QIAquick PCR 纯化试剂盒 (Qiagen) 纯化 PCR 产物,并使用切口平移反应用地高辛-11-dUTP (Roche) 标记。用罗丹明偶联的抗地高辛抗体 (Roche) 检测地高辛标记的探针。在 Vectashield 抗淬灭溶液 (Vector Laboratories) 中用 4',6-二脒基-2-苯基吲哚 (DAPI) 对染色体进行复染。使用配备制冷型 CCD 相机 CoolSNAP HQ2(光度学)和 AxioVision 4.8 软件的蔡司 Axioplan 2 显微镜拍摄图像。使用 Adobe Photoshop 2024 软件调整图像的最终对比度。


Synteny 分析

TR 基因的同线是通过 TR 周围编码序列的正交来确定的。对于每个具有参考基因组的 Mimulus 物种,我们取了 TR 的染色体位置,并提取了 TR 基因上下游的基因注释。对于病灶物种及其TR基因,通过Orthofinder v2.5.5 [97,98]和从Mimubase下载的Mimulus物种的基因注释来确定周围基因的正序学(http://mimubase.org/。为了可视化同点,按照教程 (https://github.com/moshi4/pyGenomeViz) 使用 pyGenomeViz。


支持信息

具有参考基因组的物种中端粒酶 RNA (TR) 基因的基因组坐标和意义。


显示 1/18: pgen.1011738.s001.xlsx


跳至 fig分享导航

很抱歉,我们无法加载此页面。

TR_syntenic 坐标TR_regions_synteny

1 / 18



下载

无花果分享

S1 表。 具有参考基因组的物种中端粒酶 RNA (TR) 基因的基因组坐标和意义。

对于每个 TR 基因,还显示了其在其他物种中的同线区。同线区是根据 TR 基因直接上游和下游的基因的正交确定的。syntenic 区报告的坐标是上游基因的结束位置和下游基因的开始位置。请注意,由于微同线差异,TR 的确切位置及其同线位置可能不会完全重叠(例如,参见 M. lewisii 参考基因组中的 TR2 基因位置和基于 M. cardinalis TR2 的同线位置)。


https://doi.org/10.1371/journal.pgen.1011738.s001


(XLSX)


S2 表。 本研究中研究的 Mimulus 物种。

https://doi.org/10.1371/journal.pgen.1011738.s002


(XLSX)


S3 表。 Mimulus transcriptome de novo assembly statistics.

https://doi.org/10.1371/journal.pgen.1011738.s003


(XLSX)


S4 表。 Mimulus 纳米孔测序统计。

https://doi.org/10.1371/journal.pgen.1011738.s004


(XLSX)


S5 表。 与 TR 基因直接相邻的转座因子序列。

https://doi.org/10.1371/journal.pgen.1011738.s005


(XLSX)


S6 表。 本研究中使用的引物序列。

https://doi.org/10.1371/journal.pgen.1011738.s006


(XLSX)


S1 图 物种 (A) 、 (B) 和 (C) 的全基因组串联重复谱。

显示前 25 个最丰富的 k-mer,k-mer 按字母顺序排列,然后按大小排序。


https://doi.org/10.1371/journal.pgen.1011738.s007


(PDF格式)


S2 图 参考基因组组装末端的端粒重复序列计数。

https://doi.org/10.1371/journal.pgen.1011738.s008


(PDF格式)


S3 图 来自参考基因组的候选 TR 基因序列比对的上游 100 bp。

https://doi.org/10.1371/journal.pgen.1011738.s009


(PDF格式)


S4 图 RT-PCR 结果在三种组织(根、成熟叶和花分生组织)的 RNA 提取产生的 cDNA 上扩增 TR 转录本,并将原始 RNA 作为阴性对照。

基因组 DNA 显示为阳性对照。


https://doi.org/10.1371/journal.pgen.1011738.s010


(PDF格式)


S5 图 整个 Mimulus TR 基因的比对。

功能域 CR1-CR5 显示在比对上方。


https://doi.org/10.1371/journal.pgen.1011738.s011


(PDF格式)


S6 图 RT-PCR 结果在三种组织(根、成熟叶和花分生组织)的 RNA 提取产生的 cDNA 上扩增 TR 转录本,并将原始 RNA 作为阴性对照。

基因组 DNA 显示为阳性对照。


https://doi.org/10.1371/journal.pgen.1011738.s012


(PDF格式)


S7 图 从 7 号染色体端粒区域读取纳米孔测序。

对于每个物种,选择随机纳米孔读数以显示与端粒区域相对应的 DNA 序列。GG 核苷酸以绿色突出显示,而 GGG 核苷酸以红色突出显示。TTTC 序列以黄色突出显示。


https://doi.org/10.1371/journal.pgen.1011738.s013


(PDF格式)


S8 图 剥离 AAACCG 特异性探针后的 Southern 印迹图像。

显示了分子量 DNA 标记物(以 kb 为单位)。


https://doi.org/10.1371/journal.pgen.1011738.s014


(PDF格式)


S9 图 RT-qPCR 结果扩增 TR1 和 TR2 基因的转录本。

实验进行了 3 次生物学重复。


https://doi.org/10.1371/journal.pgen.1011738.s015


(PDF格式)


S10 图 M. lewisii 和 M. cardinalis TR1 和 TR2 区域的 M. parishii 和 M. verbenaceus 的同线图。

TR 染色体位置用红色箭头表示。橙色箭头表示基因,灰色框表示基因之间的正字。我们用正字法显示上游和下游的 5 个基因。


https://doi.org/10.1371/journal.pgen.1011738.s016


(PDF格式)


S11 图 来自 Erythranthe 部分物种(M. cardinalis、M. lewisii、M. parishii 和 M. verbenaceus)和外群 M. bicolor 和 M. primuloides 的 TR 基因的系统发育。

TR 基因系统发育显示按旁系同源物分组的序列。TR paralog 中的模板序列显示在右侧。内部节点表示 1,000 次重复后的引导支持。


https://doi.org/10.1371/journal.pgen.1011738.s017


(PDF格式)


S12 图 由 18 个 Mimulus 物种/亚种总 RNA 转录组(图 3B)和 M. bicolor 和 M. primuloides TR 序列组装的整个 TR 序列的系统发育。

支持 bootstrap >95% 的节点用红色圆圈表示。


https://doi.org/10.1371/journal.pgen.1011738.s018


(PDF格式)


确认

我们感谢 Choi 实验室的成员和 Stephanie Sage 在准备这项研究时提供的帮助。我们感谢 Rob Unckless 对手稿草稿的宝贵评论。我们还感谢堪萨斯大学基因组测序核心在转录组测序期间的支持。


引用

1.沃森 JD。串联 T7 DNA 的来源。Nat New Biol. 1972 年;239(94):197–201.PMID:4507727

查看文章PubMed/NCBI谷歌学术

2.奥洛夫尼科夫 AM.边缘切开理论。多核苷酸酶促合成中模板边缘的不完全复制和现象的生物学意义。J Theor Biol. 1973;41(1):181–90.PMID:4754905

查看文章PubMed/NCBI谷歌学术

3.谢伊 JW,赖特 WE。衰老和永生化:端粒和端粒酶的作用。发生。2005;26(5):867–74.PMID:15471900

查看文章PubMed/NCBI谷歌学术

4.波德列夫斯基 JD, 陈 JJ-L.端粒酶 RNA 结构和功能的进化观点。RNA 生物学 2016;13(8):720–32.PMID:27359343

查看文章PubMed/NCBI谷歌学术

5.Osterhage JL, Friedman KL. 端粒酶维持染色体末端。J Biol Chem. 2009;284(24):16061–5.PMID:19286666

查看文章PubMed/NCBI谷歌学术

6.Vega LR、Mateyak MK、Zakian VA。到达终点:酵母和人类中的端粒酶通路。Nat Rev Mol 细胞生物学 2003;4(12):948–59.PMID:14685173

查看文章PubMed/NCBI谷歌学术

7.de Lange T. Shelterin 介导的端粒保护。Annu Rev Genet.2018;52:223–47.PMID:30208292

查看文章PubMed/NCBI谷歌学术

8.Fulcher N, Derboven E, Valuchova S, Riha K.如果帽子合适,就戴上它:进化过程中的端粒结构概述。Cell Mol Life Sci. 2014 年;71(5):847–65.PMID:24042202

查看文章PubMed/NCBI谷歌学术

9.Meyne J、Ratliff RL、Moyzis RK。脊椎动物中人类端粒序列 (TTAGGG)n 的保守性。美国国家科学院院刊 1989 年;86(18):7049–53.PMID:2780561

查看文章PubMed/NCBI谷歌学术

10.Lim J, Kim W, Kim J, Lee J. 由高质量的基因组组装和亚端粒结构揭示的线虫门的端粒重复进化。基因组研究 2023;33(11):1947–57.PMID:37918961

查看文章PubMed/NCBI谷歌学术

11.Pardue ML, Danilevskaya ON, Lowenhaupt K, Slot F, Traverse KL. 果蝇端粒:染色体进化的新观点。趋势基因。1996;12(2):48–52.PMID:8851970

查看文章PubMed/NCBI谷歌学术

12.Kuznetsova V, Grozeva S, Gokhman V. 昆虫中的端粒结构:综述。J Zool Syst Evol Res. 2019;58(1):127–58.

查看文章谷歌学术

13.Vítková M, Král J, Traut W, Zrzavý J, Marec F.昆虫端粒重复序列的进化起源,(TTAGG)n. Chromosome Res. 2005;13(2):145–56.PMID:15861304

查看文章PubMed/NCBI谷歌学术

14.Červenák F, Sepšiová R, Nosek J, Tomáška Ľ. 端粒的逐步进化:酵母的教训.基因组生物学 Evol.2021;13(2):evaa268。PMID:33537752

查看文章PubMed/NCBI谷歌学术

15.Shakirov EV、Chen JJ-L、Shippen DE。植物端粒生物学:末端复制问题的绿色解决方案。植物细胞。2022;34(7):2492–504.PMID:35511166

查看文章PubMed/NCBI谷歌学术

16.Richards EJ, Ausubel FM. 从拟南芥中分离高级真核端粒。细胞。1988;53(1):127–36.PMID:3349525

查看文章PubMed/NCBI谷歌学术

17.Peska V, Garcia S. 植物端粒序列的起源、多样性和进化。前植物科学 2020;11:117。PMID:32153618

查看文章PubMed/NCBI谷歌学术

18.Adams SP、Hartman TP、Lim KY、Chase MW、Bennett MD、Leitch IJ 等人。拟南芥型端粒重复序列 5'-(TTTAGGG)(n)-3' 在开花植物主要辐射的进化中的丢失和恢复。Proc Biol Sci. 2001;268(1476):1541–6.PMID:11487399

查看文章PubMed/NCBI谷歌学术

19.Peška V, fajkus P, Fojtová M, Dvořáčková M, Hapala J, Dvořáček V, et al.植物秀丽隐杆线虫 (Solanaceae) 中不寻常的端粒基序 (TTTTTTAGGG)n 的特征,该物种具有大基因组。植物 J. 2015;82(4):644–54.PMID:25828846

查看文章PubMed/NCBI谷歌学术

20.Nozaki H、Takano H、Misumi O、Terasawa K、Matsuzaki M、Maruyama S 等人。100% 完整的序列揭示了温泉红藻 Cyanidioschyzon merolae 中异常简单的基因组特征。BMC 生物学 2007;5:28。PMID:17623057

查看文章PubMed/NCBI谷歌学术

21.Tran TD, Cao HX, Jovtchev G, Neumann P, Novák P, Fojtová M, et al.着丝粒和端粒序列的改变反映了食肉植物属 Genlisea 内的快速基因组进化。植物 J. 2015;84(6):1087–99.PMID:26485466

查看文章PubMed/NCBI谷歌学术

22.Fajkus P, peška v, sitová z, fulnečková j, dvořáčková M, gogela R, et al.揭开葱属端粒的面粒:不寻常的端粒序列 (CTCGGTTATGGG)n 是由端粒酶合成的。植物 J. 2016;85(3):337–47.PMID:26716914

查看文章PubMed/NCBI谷歌学术

23.格雷德 CW,布莱克本 EH。鉴定 Tetrahymena 提取物中的特异性端粒末端转移酶活性。细胞。1985;43(2 第 1 部分):405-13。PMID:3907856

查看文章PubMed/NCBI谷歌学术

24.格雷德 CW,布莱克本 EH。端粒重复合成所需的四膜虫端粒酶 RNA 中的端粒序列。自然界。1989;337(6205):331–7.PMID:2463488

查看文章PubMed/NCBI谷歌学术

25.Sýkorová E, Fajkus J. 端粒酶基因中的结构-功能关系。生物细胞。2009;101(7):375–92,1 页遵循 392。PMID:19419346

查看文章PubMed/NCBI谷歌学术

26.Gunisova S、Elboher E、Nosek J、Gorkovoy V、Brown Y、Lucier J-F 等人。来自念珠菌属的端粒酶 RNA 的鉴定和比较分析揭示了功能元件的保守性。核糖核酸。2009;15(4):546–59.PMID:19223441

查看文章PubMed/NCBI谷歌学术

27.Song J、Logeswaran D、Castillo-González C、Li Y、Bose S、Aklilu BB 等人。植物端粒酶 RNA 的保守结构为从纤毛虫到人类的进化途径提供了缺失的环节。美国国家科学院院刊 2019 年;116(49):24542–50.PMID:31754031

查看文章PubMed/NCBI谷歌学术

28.Fajkus P, Kilar A, Nelson ADL, Holá M, Peška V, Goffová I, et al.植物端粒酶 RNA 的进化:更远于过去,更深入根部。核酸研究 2021;49(13):7680–94.PMID:34181710

查看文章PubMed/NCBI谷歌学术

29.Fajkus P、Adámik M、Nelson ADL、Kilar AM、Franek M、Bubeník M 等人。膜翅目 (Insecta) 中的端粒酶 RNA 转变为植物/纤毛样生物发生。核酸研究 2023;51(1):420–33.PMID:36546771

查看文章PubMed/NCBI谷歌学术

30.庞 KC,弗里斯 MC,马蒂克 JS。非编码 RNA 的快速进化:缺乏保守并不意味着缺乏功能。趋势基因。2006;22(1):1–5.PMID:16290135

查看文章PubMed/NCBI谷歌学术

31.Mattick JS、Amaral PP、Carninci P、Carpenter S、Chang HY、Chen L-L 等人。长链非编码 RNA:定义、功能、挑战和建议。Nat Rev Mol 细胞生物学 2023;24(6):430–47.PMID:36596869

查看文章PubMed/NCBI谷歌学术

32.Kumawat S,Choi JY。看不到尽头:植物端粒变异的奥秘。Am J Bot.2023;110(11):e16244。PMID:37733763

查看文章PubMed/NCBI谷歌学术

33.齐 X, 谢 M, 布朗 AF, 布莱 CJ, 波德列夫斯基 JD, 陈 JJ-L.RNA/DNA 杂交结合亲和力决定了端粒酶模板易位的效率。EMBO J. 2012 年;31(1):150–61.PMID:21989387

查看文章PubMed/NCBI谷歌学术

34.Qi X、Li Y、Honda S、Hoffmann S、Marz M、Mosig A 等人。脊椎动物和真菌端粒酶 RNA 的共同祖先核心。核酸研究 2013;41(1):450–62.PMID:23093598

查看文章PubMed/NCBI谷歌学术

35.Mitchell JR, Collins K. 人端粒酶激活需要端粒酶 RNA 和端粒酶逆转录酶之间的两个独立相互作用。分子细胞。2000;6(2):361–71.PMID:10983983

查看文章PubMed/NCBI谷歌学术

36.Chen JL, Opperman KK, Greider CW.哺乳动物端粒酶 RNA CR4-CR5 结构域中的关键茎环结构。核酸研究 2002;30(2):592–7.PMID:11788723

查看文章PubMed/NCBI谷歌学术

37.Mason DX, Goneska E, Greider CW. 四膜虫端粒酶 RNA 的茎环 IV 刺激反式 Mol Cell Biol. 2003 的持续合成能力;23(16):5606–13.PMID:12897134

查看文章PubMed/NCBI谷歌学术

38.谢 M, 莫西格 A, 齐 X, 李 Y, Stadler PF, 陈 JJ-L.来自硬骨鱼的最小脊椎动物端粒酶 RNA 的结构和功能。J Biol Chem. 2008 年;283(4):2049–59.PMID:18039659

查看文章PubMed/NCBI谷歌学术

39.端粒酶是进行性的。分子细胞生物学 1991;11(9):4572–80.PMID:1875940

查看文章PubMed/NCBI谷歌学术

40.Peska V, Fajkus P, Bubeník M, Brázda V, Bohálová N, Dvořáček V, et al.酵母菌科中端粒、端粒酶 RNA 及其模板区域的非凡多样性。科学代表 2021;11(1):12784.PMID:34140564

查看文章PubMed/NCBI谷歌学术

41.Chen JL, Greider CW. 哺乳动物端粒酶 RNA 中的决定因素,介导酶持续合成性和跨物种不相容性。EMBO J. 2003 年;22(2):304–14.PMID:12514136

查看文章PubMed/NCBI谷歌学术

42.Drosopoulos WC、Direnzo R、Prasad VR。人端粒酶 RNA 模板序列是端粒重复延伸速率的决定因素。J Biol Chem. 2005 年;280(38):32801–10.PMID:16061476

查看文章PubMed/NCBI谷歌学术

43.Gilley D, Lee MS, 布莱克本 EH.改变特异性端粒酶 RNA 模板残基会影响活性位点功能。基因开发 1995;9(18):2214–26.PMID:7557376

查看文章PubMed/NCBI谷歌学术

44.Henning KA, Moskowitz N, Ashlock MA, Liu PP. 酵母端粒酶模板人源化。美国国家科学院院刊 1998 年;95(10):5667–71.PMID:9576941

查看文章PubMed/NCBI谷歌学术

45.巴克 WR、内索姆 GL、比尔兹利 PM、弗拉加 NS。Phrymaceae 的分类学范围:Mimulus 的狭窄范围,新的和复活的属,以及新的名称和组合。植物神经元。2012;2012:1–60.

查看文章谷歌学术

46.Lowry DB、Sobel JM、Angert AL、Ashman T、Baker RL、Blackman BK 等。所有猴花继续使用属名 Mimulus 的情况。分类群。2019;68(4):617–23.

查看文章谷歌学术

47.Wu CA、Lowry DB、Cooley AM、Wright KM、Lee YW、Willis JH。Mimulus 是一种新兴的模型系统,用于整合生态学和基因组学研究。遗传 (Edinb)。2008;100(2):220–30.PMID:17551519

查看文章PubMed/NCBI谷歌学术

48.袁 Y-W.猴花 (Mimulus):植物发育遗传学和 evo-devo 的新模型。新植物醇。2019;222(2):694–700.PMID:30471231

查看文章PubMed/NCBI谷歌学术

49.Závodník M, Fajkus P, Franek M, Kopecký D, Garcia S, Dodsworth S, et al.植物中的端粒酶 RNA 基因旁系同源物 - 获得不寻常端粒的常见途径。新植物醇。2023;239(6):2353–66.PMID:37391893

查看文章PubMed/NCBI谷歌学术

50.Choi JY, Abdulkina LR, Yin J, Chastukhina IB, Lovell JT, Agabekian IA, et al.植物端粒长度的自然变化与开花时间有关。植物细胞。2021;33(4):1118–34.PMID:33580702

查看文章PubMed/NCBI谷歌学术

51.Wei KH-C、Grenier JK、Barbash DA、Clark AG。黑腹果蝇品系之间卫星 DNA 丰度的相关变异和种群分化。美国国家科学院院刊 2014 年;111(52):18793–8.PMID:25512552

查看文章PubMed/NCBI谷歌学术

52.Wei KH-C、Lower SE、Caldas IV、Sless TJS、Barbash DA、Clark AG。果蝇系统发育中简单卫星增益的可变速率。分子生物学 Evol.2018;35(4):925–41.PMID:29361128

查看文章PubMed/NCBI谷歌学术

53.斯坦科夫斯基 S、蔡斯 MA、福腾 AM、罗德里格斯 MF、拉尔夫 PL、斯特赖斯菲尔德 MA。广泛的选择和基因流动塑造了猴花辐射期间的基因组景观。PLoS 生物学 2019;17(7):e3000391。PMID:31339877

查看文章PubMed/NCBI谷歌学术

54.特罗斯 A、普泽 JR、金 RS、威利斯 JH、凯利 JK。选择性权衡维持了支撑植物复杂性状变异的等位基因。科学。2018;361(6401):475–8.PMID:30072534

查看文章PubMed/NCBI谷歌学术

55.LaFountain AM、McMahon HE、Reid NM、Yuan Y-W。条纹或不条纹:猴花 (Mimulus) 中一种新型叶面色素沉着模式的起源。新植物醇。2023;237(1):310–22.PMID:36101514

查看文章PubMed/NCBI谷歌学术

56.Morales-Briones DF、Lin N、Huang EY、Grossenbacher DL、Sobel JM、Gilmore CD 等人。Phrymaceae 的系统发育分析揭示了主要分支之间关系中广泛的基因树不一致。Am J Bot.2022;109(6):1035–46.PMID:35462411

查看文章PubMed/NCBI谷歌学术

57.Kumar S、Stecher G、Suleski M、Hedges SB. 时间树:时间线、时间树和发散时间的资源。分子生物学 Evol.2017;34(7):1812–9.PMID:28387841

查看文章PubMed/NCBI谷歌学术

58.Lin KW, Yan J. 中间的结尾:间质端粒序列的当前知识。Mutat Res. 2008 年;658(1–2):95–110.PMID:17921045

查看文章PubMed/NCBI谷歌学术

59.Mosig A, Chen JJ-L, Stadler PF. 使用片段化核酸序列模式进行同源搜索。计算机科学讲义。施普林格柏林海德堡。2007;335–45.https://doi.org/10.1007/978-3-540-74126-8_31

60.Infernal 1.1:RNA 同源性搜索速度提高 100 倍。生物信息学。2013;29(22):2933–5.PMID:24008419

查看文章PubMed/NCBI谷歌学术

61.Fajkus P, peška v, závodník m, fojtová m, fulnečková j, dobias š, et al.陆地植物中的端粒酶 RNA。核酸研究 2019;47(18):9842–56.PMID:31392988

查看文章PubMed/NCBI谷歌学术

62.Grabherr MG、Haas BJ、Yassour M、Levin JZ、Thompson DA、Amit I 等人。来自 RNA-Seq 数据的全长转录组组装,无需参考基因组。国家生物技术.2011;29(7):644–52.PMID:21572440

查看文章PubMed/NCBI谷歌学术

63.Forsythe ES、Grover CE、Miller ER、Conover JL、Arick 2nd MA、Chavarro MCF 等人。细胞器转录物在不同倍性水平的植物的细胞 mRNA 库中占主导地位。美国国家科学院院刊 2022 年;119(30):e2204187119。PMID:35858449

查看文章PubMed/NCBI谷歌学术

64.埃德加 RC。MUSCLE:多序列比对,准确度高,通量高。核酸研究 2004;32(5):1792–7.PMID:15034147

查看文章PubMed/NCBI谷歌学术

65.Shakirov EV、Song X、Joseph JA、Shippen DE。绿藻和陆地植物中的 POT1 蛋白:DNA 结合特性和与端粒 DNA 共同进化的证据。核酸研究 2009;37(22):7455–67.PMID:19783822

查看文章PubMed/NCBI谷歌学术

66.Delahaye C, Nicolas J. 用纳米孔对 DNA 进行测序:麻烦和偏差。公共科学图书馆一号。2021;16(10):e0257521。PMID:34597327

查看文章PubMed/NCBI谷歌学术

67.Lyčka M, Peska V, Demko M, Spyroglou I, Kilar A, Fajkus J, et al. WALTER:一种从末端限制性片段分析中在线评估端粒长度的简单方法。BMC 生物信息学。2021;22(1):145.PMID:33752601

查看文章PubMed/NCBI谷歌学术

68.Fajkus J. 通过 TRAP 测定法检测端粒酶活性及其变体和替代品。Clin Chim Acta.2006;371(1–2):25–31.PMID:16616059

查看文章PubMed/NCBI谷歌学术

69.Liang M, Chen W, LaFountain AM, Liu Y, Peng F, Xia R, et al.分类单元特异性、分阶段 siRNA 是猴花物种形成位点的基础。科学。2023;379(6632):576–82.PMID:36758083

查看文章PubMed/NCBI谷歌学术

70.Force A, Lynch M, Pickett FB, Amores A, Yan YL, Postlethwait J. 通过互补、退行性突变保存重复基因。遗传学。1999;151(4):1531–45.PMID:10101175

查看文章PubMed/NCBI谷歌学术

71.Fishman L、Stathos A、Beardsley PM、Williams CF、Hill JP。mimulus(猴花)中的染色体重排和生殖屏障的遗传学。演化。2013;67(9):2547–60.PMID:24033166

查看文章PubMed/NCBI谷歌学术

72.Freeling M. 不同种类重复后植物基因含量的偏差:串联、全基因组、分段或转座。Annu Rev 植物生物学 2009;60:433–53.PMID:19575588

查看文章PubMed/NCBI谷歌学术

73.韦伦 JH。自私的遗传元素、遗传冲突和进化创新。美国国家科学院院刊 2011 年;108 增刊 2(增刊 2):10863–70。PMID:21690392

查看文章PubMed/NCBI谷歌学术

74.Jr McLaughlin RN,Malik HS。遗传冲突:通常的嫌疑人及其他。J Exp Biol. 2017;220(第 1 部分):6-17。PMID:28057823

查看文章PubMed/NCBI谷歌学术

75.Cerbin S, 江 N. 转座因子对宿主基因的复制。Curr Opin Genet Dev. 2018;49:63–9.PMID:29571044

查看文章PubMed/NCBI谷歌学术

76.麦凯克恩 MJ,布莱克本 EH。出芽酵母异常多样化的端粒序列中的保守序列基序。美国国家科学院院刊 1994 年;91(8):3453–7.PMID:8159768

查看文章PubMed/NCBI谷歌学术

77.Hellsten U、Wright KM、Jenkins J、Shu S、Yuan Y、Wessler SR 等人。从群体鸟枪测序推断的 Mimulus 减数分裂重组的细微变化。美国国家科学院院刊 2013 年;110(48):19478–82.PMID:24225854

查看文章PubMed/NCBI谷歌学术

78.Li H. 用 BWA-MEM 比对序列读取、克隆序列和组装重叠群。arXiv.2013.

查看文章谷歌学术

79.昆兰 AR,霍尔 IM。BEDTools:一套用于比较基因组特征的灵活实用程序。生物信息学。2010;26(6):841–2.PMID:20110278

查看文章PubMed/NCBI谷歌学术

80.Li H, Handsaker B, Wysoker A, Fennell T, Ruan J, Homer N, et al. The Sequence Alignment/Map format and SAMtools. Bioinformatics. 2009;25(16):2078–9. pmid:19505943

View ArticlePubMed/NCBIGoogle Scholar

81.Wickham H. ggplot2. WIREs Computational Stats. 2011;3(2):180–5.

View ArticleGoogle Scholar

82.Doyle J. DNA Protocols for Plants. Molecular Techniques in Taxonomy. Springer Berlin Heidelberg. 1991;283–93. https://doi.org/10.1007/978-3-642-83962-7_18

83.Langmead B, Trapnell C, Pop M, Salzberg SL. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome. Genome Biol. 2009;10(3):R25. pmid:19261174

View ArticlePubMed/NCBIGoogle Scholar

84.Simão FA, Waterhouse RM, Ioannidis P, Kriventseva EV, Zdobnov EM. BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs. Bioinformatics. 2015;31(19):3210–2. pmid:26059717

View ArticlePubMed/NCBIGoogle Scholar

85.Camacho C, Coulouris G, Avagyan V, Ma N, Papadopoulos J, Bealer K, et al. BLAST+: architecture and applications. BMC Bioinformatics. 2009;10:421. pmid:20003500

查看文章PubMed/NCBI谷歌学术

86.Kumar S, Stecher G, Li M, Knyaz C, Tamura K. MEGA X:跨计算平台的分子进化遗传学分析。分子生物学 Evol.2018;35(6):1547–9.PMID:29722887

查看文章PubMed/NCBI谷歌学术

87.Stamatakis A. RAxML 版本 8:用于大型系统发育分析和后分析的工具。生物信息学。2014;30(9):1312–3.PMID:24451623

查看文章PubMed/NCBI谷歌学术

88.Ossowski S、Schneeberger K、Lucas-Lledó JI、Warthmann N、Clark RM、Shaw RG 等人。拟南芥自发突变的速率和分子谱。科学。2010;327(5961):92–4.PMID:20044577

查看文章PubMed/NCBI谷歌学术

89.Li H. Minimap2:核苷酸序列的成对比对。生物信息学。2018;34(18):3094–100.PMID:29750242

查看文章PubMed/NCBI谷歌学术

90.菲茨杰拉德 MS, Riha K, Gao F, 任 S, 麦克奈特 TD, 希彭 DE.拟南芥端粒酶催化亚基基因的破坏使端粒酶失活并导致端粒 DNA 的缓慢丢失。美国国家科学院院刊 1999 年;96(26):14813–8.PMID:10611295

查看文章PubMed/NCBI谷歌学术

91.皮尔森 SN、巴特勒 JN、福斯特 RG。定量实时 PCR 数据分析的新型和传统方法的实验验证。核酸研究 2003;31(14):e73。PMID:12853650

查看文章PubMed/NCBI谷歌学术

92.菲茨杰拉德 MS,麦克奈特 TD,希彭 DE。植物端粒酶表达的表征和发育模式。美国国家科学院院刊 1996 年;93(25):14422–7.PMID:8962067

查看文章PubMed/NCBI谷歌学术

93.Banerjee PP, Jagadeesh S. 评估端粒酶活性和端粒长度的非放射性测定方法。染色质实验方案:第二版。2009;383–94.

94.Závodník M, Fajkus P, Franek M, Kopecký D, Garcia S, Dodsworth S, et al.植物中的端粒酶 RNA 基因旁系同源物 - 获得不寻常端粒的常见途径。新植物醇。2023;239(6):2353–66.PMID:37391893

查看文章PubMed/NCBI谷歌学术

95.Koo D-H, Molin WT, Saski CA, 江 J, 普塔 K, Jugulam M 等人。基于染色体外环状 DNA 的扩增和农作物杂草 Amaranthus palmeri 除草剂抗性传递。美国国家科学院院刊 2018 年;115(13):3332–7.PMID:29531028

查看文章PubMed/NCBI谷歌学术

96.Ijdo JW, Wells RA, Baldini A, Reeders ST. 使用 PCR 生成的端粒重复探针 (TTAGGG)n 改进端粒检测。核酸研究 1991;19(17):4780.PMID:1891373

查看文章PubMed/NCBI谷歌学术

97.Emms DM, Kelly S. OrthoFinder: 解决全基因组比较中的基本偏差可显著提高正交群推断的准确性。基因组生物学 2015;16(1):157.PMID:26243257

查看文章PubMed/NCBI谷歌学术

98.Emms DM,Kelly S. OrthoFinder:比较基因组学的系统发育正交推断。基因组生物学 2019;20(1):238.PMID:31727128

查看文章PubMed/NCBI谷歌学术


阅读5
分享
写下您的评论吧