【Genome Research】陈明生研究组在核糖体RNA基因拷贝数变异和表达调控方面取得重要进展

2018-09-04

  核糖体是细胞中最重要的细胞器之一,负责将细胞转录出来的信使RNAmessenger RNA,简称“mRNA”)翻译成蛋白质。真核生物的核糖体,主要由4种核糖体 RNArRNA)和80多种核糖体蛋白组成。其中,45S rRNA基因位点通过转录加工可以产生18S5.8S25S rRNA;而5SrRNA基因位点行使5S rRNA的转录。随后,25S5.8S以及5S RNA结合核糖体蛋白形成核糖体大亚基,同时18S RNA与其他核糖体蛋白形成核糖体小亚基,最终组装成细胞中的“蛋白加工工厂”。 

  在绝大多数真核生物的基因组内,不论45S rRNA基因还是5S rRNA基因都在染色体上以多拷贝串联重复的形式存在。然而,这种高度串联重复结构存在的生物学意义目前并没有明确结论。之前,唯一一项对于45S rRNA基因拷贝数变异的大规模研究发生在人类群体中,研究表明人基因组内45S基因位点在个体间存在广泛变异,并且发现其拷贝数与众多基因的表达调控显著相关。然而,对于45S rRNA基因拷贝数如何调控基因表达并没有任何阐述。 

  中国科学院遗传与发育生物学研究所陈明生研究组工作人员李博博士,通过利用玉米一个高多态性的育种群体(maize 282 diversity panel)重测序数据,对每个玉米的自交系的45S rRNA以及其它高度串联重复元件的基因拷贝数进行了准确估算,发现了玉米群体中45S rRNA存在广泛变异(1061~17347 copy),并且受到玉米群体结构的影响(图1)。广泛遗传力分析表明这些串联重复元件具有较高的遗传力,然而再利用GWAS分析时,却很难定位已知的遗传位点,表现出常见的“遗传力丢失”现象(missing heritability)。为了在玉米群体中重复人类核糖体拷贝数变异与基因表达的关系,研究人员利用该群体的7个不同组织材料大约2,100个转录组数据,对45S的拷贝数与基因表达水平进行了相关分析。然而,在所有7个组织内,并没有鉴定出大量受到45S拷贝数调控的基因。 

  研究人员随后将目光转向了45S rRNA基因的表达。众所周知,核糖体RNA的转录本占细胞总RNA80%以上,在进行mRNA测序时,最重要的就是将rRNA污染去除。然而,通过一种3’mRNA-seq技术,可以无需对核糖体RNA预先进行分离,因为只有具有polyA)尾的成熟mRNA才会被反转并测序。令人奇怪的是,研究人员却在测序数据中发现了大量来源于rRNA的序列数据。深入分析发现,这些数据应该是源于45S基因序列中存在许多类似于polyA)的序列片段,通过与引物上的polyT)不完全匹配后完成了对45S转录本的部分区域的测序(图2)。值得注意的是,这种现象在2100个测序文库的数据分析中完美重复,因此该数据可以用来对rRNA的表达水平进行定量分析。利用该数据,研究人员首次对于rRNA的表达水平在群体、不同组织以及不同发育时期的差异表达进行了分析,发现核糖体RNA45S rRNA)的表达并不想人们之前想象的那么保守,而是存在着广泛的变异。 

  研究人员随后又将45S rRNA的表达水平与各个组织中的基因表达水平进行了共表达分析,结果发现了大量的与45S rRNA共表达的基因,GO分析显示与核糖体合成相关的基因数量显著,其中包括大量的核糖体蛋白基因(r-protein genes)。此外,不同组织中都存在与自身发育相关的共表达基因,比如在幼苗的根部和芽部,大量的抗性基因与45S rRNA表达量显著相关,表明在幼苗发育时期需要构建大量的防御系统来保护自身的生存。 

  最后,研究人员将45S rRNA的拷贝数以及表达水平与群体的田间性状进行了相关分析,发现两者都对于开花相关性状显著相关;然而,后续分析表明两者可能是通过不同的途径对开花性状进行了干预。 

  该研究在2018830日的Genome Research在线发表(DOI:10.1101/gr.229716.117)。陈明生研究组的李博博士为文章的第一作者,陈明生研究员与李博助理研究员为该论文的共同通讯作者。美国康奈尔大学的Edward Buckler教授及其团队为该研究的顺利完成提供了重要支持。该论文得到了国家自然科学基金项目的资助。     

1:各种高度串联重复序列在玉米群体中的拷贝数变异。(A)45S rRNA(B)5S rRNA,以及玉米knob区域中的两种串联重复序列;(C)Knob 180;(D)Knob TR1 

 

2:利用3mRNA sequencing技术可以获得45S rRNA表达的定量分析。(A)RNA-seq数据比对到45S rRNA基因位点上可以发现5个明显的Peak区,这些都是来源于45S rRNA的测序reads(B)玉米45S的结构图;(C)序列分析发现Peak区附近多AAA串联序列,可能是导致与poly(T)匹配并被测序的主要原因。 

全文链接:Co-regulation of ribosomal RNA with hundreds of genes contributes to phenotypic variations

附件: