按照惯例,真核生物的启动子更加复杂。真核生物有三种RNAP,所以有相应的三类启动子。RNAP I负责转录rRNA,对应的是I类(class I)启动子,由核心启动子(-45至+20)和上游控制元件(-180至-107)构成。
小RNA对应的III类启动子又有3种类型,其中5 S rRNA基因和tRNA基因的启动子都属于下游启动子,即位于转录起点下游。其内部包含box A、box B、boxC等元件,需要由TFIIIA、TFIIIC等转录因子识别。而snRNA的启动子位于转录起点上游。
RNAP III的启动子与转录过程。Biochem Soc Trans. 2016
研究最多的还是II类启动子,对应转录蛋白质编码基因的RNAP II(Pol II)。其TATA box相当于原核的Pribnow box,位于-25至-32位;在大约-80位有CAAT box,相当于原核的-35序列;另外还有GC box和八聚体(octamer)box,以及一些应答元件(response element)等。
TATA box又称为基本启动子(basal promoter),它与上游的TFIIB识别元件(TFIIB recognition element,BRE)、以转录起始位点为中心的起始子(initiator, Inr),以及下游启动子元件(downstream promoter element, DPE)一起构成核心启动子,其它均称为上游元件。
在真核生物的转录调控中,另一种常用的顺式元件是增强子(enhancer)。增强子是与辅因子和转录因子(TFs)结合的DNA元件,能够通过直接刺激启动子(通常通过染色质环)来增加其靶基因的转录水平。
增强子通过启动子调控转录。Oncotarget. 2015
启动子的位置是确定的,即与基因之间有特定的距离和方向。增强子则不同,它可能与其调节的启动子相距数千Kb,可以在上游或下游。当处于非活性状态时,二者不会靠近。但在活性状态下,增强子通过形成环状结构而在三维空间上接近启动子,并将相应转录因子募集到该区域,从而促进基因表达。
转录调控与染色质结构密切相关。活性增强子通常没有核小体结构,以利于TF的结合。而其附近的组蛋白经常具有表观遗传标记,例如H3K4me1(组蛋白H3的4位赖氨酸单甲基化)和H3K27的乙酰化(H3K27ac)。而H3K4的三甲基化(H3K4me3)通常在基因启动子上富集。
增强子与启动子的表观遗传标记。Cells. 2019
参与转录调控的顺式元件还包括绝缘子(insulator)和沉默子(silencer)等。前者可以隔绝某些顺式元件对基因表达的调控作用,也可以防止异染色质扩散;后者抑制某一区域内的转录。
真核生物的转录起始同样分为3个步骤,先识别启动子形成封闭的前起始复合物,然后DNA解链形成开放复合物;最后通过“启动子解脱”过渡到延伸阶段。
真核转录的早期步骤。Genes Dev. 2019
原核生物的初始封闭复合物(RPC)由RNAP和promoter构成,而真核生物的启动子识别还需要很多转录因子(transcription factor,TF),它们起着类似σ因子的作用。真核生物的初始封闭复合物称为前起始复合物(preinitiation complex,PIC),其中包括中介体复合物(mediator complex)和多种通用转录因子(GTF),如TFIIA,TFIIB,TFIID,TFIIE,TFIIF和TFIIH。
TFIID识别核心启动子。Nat Rev Genet. 2010
TFIID是真核mRNA基因的核心启动子识别因子,是一个很大的组装体,分子量大于1 MD。它包括TATA结合蛋白(TBP)和13-14个不同的TBP相关因子(TAF)。TFIID识别DNA上的核心启动子区域,随后募集Pol II,TFIIH和Mediator复合物,组装前起始复合物。
TFIID结构与RNAP的募集。Curr Opin Struct Biol. 2019
Mediator(中介体)也是一个分子量上兆的巨大复合物,参与PIC的募集与组装。它与Pol II大亚基Rpb1的羧端结构域(CTD)相互作用,当CTD非磷酸化时二者结合,磷酸化后就会分离。中介体也参与转录调控,根据其组分不同而对转录其促进或抑制作用。
当TFIIH被募集之后,TFIIH相关的解旋酶会促进转录泡的形成,并允许模板DNA进入Pol II活性位点。这样就启动了RNA合成,在Pol II活性位点内产生杂合双链。
RNA不断延伸,但复合体与启动子的结合仍然存在,从而阻止了聚合酶向前移动,因而不断积累应力。在形成大于10 nt的RNA后,转录泡的上游区域坍塌,从而允许模板链和编码链DNA重新结合。
有人认为该过程获得的能量可以推动聚合酶向前运动,使启动子解脱步骤得以实现。当然启动子解脱也是一个复杂的过程,还涉及Pol II羧端结构域(CTD)的磷酸化等过程。CTD的磷酸化可以干扰其与中介体(Mediator)的结合,协助与启动子的脱离。
现已陆续发现,在转录起始过程中,会有多种RNA参与。例如,增强子会转录出增强子RNA(eRNA),可以稳定染色质环,还可能参与转录延伸过程。
eRNA稳定染色质环。Epigenet Insights. 2019
一些转录组研究表明,多数基因的启动子区域会转录出一些非编码RNA,称为启动子相关非编码RNA(promoter-associated noncoding RNAs,pancRNAs)。它们可能通过顺式元件作用促进或抑制转录,已有多种模型(J Exp Clin Cancer Res. 2020)。
pancRNA作用机制模型。J Exp Clin Cancer Res. 2020
上世纪60年代就已经发现,原核和真核RNA聚合酶可以利用2-8 nt的RNA 在体外引发转录起始。2011年,Goldman等人在铜绿假单胞菌(Pseudomonas aeruginosa)中发现,2-4 nt 的nanoRNA(纳米RNA)可在体内引发转录起始(Mol Cell. 2011)。
纳米RNA调控转录起始。J Mol Biol. 2011
这种极小的RNA可被特异性的寡核糖核酸酶(Orn)降解,Orn的失活会导致nanoRNA积累并引发广泛的RNA转录。所以nanoRNA介导的启动可以作为一种基因表达调控方式。
参考文献:
Tomasz W Turowski, et al. Transcription by RNA polymerase III: insights into mechanism and regulation. Biochem Soc Trans. 2016 Oct 15;44(5):1367-1375.
Rebecca C Poulos, et al. The search for cis-regulatory driver mutations in cancer genomes. Oncotarget. 2015 Oct 20;6(32):32509-25.
Ji-Han Xia, et al. Enhancer Dysfunction in 3D Genome and Disease. Cells. 2019 Oct 19;8(10):1281.
Leighton Core, et al. Promoter-proximal pausing of RNA polymerase II: a nexus of gene regulation. Genes Dev. 2019 Aug 1;33(15-16):960-982.
James A Goodrich, et al. Unexpected roles for core promoter recognition factors in cell-type-specific transcription and gene regulation. Nat Rev Genet. 2010 Aug;11(8):549-58.
Avinash B Patel, et al. Recent insights into the structure of TFIID, its assembly, and its binding to core promoter. Curr Opin Struct Biol. 2020 Apr;61:17-24.
Josué Cortés-Fernández de Lara, et al. Enhancer RNAs: Insights Into Their Biological Role. Epigenet Insights. 2019 May 7;12:2516865719846093.
Lidia Chellini, et al. Dissecting the transcriptional regulatory networks of promoter-associated noncoding RNAs in development and cancer. J Exp Clin Cancer Res. 2020 Mar 17;39(1):51.
Seth R Goldman, et al. NanoRNAs prime transcription initiation in vivo. Mol Cell. 2011 Jun 24;42(6):817-25.
Bryce E Nickels, et al. NanoRNAs: a class of small RNAs that can prime transcription initiation in bacteria. J Mol Biol. 2011 Oct 7;412(5):772-81.