snoRNA 的結(jié)構(gòu)與功能
編者按:不同生物中RNA 結(jié)構(gòu)和功能多樣性與生命多樣性的關(guān)系等問題是當(dāng)前生命科學(xué)重大基礎(chǔ)研究的前沿,特別隨著基因組、蛋白質(zhì)組計劃相繼提出后,RNA 組學(xué)研究已經(jīng)成為分子生物學(xué)研究的新的生長點。本期RNA 專題由王恩多院士牽頭,共組織了八篇與RNA 研究相關(guān)的高質(zhì)量文章。在此,向王恩多院士及各位專家對本刊的大力支持表示衷心的感謝!
張筱晨, 周 惠, 屈良鵠*
(中山大學(xué)生物工程研究中心,廣州510275)
摘 要:核仁小分子RNA(snoRNA)是一類廣泛分布于真核生物細胞核仁的小分子非編碼RNA,具有保守的結(jié)構(gòu)元件,并以此劃分為3 大類:box C/D snoRNA、box H/ACA snoRNA 和MRP RNA。其中box C/D 和box H/ACA 是已知snoRNA 的主要類型,以堿基配對的方式分別指導(dǎo)著核糖體RNA 的甲基化和假尿嘧啶化修飾。研究發(fā)現(xiàn),snoRNA 除了在核糖體RNA 的生物合成中發(fā)揮作用之外,還能夠指導(dǎo)snRNA、tRNA 和mRNA 的轉(zhuǎn)錄后修飾。此外,還有相當(dāng)數(shù)量的snoRNA 功能不明,被稱為孤兒snoRNA(orphan snoRNA)。在哺乳動物的孤兒snoRNA 中,印跡snoRNA(imprinted snoRNA)是最為特殊的一群,由基因組印跡區(qū)編碼,具有明顯的組織表達特異性。原核生物古細菌中類snoRNA 的鑒定表明這些非編碼RNA 家族成員的古老起源;而哺乳動物中大量的snoRNA 反轉(zhuǎn)座子的存在更為人們探索snoRNA 在基因組中擴增和功能進化提供了新的思路。
關(guān)鍵詞:snoRNA;基因組印跡;snoRNA 反轉(zhuǎn)座子
中圖分類號:Q752; Q522 文獻標(biāo)識碼:A
Structure and function of snoRNAs
ZHANG Xiao-chen, ZHOU Hui, QU Liang-hu*
(Biotechnology Research Center, Sun Yat-Sen University, Guangzhou 510275, China)
Abstract: Small nucleolar RNAs (snoRNAs) represent an abundant group of noncoding RNAs with existence in the nucleolus of eukaryotes. Based on the conserved structure elements, the majority of snoRNAs can be divided into two families, box C/D snoRNAs and box H/ACA snoRNAs, which function on 2' -O- methylation and pseudouridylation of rRNA, respectively, through the formation of a canonical guide RNA duplex at the modification site. However, recent studies show that the complexity of the two snoRNA guide families is far beyond expectation. Dozes of novel snoRNAs target other cellular RNAs, including snRNAs, tRNAs and even mRNAs. In addition, an increasing number of orphan snoRNAs without known targets were identified, and remarkably, imprinted snoRNAs were among them, which are encoded by genomic imprinting region and expressed in a tissue-specific pattern. Furthermore, the ancient origin of these noncoding RNA families was reflected by the identification of snoRNA homologs in Archaea, and latest characterization of snoRNA retrogenes offers new perspectives to their proliferation and evolution.
Key words: snoRNA; genomic imprinting; snoRNA retrogene
核仁小分子RNA(small nucleolar RNA, snoRNA)是一類小分子非編碼RNA,且多富集于核仁,代謝穩(wěn)定。典型的snoRNA 具有如下主要特征:分子大小約為60 - 400 nt;具有類似核仁提取物的性質(zhì)(抗鹽性);需要與特定蛋白質(zhì)結(jié)合形成核糖核蛋白體(ribonucleoprotein paricles, snoRNP),并以此形式存在和行使功能;snoRNA 分子具有多種與蛋白質(zhì)相互作用的保守序列元件[1]。
snoRNA在核糖體RNA前體的剪接加工和轉(zhuǎn)錄后修飾過程中起重要作用,主要與2'-O- 核糖甲基化及假尿嘧啶化修飾有關(guān)[2]。
研究表明,在每個真核生物的核糖體上,分別有大約50 - 100 個的2'- O- 核糖甲基化和假尿嘧啶化的修飾位點。這些修飾位點都位于成熟核糖體中最保守的重要功能區(qū),特別是肽基轉(zhuǎn)移酶中心和大小亞基結(jié)合部位。雖然這些由snoRNA 指導(dǎo)的核苷酸修飾看起來對于細胞的生存和生長并非必需,但這些修飾可能調(diào)整rRNA 折疊以及與核糖體蛋白的相互關(guān)系,從而對核糖體的生物合成和活性起到調(diào)節(jié)作用。
由于snoRNA 與真核生物核糖體的密切聯(lián)系,自20 世紀(jì)90 年代以來,snoRNA 日益受到人們的高度關(guān)注。尤其隨著近年來在計算機RNA組學(xué)和實驗RNA組學(xué)上的突破[3,4],對snoRNA的研究迅速發(fā)展,揭示出snoRNA 的結(jié)構(gòu)與功能、基因組織和表達方式等方面高度的多樣性。
1 snoRNA的結(jié)構(gòu)與分類
根據(jù)結(jié)構(gòu)元件,目前已知的snoRNA 可以劃分為3 大類:box C/D snoRNA、box H/ACA snoRNA 和MRP RNA[1,5,6]。MRP RNA是極為特殊的snoRNA,在數(shù)量和功能上都迥異于其他snoRNA。
MRP RNA 只有一種分子存在于細胞中,并與九種蛋白質(zhì)結(jié)合形成MRP RNA 復(fù)合物,參與5.8S rRNA 的加工和線粒體DNA 的復(fù)制;另外,作為RNase P 的RNA 成分,它參與了tRNA 的5' 端成熟過程。細胞中主要的snoRNA 是box C/D snoRNA 和box H/ACA snoRNA。
1.1 box C/D snoRNA 家族 box C/D snoRNA 包含有兩個短的序列元件,即位于5 ' 末端的box C(RUGAUGA)和3' 末端的box D(CUGA)。多數(shù)box C/ D snoRNA基因的5' 和3' 末端都有4 - 5 nt 的反向重復(fù)序列,可以形成較為穩(wěn)定的短莖結(jié)構(gòu),這一結(jié)構(gòu)在snoRNA 的生物合成和核仁定位過程中起關(guān)鍵作用。
大部分box C/D snoRNA 分子的中部,還具有類似于box C 和box D 的結(jié)構(gòu),通常分別表現(xiàn)出 1 - 2 個核苷酸的差異,被稱為box C' 和box D'。 box C' 和box D' 的間距通常介于3 - 9 nt 之間,也能通過內(nèi)部的短莖結(jié)構(gòu)將其拉近。大部分 box C/D snoRNA 都是通過反義互補行使功能,最為常見的是指導(dǎo)rRNA 特定位點的2'-O- 甲基化修飾。所謂“反義互補”是指在box D 或box D' 上游的一段10 - 21nt 的片斷,能夠與靶RNA 形成嚴謹配對,從而指導(dǎo)特定位點的修飾。其中少數(shù)box C/D snoRNA具有兩段反義序列。實驗證明,被修飾位點精確對應(yīng)于box D 或box D' 上游第5 個核苷酸 。
在細胞中,snoRNA 與蛋白質(zhì)動態(tài)結(jié)合,形成 snoRNP 復(fù)合物在RNA 的生物合成、運輸及行使功能的過程中發(fā)揮作用。box C/D和box H/ACA snoRNA 家族各有一套不同的結(jié)合蛋白。box C/D snoRNP 包含四種進化上保守的,必需的蛋白質(zhì),即纖維蛋白 (fibrillarin)/Nop1p、Nop56、Nop58/Nop5p和p15.5KD/ Snu13p。纖維蛋白具有S- 腺苷甲硫氨酸依賴的甲基化轉(zhuǎn)移酶的重要結(jié)構(gòu)特征。
實驗證明當(dāng)纖維蛋白的類甲基化酶結(jié)構(gòu)域發(fā)生突變時,rRNA上的甲基化被阻斷,因而纖維蛋白被預(yù)測為與box C/D snoRNA 協(xié)同作用的2'-O- 核糖甲基化酶。Nop56 和 Nop58 在序列上高度相似,可能源自同一祖先。
p15.5KD蛋白(酵母Snu13p)能特異性地結(jié)合box C 和 box D 結(jié)構(gòu)元件,形成一個Kink-turn 結(jié)構(gòu)域,即一個不對稱的3nt的內(nèi)環(huán),其兩側(cè)分別是規(guī)則的短莖和兩對G-A 配。而且,p15.5KD 蛋白還是U4/U6/U5 snRNP三聯(lián)復(fù)合體的成分之一,它能結(jié)合U4 snRNA 中與box C/D 相似的結(jié)構(gòu)元件,說明snoRNA 的合成與pre-mRNA 的加工具有一定聯(lián)系。對于內(nèi)含子編碼的snoRNA 來說,事實確實如此。
研究人員發(fā)現(xiàn)大多數(shù)人類box C/D snoRNA 與其所在內(nèi)含子的3' 剪切位點的間距浮動于70 - 80nt,進一步的實驗確定對于snoRNA的加工來說,snoRNA 的編碼區(qū)與分枝點(branch point)之間的最適距離(約50 nt)是至關(guān)重要的。在mRNA 前體剪切的不同時期進行體外阻斷實驗顯示snoRNP蛋白(p15.5KD和纖維蛋白)在C1剪切復(fù)合體時期特異性地裝配到snoRNA 的編碼區(qū)。
1.2 box H/ACA snoRNA家族 box H/ACA snoRNA 具有保守的“發(fā)夾- 鉸鏈- 發(fā)夾- 尾(hairpin-hingehai r p in -t a i l ) ”的二級結(jié)構(gòu) 。box H (ANANNA,N 代表任一核苷酸)位于單鏈形式的鉸鏈區(qū),ACA 則一般位于3' 末端上游3 個核苷酸處。 box H/ACA snoRNA的指導(dǎo)序列位于單個或者兩個發(fā)夾內(nèi)部的“假尿嘧啶化泡”(pseudouridylation pocket) 內(nèi),它們可以與靶RNA上的被修飾位點兩翼序列各形成4 - 8nt 的互補配對。
與box C/D snoRNA 的 “box D/D'+5”原則相似,假尿嘧啶化位點與其下游H 或者是ACA box 的距離一般為14 - 16nt,這一距離對于選擇正確的修飾位點同樣至關(guān)重要。實驗證明,box H 和box ACA 不僅是snoRNA 正確行使功能必需的結(jié)構(gòu),而且與snoRNA 在細胞中具備完整的分子末端并穩(wěn)定存在密切相關(guān)。此外,假尿嘧啶化泡兩翼的短莖結(jié)構(gòu)也是snoRNA 正確行使功能所必需的。
box H/ACA snoRNP 的結(jié)合蛋白包括進化保守的Cbf5p(dyskerin)、Gar1p、Nhp2p 和Nop10p,它們對于假尿嘧啶化反應(yīng)都是必需的(圖2B)。由于具有已知假尿嘧啶化酶的信號元件,而且這些元件的突變或缺失可導(dǎo)致S. cerevisiae中box H/ACA snoRNA 指導(dǎo)的rRNA 假尿嘧啶化的顯著下降,Cbf5p 被推測為box H/ACA snoRNP 指導(dǎo)假尿嘧啶化過程中的催化物。
Nhp2p、Nop10p 和Cbf5p 組成box H/ACA snoRNP 的核心。與內(nèi)含子編碼的box C/D snoRNA 相似,內(nèi)含子編碼box H/ACA snoRNA 的加工也與 mRNA的生物合成相關(guān)。在酵母box H/ACA snoRNP 的生物合成需要一種名為核裝配因子1 的蛋白 (nuclear-assembly factor 1, Naf1), 這種蛋白與正在轉(zhuǎn)錄的box H/ACA 基因結(jié)合,且不存在于成熟的box H/ACA snoRNP 中,表明它僅作用于box H/ACA snoRNP 合成的早期。
最近的研究發(fā)現(xiàn),Naf1 同樣為人類box H/ACA snoRNA 所必需,在box H/ACA snoRNP 裝配早期,它和三個box H/ACA snoRNP 核心蛋白(Nhp2p、Nop10p 和dyskerin)能特異性地結(jié)合到轉(zhuǎn)錄中的box H/ACA snoRNA 基因上。
2 snoRNA的基因組織形式
根據(jù)編碼snoRNA 的序列是否從屬于其他基因,可將其分為獨立編碼的snoRNA 和內(nèi)含子編碼的snoRNA;根據(jù)某一snoRNA 編碼序列與其他snoRNA 編碼序列之間的鄰近程度,可將其分為單一的snoRNA 和snoRNA 基因簇。
獨立編碼的snoRNA 基因有獨立的啟動子和終止子及其他相關(guān)的順式調(diào)控元件。獨立編碼的 snoRNA 基因大都是由RNA 聚合酶II 轉(zhuǎn)錄的,其轉(zhuǎn)錄產(chǎn)物5' 末端都有1 個TMG(2',2',7'-trimerthylation cap)帽子。
在這類基因的轉(zhuǎn)錄起始位點上游80 - 120 nt 處通常有一個類似TATA box 的序列元件。內(nèi)含子編碼的snoRNA的發(fā)現(xiàn)是RNA分子生物學(xué)研究領(lǐng)域的一個重大進展。一部分內(nèi)含子編碼的 snoRNA 不依賴mRNA 前體的剪切加工過程,它們通過核酸內(nèi)切酶直接作用于mRNA前體釋放;而大多數(shù)內(nèi)含子編碼的snoRNA 的產(chǎn)生伴隨著宿主基因 pre-mRNA 的加工剪切,包括核酸內(nèi)切酶切去分枝套索結(jié)構(gòu)。
當(dāng)兩個或兩個以上相同或不同的snoRNA 序列緊密串聯(lián),彼此之間的間隔很短,就構(gòu)成snoRNA基因簇。不同生物偏好不同的snoRNA 表達策略。
2.1 單細胞生物中的snoRNA 在釀酒酵母中,除了7 個內(nèi)含子snoRNA基因外,絕大多數(shù)snoRNA是獨立基因編碼的,其中5 個是多順反子形式;而在粟酒裂殖酵母中,大部分box C/D snoRNA 是內(nèi)含子編碼的,而box H/ACA snoRNA 則主要是獨立轉(zhuǎn)錄的。在原生動物錐蟲中,大多數(shù)snoRNA 是以獨立編碼的多順反子形式存在,而賈第蟲的snoRNA 主要是以獨立編碼的單個基因形式存在。
2.2 植物中的snoRNA
snoRNA 基因簇是植物 snoRNA基因的主導(dǎo)形式。在植物中第一個被報道的 snoRNA 基因簇是在玉米中,由4 個U14 snoRNA基因組成。在擬南芥已知的snoRNA 基因中,大多數(shù)是以基因簇的形式存在,這些基因簇由2 - 5 個同類或者不同類的snoRNA 基因組成,其中包含少量的內(nèi)含子編碼的基因簇。在水稻中,雖然基因簇也是snoRNA 最主要的組織形式,但和擬南芥不同,半數(shù)以上的水稻的snoRNA 基因簇存在于內(nèi)含子當(dāng)中,其中大部分是純box C/D snoRNA 基因簇,而另一些則是box C/D-box H/ACA snoRNA雜合基因簇。
2.3 動物中的snoRNA
在脊椎動物中,幾乎所有指導(dǎo)核糖體2 ' - O - 甲基化和假尿嘧啶化修飾的 snoRNA 都是由內(nèi)含子編碼的,每個內(nèi)含子不超過一個snoRNA。snoRNA宿主基因大多編碼與核糖體生物合成及功能行使相關(guān)的蛋白,這種特殊的基因組織形式可能協(xié)調(diào)細胞中相關(guān)功能的基因表達。
此外,一些非蛋白編碼的基因,也可以成為snoRNA 的宿主基因,在這類基因中,內(nèi)含子取代外顯子發(fā)揮功能,產(chǎn)生穩(wěn)定的RNA 表達產(chǎn)物,被稱為UHG (U snoRNA host gene),如U22 的宿主基因編碼8 個 box C/D snoRNA,人類Gas5 基因編碼10 個box C/ D snoRNA,U17HG 和U19HG分別編碼U17 和U19 box H/ACA snoRNA。
與脊椎動物類似,果蠅中的大多數(shù)snoRNA 也是內(nèi)含子編碼的。其中指導(dǎo)甲基化的snoRNA 遵循著“一個內(nèi)含子只有一個snoRNA”的原則。在果蠅中也發(fā)現(xiàn)了類UHG基因的存在,主要編碼box C/D snoRNA。有趣的是,果蠅box H/ACA snoRNA 則主要由內(nèi)含子基因簇編碼的。
某些snoRNA 分子在已研究的所有生物中都是獨立編碼,如U3、U8、U13 和7-2/MRP RNA 等。其中,U3 是唯一已知在不同生物中由不同的RNA 聚合酶轉(zhuǎn)錄的snoRNA,它在酵母和動物中由RNA 聚合酶II 轉(zhuǎn)錄,而在植物中則是RNA 聚合酶III 轉(zhuǎn)錄的。
3 snoRNA的生物學(xué)功能和研究進展
3.1 snoRNA 與真核細胞核糖體的生物合成密切相關(guān)
rRNA的生物合成并組裝成核糖體是一個非常復(fù)雜的過程。這一過程起始于RNA 聚合酶I 在核仁轉(zhuǎn)錄rDNA產(chǎn)生rRNA前體;新生的rRNA前體被裝配成一個80 - 90S 的小顆粒;隨著核糖體蛋白的加入,rRNA 前體結(jié)構(gòu)發(fā)生重組,并進行特定位點的核苷酸修飾;最后經(jīng)過剪切產(chǎn)生成熟的核糖體亞基。snoRNA 與這一過程密切相關(guān),主要是指導(dǎo)特定位點的核苷酸修飾和參與rRNA前體的剪切加工過程[ 2, 6]。
rRNA上所有的核苷酸修飾位點都位于核心序列中,最基本的修飾在不同生物間是非常保守的。
酵母rRNA有大約55 個2'-O- 甲基化修飾位點和44 個假尿嘧啶化位點,人的rRNA中有大概105 - 107個 2'-O- 甲基化修飾位點和95 個假尿嘧啶化位點,而植物中兩種修飾位點則大概各有120 多個。 2'-O-甲基化可能能夠保護RNA避免被水解,提高疏水能力從而穩(wěn)定二級結(jié)構(gòu);而尿嘧啶轉(zhuǎn)化為假尿嘧啶后,原來的氫鍵轉(zhuǎn)化為羥基鍵,對于穩(wěn)定三級結(jié)構(gòu)有重要意義。 2'-O- 甲基化和假尿嘧啶化修飾分別由box C/D snoRNA 和box H/ACA snoRNA 指導(dǎo)完成。
此外,另一些snoRNA 則參與到rRNA 前體的剪切加工中,如box C/D snoRNA U3、U8、U14、 U22 和box H/ACA snoRNA snR10、snR30 和U17/ E1、E2、E3。其中,U3、U14、U22、snR10、 U17/E1(酵母snR30)對于18S 的生成是必需的,U8 則在5.8S、28S 的剪切中起重要作用。
3.2 scaRNA指導(dǎo)snRNA的核苷酸修飾[9]
Cajal bodies (CBs)是一種動態(tài)的核結(jié)構(gòu),由于包含U7 snRNA 和三種RNA 聚合酶轉(zhuǎn)錄復(fù)合體,Cajal bodies 被認為參與了轉(zhuǎn)錄機制的裝配和U7 依賴的組蛋白mRNA的 3' 末端的加工過程。
此外,Cajal bodies 高度富集剪切體snRNA(U1、 U2、 U4、 U5、 U6),這些snRNA 上也存在許多的2'-O-甲基化和假尿嘧啶化修飾位點。除pol III 合成的U6 snRNA能夠短暫性地轉(zhuǎn)移到核仁中,由snoRNA 指導(dǎo)完成修飾外,pol II 合成的U1、 U2、 U4 和U5 snRNA 都是在核質(zhì)的Cajal body 中由 scaRNA(Cajal body-specific small RNA, scaRNA)指導(dǎo)完成2'-O- 核糖甲基化和假尿嘧啶化的。
在結(jié)構(gòu)上,scaRNA 與snoRNA 相似,都具有box C/D 或者box H/ACA 的結(jié)構(gòu)元件,但在scaRNA 中,發(fā)現(xiàn)了一類非常特殊的同時具有box C/D 和box H/ACA 結(jié)構(gòu)域的分子,如U85、U87、U88、U89,它們可以同時指導(dǎo)U5和U4 snRNA的核糖甲基化和假尿嘧啶化。此外,每個box H/ACA scaRNA 有兩個特殊的CAB box(5'-ugAG-3'),這可能是它的Cajal body 定位信號。
3.3 脊椎動物的端粒酶是一個box H/ACA snoRNP 復(fù)合體[10]
端粒酶是一種RNP 逆轉(zhuǎn)錄酶(telomerase reverse transcriptase,TERT),它通過將端粒DNA 重復(fù)片斷加到真核生物染色體的末端,從而維持端粒的長度。端粒酶在腫瘤增殖及細胞老化過程中起到重要作用。人類的端粒酶RNA為染色體末端的復(fù)制提供了模板,它長451nt,5' 端包含逆轉(zhuǎn)錄酶的模板部分,3' 端的240nt 具有box H/ACA snoRNA 所特有的“發(fā)夾- 鉸鏈- 發(fā)夾- 尾”的二級結(jié)構(gòu),并結(jié)合了4個snoRNP 復(fù)合體核心蛋白。
端粒酶的 box H/ACA結(jié)構(gòu)域可能指導(dǎo)端粒酶RNA前體的3'端加工,保證成熟RNA 的穩(wěn)定性,而且能與端粒酶逆轉(zhuǎn)錄酶結(jié)合從而行使端粒酶的功能。當(dāng)人類的端粒酶box H/ACA 結(jié)構(gòu)域或者所結(jié)合的snoRNP 蛋白 dyskerin 發(fā)生突變時,會導(dǎo)致多系統(tǒng)的遺傳疾病, dyskeratosis congenital。
3.4 孤兒snoRNA(orphan snoRNA) 隨著snoRNA 的大量鑒定,人們發(fā)現(xiàn)一些小分子RNA 雖然具有 box C/D 或者box H/ACA 的典型結(jié)構(gòu),但卻找不到能與rRNA 或者snRNA 相匹配的互補序列。這類 RNA 分子被稱為孤兒snoRNA[11]。
目前,孤兒 snoRNA 的數(shù)量在不斷增加。據(jù)報道,許多不直接與核糖體生物合成相關(guān)的RNA,包括少數(shù)mRNA, 可以暫時停留在核仁中,此外在酵母中,某些 tRNA前體由RNase P催化的5'末端加工就發(fā)生在核仁,這為orphan snoRNA 作用于rRNA 和snRNA 以外的其他RNA提供了可能。特別是,在這些orphan snoRNA 中,有一群特殊的分子,它們具有明顯的組織表達特性,在下面將詳細描述。
4 基因組印跡和腦特異性表達的snoRNA
4.1 哺乳動物的基因組印跡
有性生殖使哺乳動物的每個基因擁有兩個拷貝,一個來自于父親,一個來自于母親。在大多數(shù)情況下,每對等位基因都具有轉(zhuǎn)錄活性和相同的功能。而印跡基因則不同,由于來自父系或者母系的配子在發(fā)育期間被烙上不同的外成信號,如DNA 甲基化等,而且這個烙印在后代的整個個體細胞發(fā)育過程中都維持不變,它的等位基因根據(jù)起源的性別只有一條能夠表達。
印跡基因最早發(fā)現(xiàn)于20 世紀(jì)80 年代。對于哺乳動物中印跡基因的數(shù)量,人們早期預(yù)測為100 - 200 個之間。最近的研究發(fā)現(xiàn),根據(jù)已知印跡基因的啟動子區(qū)域的序列特征進行推算,至少有600 個基因可能是印跡基因。印跡基因常常多個聚集在一起,表現(xiàn)為基因簇的組織形式,同一簇內(nèi)的印跡基因共享一套順式調(diào)控元件,有些基因簇甚至長達百萬個堿基。許多印跡區(qū)中都存在重復(fù)序列和非編碼 RNA 基因,其中包括大量的孤兒snoRNA 基因[11]。
4.2 腦特異性表達的snoRNA
指導(dǎo)rRNA和snRNA 核苷酸修飾的snoRNA 的宿主基因一般都是組成性表達的看家基因,因此這些snoRNA 也是廣泛存在于各種組織中。然而,近年來的研究發(fā)現(xiàn)了一批在腦中特異表達或者優(yōu)勢表達的特殊的snoRNA,它們中的絕大多數(shù)都是在遺傳印跡區(qū)表達,其中,只有HBI-36/MBI-36 屬于box H/ACA snoRNA,而且與印跡無關(guān)。HBI-36 位于血清受體5'-HT2cR 的第二個內(nèi)含子,5'-HT2cR 是位于X 染色體的7- 橫跨膜受體,主要在脈絡(luò)膜表達。有意思的是,雖然與印跡無關(guān),但由于宿主基因位于X 染色體,HBI- 36 仍然是單染色體表達的。
IC-SNURF-SNRPN是一段非常復(fù)雜的父系印跡表達轉(zhuǎn)錄單元,長度超過460kb,包含有至少150 個外顯子。在人的這段區(qū)域中,外顯子1 - 3 和4 - 10 分別編碼SNURF 蛋白和SmN剪切體蛋白,但下游外顯子則缺少明顯的開放讀碼框,取而代之的是下游的內(nèi)含子內(nèi)編碼了至少6 種b o x C /D snoRNA,其中,24 個HBII-85 和47 個HBII-52 分子,分別位于其中的兩段串聯(lián)重復(fù)序列。而這段印跡區(qū)可能與Prader-Willi(PWS)或Angelman綜合征有關(guān)[11-13]。
大鼠中的RBII-36 同樣具有串聯(lián)重復(fù)序列,它是由非蛋白質(zhì)編碼的基因Bsr 所編碼的。在人和小鼠相應(yīng)的同源區(qū)域,也包含有與印跡相關(guān)的組織特異性box C/D snoRNA。其中,在小鼠該區(qū)域的印跡snoRNA 下游,還存在一段印跡microRNA 基因簇,而且,這兩段小分子RNA 的基因簇在結(jié)構(gòu)上有相似之處。
有趣的是,實驗證明,當(dāng)小鼠接受恐懼條件作用后的一段時間后,MBII-48 在其腦海馬區(qū)內(nèi)的表達量顯著降低,而MBII-52 的表達量則顯著增加,反映了這些snoRNA 在腦的高級功能比如學(xué)習(xí)過程中可能起到重要作用。
迄今為止,唯一被證實功能的印跡snoRNA 是 HBII-52。HBII-52 具有一段18nt 序列可以與血清素受體5'-HT2cR 的可變剪接外顯子Vb 形成堿基互補配對。血清素受體5'-HT2cR 的外顯子V 有至少兩個5' 可變剪接位點,分別形成包含外顯子Va 和Vb 的異構(gòu)體。外顯子Vb 編碼受體的第二個胞內(nèi)環(huán),這對于G 蛋白結(jié)合是至關(guān)重要。跳過外顯子Vb 則會導(dǎo)致框架移動,形成一個在第三個橫跨膜結(jié)構(gòu)域后被截斷的不完整的受體。
在外顯子Vb 上至少有五個A 到I 的編輯位點。最近的研究表明,HBII- 52可以通過部分阻斷外顯子Vb上的一個沉默子而影響它的可變剪接,而且,這個沉默子也會由于外顯子Vb 上后三個編輯位點的編輯而作用減弱。與人們最初的猜測不同的是,HBII-52 對于5'-HT2cR 血清素受體的編輯并沒有直接作用。PWS患者體內(nèi)沒有HBII-52,因此他們的5'-HT2cR 血清素受體是不正常的[ 13]。
5 snoRNA的起源及進化
5.1 古細菌中snoRNA類似分子的鑒定 大腸桿菌的rRNA只有4個2'-O- 核糖甲基化和10個假尿嘧啶化修飾位點,它們分別由位點特異性的核糖甲基化酶和假尿嘧啶化酶催化完成,而不需要RNA 的參與。在原核生物中,古細菌在DNA 復(fù)制、轉(zhuǎn)錄和翻譯等多方面更接近真核生物。
在古細菌中發(fā)現(xiàn)了box C/D snoRNA類似的2'-O- 核糖甲基化的向?qū)RNA,以及纖維蛋白(fibrillarin)、 Nop56/58 和p15.5KD snoRNP 復(fù)合體相關(guān)蛋白,說明 snoRNA介導(dǎo)的修飾系統(tǒng)在20至30億年前就存在于古細菌與真核生物的共同祖先中。在Sulfolobus solfataricus的rRNA上有67個核糖甲基化修飾位點,在數(shù)量上與真核生物rRNA的甲基化修飾位點相近。
古細菌的box C/D sRNA 具有真核生物box C/D snoRNA 的全部結(jié)構(gòu)特征,如保守的box C、D、 C'、D' 和與靶RNA 堿基互補的反義序列,而且,它們絕大多數(shù)遵循著“box D/D'+ 5”的規(guī)則。但與真核生物的box C/D snoRNA 相比,古細菌中的 box C/D sRNA 分子較小,通常只有50 - 60nt;且?guī)缀跞慷际请p功能分子,它的兩條反義序列可能同時指導(dǎo)同一RNA 分子的不同核糖甲基化位點修飾。
此外,除了能指導(dǎo)rRNA 的修飾,一些古細菌的box C/D sRNA 還可以與tRNA 形成10 - 13nt 的嚴謹配對,可能指導(dǎo)tRNA 上特定位點的修飾。
與2'-O-核糖甲基化位點的數(shù)量接近真核生物形成鮮明對比的是,古細菌只含有9 個假尿嘧啶化修飾位點,與真細菌相似。但是在古細菌中發(fā)現(xiàn)了3 個box H/ACA snoRNP 復(fù)合體核心蛋白,Gar1p、 Nop10p和Cbf5p的同源分子,為box H/ACA snoRNA 類似物的存在并指導(dǎo)古細菌rRNA假尿嘧啶化修飾提供了可能性。
隨后,4個box H/ACA sRNA 分子被鑒定出來, 其中3個與錐蟲中box H/ACA snoRNA 缺少H box 的單環(huán)結(jié)構(gòu)相似,而另一個則具有3 個發(fā)夾環(huán)結(jié)構(gòu)。這4 個box H/ACA sRNA 通過與修飾位點兩翼的序列形成互補配對指導(dǎo)rRNA上6個假尿嘧啶化位點的修飾,并遵循真核生物box H/ACA snoRNA 中靶位點與下游H/ACA 元件的間隔規(guī)則。
部分古細菌生長在極端特殊的生態(tài)環(huán)境中,包括高鹽、高溫、高壓和極端pH 值等。研究發(fā)現(xiàn)在極端高溫下生長的古細菌,具有更多的甲基化修飾,表明極端高溫對于能夠在rRNA 上產(chǎn)生更多的甲基化位點的修飾系統(tǒng)具有強烈的選擇傾向。一種進化模型認為,真核生物起源于嗜熱性古細菌,而真核生物繼承了這種rRNA 修飾系統(tǒng)[15]。
5.2 反轉(zhuǎn)座(retrotransposition)與snoRNA基因的增殖 可移動元件(mobile or transposable element)存在于所有動植物的基因組中。snoRNA 反轉(zhuǎn)座子首先發(fā)現(xiàn)于2002年,但直到2006 年,才有大量的box H/ACA snoRNA 反轉(zhuǎn)座子在人及其他哺乳動物中被鑒定出來[16]。
大多數(shù)box H/ACA snoRNA 反轉(zhuǎn)座子具有反轉(zhuǎn)座子的典型結(jié)構(gòu),例如兩翼序列有一對7 - 19nt 長的TSD,在3' 末端有一條poly A 尾,而且在5' 末端還有L1反轉(zhuǎn)座體系的優(yōu)先識別序列5'-TTAAAA-3' 或者與其有1 - 2 個核苷酸差別的變體,說明L1 反轉(zhuǎn)座體系參與了snoRNA的反轉(zhuǎn)座過程。snoRNA通過反轉(zhuǎn)座進行基因數(shù)量的擴增,并通過位點突變產(chǎn)生新的功能,事實上,不少以前經(jīng)過實驗鑒定的 box H/ACA snoRNA 本身就是反轉(zhuǎn)座事件的產(chǎn)物。
snoRNA 是一種古老的小分子非編碼RNA,它廣泛存在于各種真核生物以及古細菌中。snoRNA 不僅在核糖體的生物合成中起重要作用,而且參與了其他RNA如snRNA、tRNA甚至mRNA的轉(zhuǎn)錄后修飾或加工[11,17,18]。在過去的10 年中,對多種模式生物的snoRNA 的大量鑒定和分析,極大地豐富了我們對snoRNA 結(jié)構(gòu)與功能及其基因組織和表達方式的知識,同時也提出了新的問題,例如許多特殊結(jié)構(gòu)和未知功能snoRNA 的發(fā)現(xiàn),特別是,在哺乳動物中發(fā)現(xiàn)了組織特異性的和印跡相關(guān)的孤兒 snoRNA,它們中的絕大多數(shù)都屬于box C/D 家族。
snoRNA 是細胞中一個龐大的非編碼RNA家族,在單細胞真核生物中都有幾十,甚至幾百個基因,如最近在萊茵衣藻中注釋了300多個snoRNA基因。同時,從單細胞賈第蟲到復(fù)雜的高等哺乳動物,可發(fā)現(xiàn)一些保守的指導(dǎo)r R N A 轉(zhuǎn)錄后修飾的向?qū)?snoRNA,提示它們可能具有重要的生物學(xué)功能。然而,占snoRNA 總數(shù)90%以上的向?qū)noRNA 對細胞的生存和生長都不是必需的。進一步發(fā)現(xiàn)和闡明向?qū)noRNA 的生物學(xué)意義是該領(lǐng)域中具有挑戰(zhàn)性的課題。
[參 考 文 獻]
[1] Maxwell ES, Fournier MJ. The small nucleolar RNAs. Annu Rev Biochem, 1995, 64:897-934
[2] Smith CM, Steitz JA. Sno storm in the nucleolus: new roles for myriad small RNPs. Cell, 1997, 89(5):669-72
[3] Lowe TM, Eddy SR. A computational screen for methylation guide snoRNAs in yeast. Science, 1999, 283(5405):1168-71
[4] Hütenhofer A, Kiefmann M, Meier-Ewert S, et al. RNomics: an experimental approach that identifies 201 candidates for novel, small, non-messenger RNAs in mouse. EMBO J, 2001, 20(11):2943-53
[5] Bachellerie JP, Cavaille J, Qu LH, Nucleotide modifications of eukaryotic rRNAs: the world of small nucleolar RNA guides revisited[M]// Garrett RA, Douthwaite S, Liljas A, et al, eds. The ribosome: structure, function, antibiotics and cellular Interactions . Washington: ASM Press, 2000: 191-203
[6] Kiss T. Small nucleolar RNAs: an abundant group of noncoding RNAs with diverse cellular functions. Cell, 2002, 109(2):145-8
[7] Tycowski KT, Shu MD, Steitz JA. A mammalian gene with introns instead of exons generating stable RNA products. Nature, 1996, 379(6564):464-6
[8] Brown JW, Echeverria M, Qu LH. Plant snoRNAs: functional evolution and new modes of gene expression. Trends Plant Sci, 2003, 8(1):42-9
[9] Tycowski KT, You ZH, Graham PJ, et al. Modification of U6 spliceosomal RNA is guided by other small RNAs. Mol Cell, 1998, 2(5):629-38
[10] J%26#303;dy BE, Bertrand E, Kiss T. Human telomerase RNA and box H/ACA scaRNAs share a common Cajal body-specific localization signal. J Cell Biol, 2004, 164(5):647-52
[11] Bachellerie JP, Cavaille J, Hütenhofer A. The expanding snoRNA world. Bicheimie, 2002, 84(8):775-90
[12] Cavaillé J, Buiting K, Kiefmann M, et al. Identification of brain-specific and imprinted small nucleolar RNA genes exhibiting an unusual genomic organization. Proc Natl Acad Sci USA, 2000, 97(26):14311-6
[13] Kishore S, Stamm S. The snoRNA HBII-52 regulates alternative splicing of the serotonin receptor 2C. Science, 2006, 311(5758):230-2
[14] Omer AD, Lowe TM, Russell AG, et al. Hmologs of small nucleolar RNAs in Archaea. Science, 2000, 288(5465):517-22
[15] Tran E, Brown J, Maxwell ES. Evolutionary origins of the RNA-guided nucleotide-modifation complexes: from the primitive translation apparatus? Trends Biochem Sci, 2004,29(7):343-50
[16] Weber MJ. Mammalian small nucleolar RNAs are mobile genetic elements. PLoS Genet, 2006, 2(12):e205
[17] Kiss T. SnoRNP biogenesis meets Pre-mRNA splicing. Mol Cell, 2006,23(6):775-6
[18] Boisvert FM, van Koningsbruggen S, Navascués J, et al. The multifunctional nucleolus. Nat Rev Mol Cell Biol, 2007, 8(7):574-85