編譯:Yong-qin,編輯:十九、江舜堯。
原創(chuàng)微文,歡迎轉(zhuǎn)發(fā)轉(zhuǎn)載。
二代測序(SGS)廣泛用于發(fā)現(xiàn)藏紅花的新功能基因,如不同發(fā)育階段的轉(zhuǎn)錄本發(fā)現(xiàn)了新的CCD類型基因,不同組織部位的轉(zhuǎn)錄本揭示了調(diào)控脫輔基類胡蘿卜素的結(jié)構(gòu)基因和轉(zhuǎn)錄因子。但是二代測序?qū)ψx長的限制影響了轉(zhuǎn)錄本的完整性,而三代測序(TGS)/單分子測序(SMRT)可讀取全長mRNA序列,其中著名的PacBio測序平臺可一次讀取10Kb堿基。目前PacBio測序廣泛用于功能基因挖掘和可變剪接鑒定。
本研究采用PacBio測序?qū)Ρ?/span>藏紅花5個組織(球莖、葉片、花被片、雄蕊、柱頭)的全長轉(zhuǎn)錄組。由于目前缺少藏紅花的完整基因組,本研究將對藏紅花的進化地位,尤其是脫輔基類胡蘿卜素生物合成的進化,提供新穎的見解。
論文ID
原名:Full-length transcriptome sequencing provides insights into the evolution of apocarotenoid biosynthesis in Crocus sativus
譯名:全長轉(zhuǎn)錄組揭示藏紅花在脫輔基類胡蘿卜素合成途徑的進化
期刊:Computational and Structural Biotechnology Journal
IF:4.720
發(fā)表時間:2020.03
通訊作者:劉永勝
通訊作者單位:四川大學生命科學學院
DOI號:10.1016/j.csbj.2020.03.022
實驗設計
結(jié)果
1、全長轉(zhuǎn)錄組測序獲得高質(zhì)量數(shù)據(jù)
從開花期的藏紅花植物組織提取總RNA進行PacBio測序,共產(chǎn)生1133474條reads,其中596356(52.61%)為完整的轉(zhuǎn)錄本,質(zhì)控后剩余138773條高質(zhì)量reads(準確率>99%)。片段總長介于800 – 4000 bp,相比先前研究使用的二代測序(610-1047 bp),全長轉(zhuǎn)錄組分析更有優(yōu)勢。將所有轉(zhuǎn)錄本在GenBank數(shù)據(jù)庫進行比對,比對率為93.9%。BUSCO質(zhì)量評價結(jié)果表明完整的轉(zhuǎn)錄本占核心的保守真核基因的73.06%(圖1A),覆蓋率較高。由于全基因組序列尚未破譯,高質(zhì)量的全長轉(zhuǎn)錄組有助于識別編碼區(qū)域并描述藏紅花的進化歷史。
結(jié)合同源預測及從頭預測,本研究發(fā)現(xiàn)31755個蛋白編碼基因(GC含量約48.66%),編碼序列平均長度918bp。其中30197個基因在二代測序中同樣獲得,而29422個基因獲得數(shù)據(jù)庫注釋(圖1B)。獲得注釋的基因中,1130個鑒定為轉(zhuǎn)錄因子,涵蓋64個基因家族,其中C3H家族基因最多,其次為bHLH、bZIP、MYB家族基因。先前研究表明含有鋅指基序的轉(zhuǎn)錄因子與脫輔基類胡蘿卜素的調(diào)控有關,本研究共鑒定了88個C3H和56個C2H2家族基因,占所有轉(zhuǎn)錄因子的13%。
此外本研究預測了非編碼RNA,包括821個rRNA、393個tRNA、38個snoRNA、15個snRNA和10個miRNA。將miRNA與編碼基因進行比對,共確定645個候選靶標,其中鋅指轉(zhuǎn)錄因子的靶標較多,說明這些miRNA可能與脫輔基類胡蘿卜素有潛在關系,而并不直接靶向生物合成基因。此外,本研究鑒定226616個SSR,主要為A/T重復,編碼基因中有3714個SSR,說明非編碼區(qū)的SSR更豐富(圖1C)。
2、全長轉(zhuǎn)錄組比較分析揭示全基因組復制事件
為了揭示物種進化過程中的全基因組復制事件,本研究將藏紅花的序列與11個代表性物種比較,包括獼猴桃(Actinidia chinensis)、鳳梨(Ananas comosus)、蘆筍(Asparagus officinalis)、擬南芥(Arabidopsis thaliana)、無油樟(Amborella trichopoda)、茶樹(Camellia sinensis)、胡蘿卜(Daucus carota)、野芭蕉(Musa acuminata)、水稻(Oryza sativa)、番茄(Solanum lycopersicum)、玉米(Zea mays),共獲得19131個同源基因家族,包括311825個基因,其中177574個基因(6486個家族)在所有物種共有,代表其核心性(圖2A)。此外,有9841個基因(48個家族)是藏紅花里特有的,表明其物種物種的獨特性(圖2A)。GO富集分析表明這些特有基因與'代謝途徑’和'催化活性’相關(圖2B),其中有些代謝途徑與藏紅花的主要次級代謝物有關(藏紅花素、藏紅花苦甙、藏花醛),而催化活性主要為氧化還原酶、水解酶、類胡蘿卜素加雙氧酶。
在開花植物中,基因家族的增加/縮減是物種分化和多樣性的驅(qū)動力。本研究表明基因家族在物種適應性進化的過程中發(fā)生明顯地變化,一些特有的基因促成了藏紅花特有的性狀和品質(zhì)。系統(tǒng)發(fā)育分析表明了藏紅花的進化地位,在同源基因家族中保留了8357個家族,其中2843個家族獲得新基因拷貝(圖2C)。這些基因富集于'電子傳遞鏈’,包括磷酸烯醇丙酮酸激酶活性、電子傳遞、呼吸電子傳遞鏈。電子傳遞鏈的功能與天冬氨酸、抗壞血酸、茄紅素、類胡蘿卜素的代謝密切相關。因此,'電子傳遞鏈’基因的新拷貝可能有助于藏紅花的代謝能量供應,促進脫輔基類胡蘿卜素的合成。此外,富集域還有'含雄性不育蛋白功能域’的基因,這表明藏紅花不育三倍體的形成與自然選擇有關。從全長轉(zhuǎn)錄組中確定了15900個基因的復制事件,并通過同義替代率(Ks)預測事件發(fā)生時間(圖2D)。
3、藏紅花在脫輔基類胡蘿卜素合成途徑的進化
藏紅花的柱頭有較高的商業(yè)價值,包括三種主要次級代謝物:藏紅花素、藏紅花苦甙、藏花醛。為了深入了解其分子機制,本研究用比較轉(zhuǎn)錄組進行分析。根據(jù)轉(zhuǎn)錄組數(shù)據(jù)的酶編碼基因的注釋,發(fā)現(xiàn)了參與脫輔基類胡蘿卜素生物合成的功能基因,包括9個類胡蘿卜素生物合成基因(GPPS, GGPPS, PS, PDS, Z-ISO, ZDS, CrtISO, β-LYC, BCH),和4個類胡蘿卜素裂解的基因(CCD, UGT, ALDH, β-GS),這些基因在許多物種中保守存在,證明了脫輔基類胡蘿卜素的合成途徑的保守性。
然而,脫輔基類胡蘿卜素的含量在物種間相差巨大,藏紅花中大量存在。生化分析表明,藏紅花中通過7,8/7’,8’位裂解玉米黃素產(chǎn)生藏花醛和藏紅花苦甙(由CCD基因家族產(chǎn)物催化),多數(shù)物種在9,10/9’,10’位裂解(圖3A),證明了CCD基因家族的獨立演化性。在轉(zhuǎn)錄組中共預測了13個CCD家族基因,數(shù)量明顯比其他物種的基因組注釋多(圖3A)。選擇5個物種的38個CCD基因進行系統(tǒng)發(fā)育分析(圖3B),可分為4個聚類,其中有3個類在單子葉植物和雙子葉植物中共有,表明CCD基因的存在非常古老,但同時同一物種的基因趨于同一分支,這表明基因復制事件發(fā)生于物種分化之后,這些復制事件使它們在進化過程中表現(xiàn)特定的功能。在藏紅花中,裂解玉米黃素7,8/7’,8’位鍵的關鍵酶基因鑒定為CsCCD2,聚類于CCD1分支(圖3B),說明是由物種分化后復制形成的。
對藏紅花5個組織(球莖、葉片、花被片、雄蕊、柱頭)的基因表達譜分析表明,CsCCD2在所有組織內(nèi)表達,而在柱頭中水平顯著較高(圖3C)。這證明CCD基因在柱頭中的特異表達性。通過對柱頭組織和其他4個組織的基因表達進行兩兩比較,鑒定差異表達基因,基因數(shù)量從87至1366,可見不同組織的轉(zhuǎn)錄具有動態(tài)性。但藏紅花的脫輔基類胡蘿卜素的合成的時空轉(zhuǎn)錄調(diào)控有待進一步研究。
結(jié)論
在藏紅花的全基因組測序未完成的情況下,本研究提出高質(zhì)量的全長轉(zhuǎn)錄組測序,且顯著提高了編碼基因的序列完整和功能注釋。同時,轉(zhuǎn)錄組數(shù)據(jù)解釋了藏紅花的進化歷史,尤其是主要次級代謝產(chǎn)物(脫輔基類胡蘿卜素)基因的進化,結(jié)果表明關鍵酶CCD2由藏紅花進化產(chǎn)生。研究結(jié)果有助于進一步研究藏紅花基因和作物改良。
藏紅花中含有大量藏紅花素、藏紅花苦甙、藏花醛,是重要的經(jīng)濟作物。本研究用PacBio全長測序技術(shù)獲得三倍體藏紅花全長轉(zhuǎn)錄組。結(jié)果表明全基因組復制事件使得藏紅花中脫輔基類胡蘿卜素的積累,且藏紅花獲得了由CCD家族進化而來的基因CCD2,且表達水平極高,這揭示了藏紅花在脫輔基類胡蘿卜素合成途徑的進化。
更多推薦
1 科研 | PNAS:轉(zhuǎn)錄組學揭示急性和慢性飲酒對肝臟晝夜新陳代謝有不同的影響