在線(xiàn)工具 OrthoVenn2
全基因組直系同源基因簇(Orthologousclusters)的分析是比較基因組學(xué)研究的重要步驟,鑒定直系同源簇之間的聚類(lèi)及構(gòu)建網(wǎng)絡(luò)可以幫助我們解釋跨多個(gè)物種的蛋白質(zhì)的功能和進(jìn)化關(guān)系。某一類(lèi)物種全部基因「泛基因組」可分為三個(gè)部分包括核心基因組(core genome),附屬基因組(accessory genome)以及特有基因(specific genes)。核心基因組即所有個(gè)體共有的保守基因家族;附屬基因指存在于部分個(gè)體中的基因家族,與物種的分化有關(guān),賦予個(gè)體競(jìng)爭(zhēng)優(yōu)勢(shì);特有基因只存在于某一個(gè)體中,通常與該個(gè)體的獨(dú)特表型相關(guān),如對(duì)特定環(huán)境的適應(yīng)性或獨(dú)特的致病性等。比較分析某一類(lèi)物種的直系同源簇為了解基因組的動(dòng)態(tài)、物種進(jìn)化、環(huán)境適應(yīng)性機(jī)制等提出了有用信息。今天要介紹的這款OrthoVenn2工具,可用于多物種全基因組直系同源基因簇比較和注釋?zhuān)?/strong>界面友好,結(jié)果豐富。OrthoVenn2 是之前版本OrthoVenn v 1.0的全新升級(jí),性能、數(shù)據(jù)庫(kù)、分析及結(jié)果展示方面都有很大的提升。OrthoVenn2基于OrthoMCL啟發(fā)式匹配算法,用DIAMOND進(jìn)行比對(duì),比傳統(tǒng)的BLAST算法速度提高了1萬(wàn)倍,而且相比之前的版本數(shù)據(jù)庫(kù)資源更加豐富,單次在線(xiàn)分析的上限物種數(shù)量提高了一倍(12個(gè))。OrthoVenn2還開(kāi)發(fā)了本地版本,方便用戶(hù)下載使用,且沒(méi)有物種數(shù)量限制。訪(fǎng)問(wèn)網(wǎng)址:https://orthovenn2.bioinfotoolkits.net/home。打開(kāi)主頁(yè)后,點(diǎn)擊Start開(kāi)始分析。進(jìn)入開(kāi)始頁(yè)面后,就可以選擇或者上傳需要分析的基因組數(shù)據(jù)了。OrthoVenn2數(shù)據(jù)庫(kù)中覆蓋了植物、脊椎動(dòng)物、細(xì)菌、真菌、原生生物和后生動(dòng)物代表物種的基因組,選定相應(yīng)數(shù)據(jù)庫(kù)后,可以選擇數(shù)據(jù)庫(kù)中的物種。還可以自己上傳本地的基因組蛋白質(zhì)序列(FASTA格式)。提交后,會(huì)自動(dòng)生成一個(gè)任務(wù)號(hào)。OrthoVenn2相比其他同類(lèi)軟件及其之前的版本的亮點(diǎn)之一就是分析速度非??烨医Y(jié)果準(zhǔn)確可靠,比對(duì)分析5個(gè)普通真菌的基因組只需5分鐘;比對(duì)12個(gè)大型靈長(zhǎng)類(lèi)動(dòng)物的基因組,30分鐘左右就可完成任務(wù)。OrthoVenn2的結(jié)果頁(yè)面非常豐富,相比之前的版本增加了不同物種同源基因簇的存在或者缺失情況的直觀顯示及統(tǒng)計(jì)信息(綠色表示存在,灰色表示缺失),還可進(jìn)行個(gè)性化的結(jié)果展示。頁(yè)面右側(cè)匯總了各個(gè)參比基因組序列數(shù)、基因家族數(shù)目、單拷貝基因序列數(shù)目??梢韵螺d序列聚類(lèi)信息表以及同源基因簇的相應(yīng)序列。韋恩圖展示了不同物種基因家族的交集,其中處于中心的就是所分析物種的核心基因組了,其他為不那么保守的可變基因組。韋恩圖的風(fēng)格可以修改,并且可以下載編輯,插入文章中(提供的圖片格式包括PNG、PDF、SVG)。下面的條形圖展示不同物種所含基因家族數(shù)目的比較,頁(yè)面右側(cè)還增加了基于兩兩比對(duì)的物種相似性矩陣(以重疊的同源基因數(shù)量作物種聚類(lèi))。結(jié)果頁(yè)面上統(tǒng)計(jì)表以及韋恩圖中的數(shù)字都可以點(diǎn)開(kāi),進(jìn)入相應(yīng)部分功能分析的頁(yè)面。點(diǎn)開(kāi)韋恩圖中的數(shù)字,會(huì)跳出詳細(xì)的注釋分析結(jié)果??梢圆榭垂灿性摶蚣易宓奈锓N,下載基因家族聚類(lèi)信息表以及該共有區(qū)域的相應(yīng)序列,還可以查看下載共有區(qū)域的基因家族功能分析結(jié)果。在下面的列表中有基因家族Swiss-Prot及GO(Gene Ontology)功能注釋及富集分析的結(jié)果。三個(gè)餅狀圖展示了所選擇的同源基因簇的三個(gè)主要GO功能類(lèi)別的比例包括生物過(guò)程(biological processes)、分子功能(molecular functions)和細(xì)胞成分(cellular components)。點(diǎn)開(kāi)基因家族編號(hào) Cluster--,可以看到詳細(xì)的關(guān)于這個(gè)基因家族的聚類(lèi)分析。可以查看序列信息,以及這個(gè)基因家族的相似性網(wǎng)絡(luò)圖,兩條序列(節(jié)點(diǎn))相似度越高,連線(xiàn)越粗,并且網(wǎng)絡(luò)圖中每條連線(xiàn)和節(jié)點(diǎn)都可以手動(dòng)進(jìn)行伸展移動(dòng)。點(diǎn)開(kāi)Multiple Sequence Alignment(多序列比對(duì)),可以看到序列保守及多樣性情況(可以個(gè)性化選擇著色模式和閾值)。MEME程序?qū)υ摶蚣易褰Y(jié)構(gòu)域(motif)進(jìn)行分析,MEME 圖中字母的高度表示在每個(gè)位置上每個(gè)氨基酸出現(xiàn)的概率。結(jié)構(gòu)域位置圖中“塊”的高度與 p 值成比例。返回注釋分析頁(yè)面,繼續(xù)查看其他相關(guān)信息,包括的生物過(guò)程(Biologicalprocess)分類(lèi)匯總、分子功能(Molecular function)匯總以及功能蛋白的細(xì)胞定位(Cellular component)分類(lèi)匯總。OrthoVenn2還直接提供便利的GO富集分析。GO富集分析會(huì)計(jì)算選定區(qū)域的基因與 GO分類(lèi)中某個(gè)特定的分支的分布關(guān)系,并返回一個(gè)p-value,p-value越小,與基因組相關(guān)聯(lián)的特定GO分類(lèi)條目就越顯著。通過(guò)對(duì)特定范圍內(nèi)基因進(jìn)行GO富集分析,可以揭示物種特異性可能與哪些基因功能直接相關(guān)。此外,OrthoVenn2還有一個(gè)可視化工具ClusterVenn,可以上傳本地的聚類(lèi)數(shù)據(jù)文件來(lái)生成韋恩圖。展覽館Gallery中展示了OrthoVenn2預(yù)先運(yùn)行的一些經(jīng)典示例,可以直接點(diǎn)開(kāi)查看。總的來(lái)說(shuō)OrthoVenn2 的使用非常方便,不需要下載軟件,網(wǎng)頁(yè)頁(yè)面十分友好,分析得出的圖片也十分美觀,分析功能相比之前的版本更加強(qiáng)大和豐富,可以讓大家在比較基因組學(xué)分析過(guò)程中快速獲取到自己需要的信息。OrthoVenn2的功能如此強(qiáng)大,趕快試試吧!參考文獻(xiàn):
Ling Xu, Zhaobin Dong, Lu Fang, Yongjiang Luo, Zhaoyuan Wei, HailongGuo, Guoqing Zhang, Yong Q Gu, Devin Coleman-Derr, Qingyou Xia, Yi Wang,OrthoVenn2: a web server for whole-genome comparison and annotation oforthologous clusters across multiple species, Nucleic Acids Research, Volume 47, Issue W1, 02 July 2019, Pages W52–W58, https://doi.org/10.1093/nar/gkz333
關(guān)注后獲取《科研修煉手冊(cè)》1、2、3、4、5、6、7、8、9
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶(hù)發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)
點(diǎn)擊舉報(bào)。