生物信息學(xué)應(yīng)用：序列分析，電子克隆等初探

信息來源：小木蟲論壇　更新時(shí)間：2006-12-20 13:05:44

生物信息學(xué)應(yīng)用：序列分析，電子克隆等初探

生物信息學(xué)可指利用信息技術(shù)管理和分析生物學(xué)數(shù)據(jù)。這就意味著生物信息學(xué)所涉及的范圍相當(dāng)廣泛，從人工智能、機(jī)器人一直到基因組(genome)分析。就基因組分析這一角度來看，生物信息學(xué)主要是指核酸和蛋白質(zhì)序列數(shù)據(jù)的計(jì)算機(jī)處理和分析。近年來，蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)的快速增長，使蛋白質(zhì)三維結(jié)構(gòu)的處理分析也歸入到生物信息學(xué)的范疇。

近年來，三大國際一級(jí)生物信息數(shù)據(jù)庫，即美國國家信息中心 (National Center of Biotechnology Information, NCBI)的Gen Bank(http:/ / www. nchi. nlm. nih. gov/ web/Gen Bank/ imdex. html)、歐洲分子生物學(xué)室驗(yàn)室(European Molecular Biology L aboratory-Euro-pean Bioinformatics Institute, EMBL-EBI)的 EM-BL (http:// ebi. ac.uk/ databases/ index.html)和日本 DNA數(shù)據(jù)庫 (DNA Data Bank of Japan, DDBJ) (http:/ / ddbj.nig.ac.jp/ )新收錄的核酸序列數(shù)據(jù)中，EST占65%以上[18]。隨著生物信息學(xué) (Bioinformatics)的發(fā)展，通過檢索數(shù)據(jù)庫進(jìn)行核酸序列同源性檢索，電子基因定位、電子延伸、電子克隆和電子表達(dá)以及蛋白質(zhì)功能分析、基因鑒定等方面起到了重要作用，已成為人們認(rèn)識(shí)生物個(gè)體生長發(fā)育、繁殖分化、遺傳變異、疾病發(fā)生、衰老死亡等生命過程的有力工具。
1核酸序列的同源性檢索
目前，通過數(shù)據(jù)庫查詢、cDNA文庫直接測(cè)序、mRNA差別顯示 (DDRT-PCR)、代表性差示分析(RDA-PCR)和抑制差減雜交(SSH)等方法獲得的EST數(shù)據(jù)越來越龐大。GenBank數(shù)據(jù)庫中收錄的EST序列有數(shù)百萬個(gè)之多。由于 EST代表著一段表達(dá)基因序列，這樣就可用其與公共數(shù)據(jù)庫進(jìn)行同源性檢索，檢索與其同源的核酸序列。典型分析是采取NCBI的Blast軟件對(duì)GenBank 中的非冗余數(shù)據(jù)庫（non-redundant database,nr）進(jìn)行查詢。該數(shù)據(jù)庫是對(duì)GenBank EMBL 和DDBJ中去除所有相同核酸序列進(jìn)行整合后所得的最為全面的已知基因數(shù)據(jù)庫，其中包括部分基因組序列。聯(lián)網(wǎng)至“http://www.ncbi.nlm.nih.gov/blast/blast.cgi選擇數(shù)據(jù)庫“Nucleotide”，利用blastn程序進(jìn)行同源性檢索。”, 按照提示進(jìn)行查詢。
2 比較基因組分析
達(dá)爾文的進(jìn)化論給比較基因組學(xué)提供了理論依據(jù)。動(dòng)物進(jìn)化從低等到高等，動(dòng)物與動(dòng)物之間存在著親緣關(guān)系。這種關(guān)系可以從基因序列上反映出來。親緣關(guān)系越近，其基因序列的同源性就越高?？梢愿鶕?jù)已經(jīng)親緣關(guān)系較大的動(dòng)物的基因序列來擴(kuò)增目的基因的序列。
3 利用Unigene數(shù)據(jù)庫進(jìn)行電子克隆
此分析需要聯(lián)網(wǎng)至“http://www.ncbi.nlm.nih.gov/blast/blast.cgi選擇數(shù)據(jù)庫“dbEST”，利用blastn程序進(jìn)行同源性檢索。一般情況下可從EST數(shù)據(jù)庫中檢索到一批與代分析序列高度同源的EST序列。選擇同源性比分最高的一條EST序列。從NCBI的UniGene數(shù)據(jù)庫中進(jìn)行檢索，得到相應(yīng)的UniGene編號(hào)。獲得待分析序列的UniGene編號(hào)以后，就可以將與UniGene Cluster的所有核酸序列下載到本地，利用SequencherTM或其他的序列裝配軟件進(jìn)行組裝。形成較長的新生序列。
4 cDNA序列的開放閱讀框分析
大量的實(shí)驗(yàn)證明，在真核生物起始蛋白質(zhì)合成時(shí)，40S核糖體亞基及有關(guān)合成起始因子首先與mRNA模板靠近5`末端處結(jié)合，然后向3`末端滑行，發(fā)現(xiàn)AUG起始MM子時(shí)，與60S大亞基結(jié)合形成80S起始復(fù)合物。開始轉(zhuǎn)譯蛋白質(zhì)。這就是Kozak提出的真核生物蛋白質(zhì)合成起始的“掃描模式”。MRNA需要翻譯為蛋白質(zhì)方能發(fā)揮生物學(xué)作用，因此，核酸序列的開放閱讀框（open reading frame.ORF）的分析便成為核酸分析的一個(gè)重要部分?；谶z傳MM表，可通過計(jì)算機(jī)方便分析核酸序列的讀碼框。聯(lián)網(wǎng)至http://www.ncbi.nlm.nih.gov/orf finder,輸入cDNA序列，計(jì)算機(jī)將按照六種相位翻譯成蛋白質(zhì)。
5基于核酸序列的電子基因定位
對(duì)核酸序列進(jìn)行電子基因定位（即基因的染色體定位），通過所定位區(qū)帶的相鄰基因或者基因簇間接提示該基因的功能，是核酸分析的一個(gè)重要方面。進(jìn)行電子定位一般有兩種策略：（1）通過序列標(biāo)簽位點(diǎn)（Sequence Tagged Site,STS）進(jìn)行定位；（2）通過UniGene/RH技術(shù)進(jìn)行定位。
①利用STS數(shù)據(jù)庫進(jìn)行電子基因定位
利用此種方式進(jìn)行定位時(shí)主要是利用NCBI的電子PCR資源，即登錄http://www.ncbi.nlm.nih.gov/genome/sts/eper.cgi,輸入待分析的序列即可進(jìn)行查詢。
②利用UniGene數(shù)據(jù)庫進(jìn)行電子基因定位
參考前述，首現(xiàn)獲得待分析序列所對(duì)應(yīng)的UniGene編號(hào)。而大部分UniGene序列已經(jīng)具有較為明確的利用放射性雜交（radiation hybrid,RH）技術(shù)所給出的定位信息，所以，根據(jù)此結(jié)果就可以得到待分析序列的基因定位。
6 電子表達(dá)譜分析
在獲得待分析序列的UniGene編號(hào)以后，就可以通過參與形成UniGene Cluster 的序列的/細(xì)胞來間接地反映待分析序列在何種組織表達(dá)，體現(xiàn)在字段“cDNA sources”中。
7基于序列同源性分析的蛋白質(zhì)功能預(yù)測(cè)
相似的序列很可能具有相似的功能。因此，蛋白質(zhì)的功能預(yù)測(cè)最為可靠的方法是進(jìn)行數(shù)據(jù)庫相似性檢索。此方法應(yīng)至少80個(gè)氨基酸長度范圍內(nèi)具有25％以上的序列一致才提示可能的顯著意義。目前一般方法是基于NCBI/Blast軟件的蛋白質(zhì)同源性分析
類似于核酸序列的同源性分析，用戶直接將待分析的蛋白質(zhì)序列輸入NCBI/Blast軟件（http://www.ncbi.nlm.nih.gov/blast/）的序列輸入框內(nèi)，選擇程序：Blastp”就可聯(lián)網(wǎng)進(jìn)行相應(yīng)分析。
8 較長或全長的cDNA序列注冊(cè)
進(jìn)行較長或全長cDNA序列注冊(cè)時(shí)，可將其制成一個(gè)注冊(cè)文件，其中可包含有多條cDNA序列。用戶需要將可能多的信息在GenBank所規(guī)范的字段中填寫。序列注冊(cè)文件生成以后，可直接將其以附件方式向NCBI發(fā)送Email(gb-sub@ncbi.nlm.nih.gov)。一般在3－7個(gè)工作日之內(nèi)可得到回音，并獲得新的GenBank序列接收號(hào)。具體過程如下：下載Sequin軟件；安裝Sequin軟件；運(yùn)行Sequin.exe文件。按要求回答一系列問題，包括作者及單位、核酸序列信息、注解信息等。最后將生成一個(gè)序列注冊(cè)文件（擴(kuò)展名為sqn）?？蓪⒃撐募愿郊问较騈CBI發(fā)送（gb-sub@ncbi.nlm.nih.gov）。
一般地，核酸序列信息分析的基本思路:編碼區(qū)序列 (簡(jiǎn)稱CDS)與EST數(shù)據(jù)比較→尋找感興趣ESTS (標(biāo)準(zhǔn):長度≥100bp,同源性介于50%-85%之間 )→所選ESTs與GenEmble數(shù)據(jù)庫比較→找出未克隆ESTs→再與dbEST、dsSTS、dbHTGs、MGD及UniGene數(shù)據(jù)庫比較搜尋重疊群Contigs→設(shè)計(jì)引物進(jìn)行PCR擴(kuò)增或篩選cDNA文庫或索取cDNA克隆號(hào)進(jìn)行電子拼接獲取全長cDNA→基因定位、表達(dá)、結(jié)構(gòu)、功能檢測(cè)分析等。

實(shí)驗(yàn)頻道錄入：ztwpierre 責(zé)任編輯：ztwpierre

本站僅提供存儲(chǔ)服務(wù)，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請(qǐng)點(diǎn)擊舉報(bào)。

国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

生物信息學(xué)應(yīng)用：序列分析，電子克隆等初探

生物信息學(xué)應(yīng)用：序列分析，電子克隆等初探