国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
生物信息學的主要研究開發(fā)內容

生物信息學的主要研究開發(fā)內容
2004-10-13 00:00:00   來源:基因潮 點擊數(shù):   評論:0   我要評論

基因組包含了構成和維持一個生活有機體所必備的基本信息,由細胞內進行的多種分子生物學反應將這些信息轉化為真正的生命現(xiàn)象?;蚪M的一部分編碼蛋白質和RNA,其它部分調控這些大分子的表達。表達的蛋白質及RNA折疊成高度專一的三維結構,在體內的特定位置上實現(xiàn)其功能。這些…

基因組包含了構成和維持一個生活有機體所必備的基本信息,由細胞內進行的多種分子生物學反應將這些信息轉化為真正的生命現(xiàn)象。基因組的一部分編碼蛋白質和RNA,其它部分調控這些大分子的表達。表達的蛋白質及RNA折疊成高度專一的三維結構,在體內的特定位置上實現(xiàn)其功能。這些過程的大量細節(jié)都是在分子生物學研究的實驗室里揭示出來的,所形成的大量數(shù)據(jù),存儲于數(shù)據(jù)庫中。生物信息學試圖從這些數(shù)據(jù)中提取新的生物學信息和知識,是一門深深植根于全面深入的實驗事實和數(shù)據(jù)的理論生物學。從目前生物信息學的研究情況來看,國際上公認的生物信息學的研究內容,大致包括以下幾個方面:

生物信息的收集、存儲、管理與提供。包括建立國際基本生物信息庫和生物信息傳輸?shù)膰H聯(lián)網(wǎng)系統(tǒng);建立生物信息數(shù)據(jù)質量的評估與檢測系統(tǒng);生物信息的在線服務;生物信息可視化和專家系統(tǒng)。

基因組序列信息的提取和分析。包括基因的發(fā)現(xiàn)與鑒定,如利用國際EST 數(shù)據(jù)庫 (dbEST) 和各自實驗室測定的相應數(shù)據(jù),經(jīng)過大規(guī)模 并行計算發(fā)現(xiàn)新基因和新SNPs以及各種功能位點;基因組中非編碼區(qū)的信息結構分析,提出理論模型,闡明該區(qū)域的重要生物學功能;進行模式生物完整基因組的信息結構分析和比較研究;利用生物信息研究遺傳密碼起源、基因組結構的演化、基因組空間結構與DNA折疊的關系以及基因組信息與生物進化關系等生物學的重大問題。

功能基因組相關信息分析。包括與大規(guī)?;虮磉_譜分析相關的算法、軟件研究,基因表達調控網(wǎng)絡的研究;與基因組信息相關的核酸、蛋白質空間結構的預測和模擬,以及蛋白質功能預測的研究。

生物大分子結構模擬和藥物設計。包括RNA(核糖核酸)的結構模擬和反義RNA的分子設計;蛋白質空間結構模擬和分子設計;具有不同功能域的復合蛋白質以及連接肽的設計;生物活性分子的電子結構計算和設計;納米生物材料的模擬與設計;基于酶和功能蛋白質結構、細胞表面受體結構的藥物設計;基于DNA結構的藥物設計等。

生物信息分析的技術與方法研究。包括發(fā)展有效的能支持大尺度作圖與測序需要的軟件、數(shù)據(jù)庫以及若干數(shù)據(jù)庫工具,諸如電子網(wǎng)絡等遠程通訊工具;改進現(xiàn)有的理論分析方法,如統(tǒng)計方法、模式識別方法、隱馬爾科夫過程方法、分維方法、神經(jīng)網(wǎng)絡方法、復雜性分析方法、密碼學方法、多序列比較方法等;創(chuàng)建一切適用于基因組信息分析的新方法、新技術。包括引入復雜系統(tǒng)分析技術、信息系統(tǒng)分析技術等;建立嚴格的多序列比較方法;發(fā)展與應用密碼學方法以及其他算法和分析技術,用于解釋基因組的信息,探索DNA序列及其空間結構信息的新表征;發(fā)展研究基因組完整信息結構和信息網(wǎng)絡的研究方法等;發(fā)展生物大分子空間結構模擬、電子結構模擬和藥物設計的新方法與新技術。

應用與發(fā)展研究。匯集與疾病相關的人類基因信息,發(fā)展患者樣品序列信息檢測技術和基于序列信息選擇表達載體、引物的技術,建立與動植物良種繁育相關的數(shù)據(jù)庫以及與大分子設計和藥物設計相關的數(shù)據(jù)庫。

總的來說近期生物信息學將在以下幾方面迅速發(fā)展:大規(guī)?;蚪M測序中的信息分析;新基因和新SNPs(單核苷酸多態(tài)性)的發(fā)現(xiàn)與鑒定;完整的比較基因組研究;大規(guī)?;蚬δ鼙磉_譜的分析;生物大分子的結構模擬與藥物設計。而其長遠任務是非編碼區(qū)信息結構分析和遺傳密碼起源與生物進化的研究。讀懂人類基因組,發(fā)現(xiàn)人類遺傳語言的根本規(guī)律,從而闡明若干生物學中的重大自然哲學問題,像生命的起源與進化等。

以下就若干方面再做一定的介紹

1. 數(shù)據(jù)庫

據(jù)保守估計,目前世界上平均每一分鐘就有一個序列增加到核酸序列數(shù)據(jù)庫中,能夠從飛速增長的序列數(shù)據(jù)更高效的提取信息,建立生物信息中心,通過互聯(lián)網(wǎng)實現(xiàn)全球范圍內的信息共享成為必然。歐美各國及日本等西方國家相繼成立了生物信息資源和研究中心,如美國國家生物技術信息中心(National Center for Biotechnology Information,NCBI)、位于英國的歐洲生物信息研究所(European Bioinformatics Institute,EBI)、位于瑞士日內瓦的蛋白質專家分析系統(tǒng)(The Expert Protein Analysis System,ExPaSy)、日本國立遺傳學研究院(National Institute Genetics,簡稱NIG)等。以西歐各國為主的歐洲分子生物學網(wǎng)絡組織European Molecular Biology network (EMBnet),成立于1988年,是目前國際上最大的分子生物信息研究、開發(fā)和服務機構。它把歐洲乃至世界各國的生物信息中心聯(lián)系在一起,實現(xiàn)信息共享,并合作進行開發(fā)、研究、培訓。

2. 基因組

在后基因組時代,生物信息學家不僅有大量的序列和基因而且有越來越多的完整基因組。有了這些資料人們就能對若干重大生物學問題進行分析。生物信息學為分子生物學家提供了一條尋找和研究新基因的新思路,即從高度自動化的實驗出發(fā),經(jīng)過數(shù)據(jù)的獲取與處理、序列片段的拼接、可能基因的尋找、基因功能的預測一直到基因的分子進化研究。這個過程的每一個環(huán)節(jié),都是生物信息學研究的重要內容。

高度自動化的實驗數(shù)據(jù)的獲得、加工和整理。如何將實驗室中得到的生物學信息轉化為計算機能夠處理的數(shù)字信息,是生物信息學的一個重要課題。這種轉化大量地體現(xiàn)在各種自動化分子生物學儀器應用上,如DNA測序儀,PCR儀等。這類儀器將實驗所得的物理化學信號轉化為數(shù)字信息,并對其作簡單分析,再將分析結果用于實驗條件的控制,完成高度自動化的實驗過程。從事大規(guī)模EST測序和DNA物理圖譜構建的實驗室都已建立起高度自動化的機器人系統(tǒng)來完成大部分的實驗工作。伴隨著實驗過程的高度自動化甚至工廠化,從事大規(guī)模分子生物學項目的實驗室,每天需要存儲的數(shù)據(jù)可以輕易地超過幾千兆字節(jié)。這樣大的數(shù)據(jù)量必須用專門的實驗室數(shù)據(jù)管理系統(tǒng)進行處理,以自動完成包括實驗進程和數(shù)據(jù)的記錄,常規(guī)數(shù)據(jù)分析,數(shù)據(jù)質量檢測和問題的自動查找,常規(guī)的數(shù)據(jù)說明和數(shù)據(jù)輸人數(shù)據(jù)庫在內的各項工作。由于不同實驗室需處理的數(shù)據(jù)類型各不相同,目前各個實驗室都是各自開發(fā)自己的系統(tǒng),還沒有成熟的可用于不同實驗室的分子生物學數(shù)據(jù)管理系統(tǒng)。但隨著測序逐漸成為實驗室的常規(guī)工作,對這種系統(tǒng)的需求會越來越大,此類系統(tǒng)的發(fā)展將成為大勢所趨。

序列片段的拼接。目前DNA自動測序儀每個反應只能測序500bP左右。如何將這些序列片段拼接成完整的DNA順序就成為接下來的一個重要工作。傳統(tǒng)的測序技術通常將克隆進行亞克隆并對亞克隆進行排序。這些工作需要大量的人力物力?,F(xiàn)在生物信息學提供了自動而高速地拼接序列的算法,即根據(jù) Lander- Waterman模型利用鳥槍法進行測序,再將大量隨機測序的片段用計算機進行自動拼接。這種技術不僅避免了亞克隆排序所需的大量繁瑣的工作,還使序列具有一定的冗余性(redundancy,即一定數(shù)量的重復)以保證序列中每個堿基的準確性。

3.基因組序列分析

在基因組測序的原始數(shù)據(jù)發(fā)表后,仍有許多信息研究需要開展,比如 注釋、同源性分析、基因分類、基因結構分析等,這方面的研究需要建立較優(yōu)化的數(shù)理統(tǒng)計模型,大規(guī)模的數(shù)據(jù)庫檢索,模式識別和可視化等。在確認了基因的基礎上,通過與已知的基因產(chǎn)物的結構和功能、代謝途徑和其它生物功能對照,可以實現(xiàn)新基因產(chǎn)物功能的預報,結合定向的生物實驗,可以證實預報的功能。

基因區(qū)域的預測 。在完成序列的拼接后,我們得到的是很長的DNA序列,甚至可能是整個基因組的序列。這些序列中包含著許多未知的基因,下一步就是將基因區(qū)域從這些長序列中找出來。所謂基因區(qū)域的預測,一般是指預測DNA順序中編碼蛋白質的部分,即外顯子部分。不過目前基因區(qū)域的預測已從單純外顯子預測發(fā)展到整個基因結構的預測。這些預測綜合各種外顯子預測的算法和人們對基因結構信號(如 TATA box和加尾信號)的認識,預測出可能的完整基因。

基因功能預測。實驗手段證實一個預測的新基因后,下一步要做的就是尋找這個基因的功能。生物信息學為此提供了一系列方法,使我們的研究能夠有的放矢。序列同源比較往往是得到新基后預測其功能的第一步。通過同源比較來預測基因功能是基于這樣一個假設:如果基因A與基因B有相當?shù)耐葱?,那么基因A可能具有類似基因B的功能。利用同源比較算法,將待檢測的新基因序列到DNA和蛋白質序列數(shù)據(jù)庫中進行同源檢索后,我們可以得到一系列與新基因同源性較高的基因或片段。這些基因和片段的以知的功能信息就為進一步研究新基因功能提供了具有相當參考價值的導向。

通過同源檢索,我們可能推測待檢的新基因是某個蛋白質家族的新成員,下一步就是尋找新基因中包含的該蛋白質家族的保守序列,這樣也就為進一步深入研究其功能作好了準備。多序列同源比較,或稱為多序列對齊(multiple-sequence alignment),是將多個序列進行同源比較以發(fā)現(xiàn)其共同的結構特征的方法,被廣泛用來尋找基因家族或蛋白質家族中的保守部分。由于保守部分往往與家族成員的功能密切相關,所以通過這些方法建立蛋白質家族數(shù)據(jù)庫,能夠幫助科學家更好地認識基因的功能。這些數(shù)據(jù)庫可以幫助我們把新基因所屬的蛋白質家族及其保守部分找出來,并提供這個家族其他成員的結構和功能信息。

4. 蛋白質結構與功能預測

核酸和蛋白質序列以及蛋白質結構數(shù)據(jù)是生物信息學的主要研究對象。由于測序技術的快速發(fā)展及蛋白質結構測定技術的相對滯后,使得現(xiàn)在分子數(shù)據(jù)庫中的序列數(shù)據(jù)量與結構數(shù)據(jù)量形成了巨大的反差。鑒于此,序列分析已經(jīng)成了這一領域現(xiàn)階段的首要任務。開發(fā)有效的數(shù)據(jù)分析工具,將序列信息轉換成生物化學和生理學知識,弄清它們所蘊含的結構和功能信息,最終了解它們所代表的生物學意義。

現(xiàn)階段揭示序列數(shù)據(jù)所隱含的生物學意義的主要方法是模式識別技術。顧名思義,模式識別的基本思想是利用存在于蛋白質序列或結構中的某些特征模式識別相關蛋白質的性質。如果某一蛋白質序列或結構中的一部分具有保守性,這種保守性或者與蛋白質的生物活性有關,或者與蛋白質的折疊方式有關;那么,這種特征模式可以用來識別該蛋白質家族中的新成員。換句話說,如果將已知蛋白質的特征序列模式和特征結構模式搜集起來,構建成數(shù)據(jù)庫,則可以用來確定新測定的蛋白質序列中是否具有某種特征模式,從而確定該未知蛋白屬于哪個蛋白質家族。

蛋白質二級結構預測的方法有三種。一是由已知結構統(tǒng)計各種氨基酸殘基形成二級結構的構象趨勢,其中最常用的是Chou 和 Fasman法;二是基于氨基酸的物理化學性質,包括堆積性、疏水性、電荷性、氫鍵形成能力等;三是通過序列比對,由已知三維結構的同源蛋白推斷未知蛋白的二級結構。盡管Chou和Fasman法被公認為是經(jīng)典的二級結構預測方法,但其準確性只能達到65%。究其原因,是因為用作統(tǒng)計二級結構構象趨勢的蛋白質空間結構數(shù)據(jù)庫中非同源蛋白的數(shù)量還不夠多?;诙嘈蛄斜葘Φ亩壗Y構預測方法其精度可提高幾個百分點。蛋白質三級結構預測,特別是基于二級結構預測的三級結構預測,盡管已經(jīng)由個別成功的例子,總的說來,還遠遠沒有成熟。

利用數(shù)據(jù)庫搜索找出未知蛋白的同源序列,是序列分析的基礎。其基本出發(fā)點,是基于序列的相似性比對。相似性(similarity)和同源性(homology)是兩個不同的概念。確切地說,相似性概念來自于蛋白質結構分析。它具有兩層含義??梢灾附Y構相似或折疊方式相似。也可以指序列或結構雖不具有相似性,但它們具有相似的空間構型??梢哉J為,相似關系是趨同進化的結果。是從不同的進化起點出發(fā),達到相似的生物功能。

有時一個可能的新基因通過同源檢索找不到任何同源基因。這種序列就稱為"孤兒"基因。生物信息學也提供一些預測孤兒基因功能的方法。這就是通過基于結構的同源比較(structure-structure alignment)尋找結構同源的基因或直接預測其高級結構來推測其可能的功能。有許多蛋白質高級結構數(shù)據(jù)庫提供結構同源比較的檢索。另一方面,直接預測基因產(chǎn)物的高級結構的算法現(xiàn)在已經(jīng)有不少,然而,由于蛋白質的折疊結構實在太復雜,使得計算最佳構象非常困難。如果結構生物學在這方面的研究能夠有所突破,無疑將大大推動基因功能的預測。

5. 基因多態(tài)性分析與藥物設計

即使一個基因的序列已經(jīng)確定,它只是有代表性的序列之一。在群體的分布中,仍存在有基因的多態(tài)性。由于多態(tài)性的存在,生物表型及對環(huán)境、外源物和藥物的反應都有所不同。研究基因多態(tài)性可以對群體的基因共性及其中的基因個性都有明確的認識,從而在保健、預防、治療以及制藥方面實現(xiàn)個性化最優(yōu)化。

生物信息學所提供的數(shù)據(jù)資料,可以指導對藥物作用靶位的選定和藥物分子的設計。這種方法有快速高效的特點,它的研究包括大分子結構功能的模擬和預報,藥物分子與大分子結合的模擬,關鍵性基因的致病機制,及生物分子同源性的分析,生物分子在指定細胞的分布和位點以及個體差異等等。

6. 分子進化

根據(jù)多種生物的基因組數(shù)據(jù)及對垂直進化和平行演化的研究,可以對生命至關重要的基因結構及它的調控進行研究,對此需要建立較完整的生物進化模型,用基因組的數(shù)據(jù)來鑒別出環(huán)境因素對其進化的影響。這次研究成果應對生態(tài)環(huán)境,環(huán)境衛(wèi)生提出指導性影響,對研究生命起源也有科學意義。

如我們可以通過比較蛋白質殘基同源序列來考察進化關系。在同源序列中,有必要將不同種屬中具有相同功能的蛋白質和一個個體中既有一定關系卻又不相同的蛋白質加以區(qū)別,前者稱直系同源物(orthologues),后者稱旁系同源物(paralogues)。直系同源蛋白的序列比較,為分子考古學提供了方向。在某些情況下,利用構建進化樹的方法,可以揭示細菌、酵母、昆蟲、動物、植物之間的關系。這些關系只能從分子水平才能得以闡明。旁系同源蛋白的研究,對進化的內在機制提供了較為深入的線索。旁系同源蛋白是從同一個基因經(jīng)連續(xù)的復制而形成。復制所得基因經(jīng)歷了各自的進化途徑,新物種通過變異和適應而產(chǎn)生。

7. 基于遺傳的流行病

流行病學研究是醫(yī)學信息學的重要課題之一。將流行病學的遺傳和非遺傳性的研究與分子基因信息結合起來,會導致對疾病的機理、個體對某種疾病的易感性和疾病在群體中的分布有更明確的認識,對疾病的預防和治療有極大的指導意義。

本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
生物信息學----核酸和蛋白質的分析方法
計算生物學最新進展與商業(yè)化思考
生物實驗數(shù)據(jù)和計算技術
第二章 基因組的結構與功能 自測題
生物信息學常用基本詞匯表
生物信息學數(shù)據(jù)庫
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服