国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
會(huì)預(yù)測(cè)蛋白結(jié)構(gòu)的AI,還要教我們?cè)O(shè)計(jì)新蛋白

自然界經(jīng)過了數(shù)千萬年的生命進(jìn)化過程,才產(chǎn)生了這么復(fù)雜而美麗的蛋白質(zhì)世界,而神經(jīng)網(wǎng)絡(luò)竟然用極短的時(shí)間就能模擬這一過程。


撰文 | 曹龍興(華盛頓大學(xué)蛋白質(zhì)設(shè)計(jì)所博士后)、盧培龍(西湖大學(xué)特聘研究員)

不久前,谷歌公司旗下的DeepMind研發(fā)的AlphaFold2人工智能系統(tǒng)在國際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽(CASP)上取得驚人的準(zhǔn)確度,多數(shù)預(yù)測(cè)模型與實(shí)驗(yàn)測(cè)得的蛋白質(zhì)結(jié)構(gòu)模型高度一致,引起了舉世矚目。實(shí)際上,蛋白質(zhì)的結(jié)構(gòu)不僅可以被預(yù)測(cè),還可以被設(shè)計(jì),二者互為“逆操作”。AlphaFold2在結(jié)構(gòu)預(yù)測(cè)上的成功,也將惠及蛋白質(zhì)設(shè)計(jì)領(lǐng)域。如今,以深度學(xué)習(xí)技術(shù)為代表的人工智能無疑已經(jīng)高度融入生物科學(xué)與技術(shù)領(lǐng)域,并且極大地推動(dòng)了生物領(lǐng)域的發(fā)展。今天我們就來講講深度學(xué)習(xí)對(duì)蛋白質(zhì)設(shè)計(jì)領(lǐng)域的影響。


什么是蛋白質(zhì)設(shè)計(jì)?


圖1. 氨基酸(amino acid)組成肽鏈,肽鏈折疊成蛋白質(zhì)(生物大分子),不同氨基酸組成的肽鏈會(huì)在空間中折疊成各種形狀,從而行使不同的功能。

(來源:https://biocorpllc.com/there-is-a-lot-of-misinformation-about-protein-and-amino-acids/

蛋白質(zhì)是由氨基酸組成的長鏈條高分子化合物(圖1)。天然蛋白質(zhì)基本上由天然氨基酸以一定的組合順序排列形成,序列長度不定。天然氨基酸共有20種,化學(xué)組成和性質(zhì)各不相同,它們?cè)谛蛄兄g的相互作用決定了蛋白質(zhì)折疊形成的形狀、結(jié)構(gòu),以及折疊后的功能。這就像不同形狀的積木可以搭成不同形狀、不同功能的建筑。例如我們熟知的血紅蛋白可以結(jié)合并輸送氧氣,新冠病毒的中和抗體(蛋白)可以保護(hù)人體免于病毒的攻擊——這些都是蛋白質(zhì)的不同功能。人體中有兩萬多種基因用于編碼不同的蛋白質(zhì)序列,如果考慮不同的剪接形式、修飾和突變,蛋白質(zhì)的類別總數(shù)目有可能超過10萬。

通過編排蛋白質(zhì)的氨基酸序列,使其能夠自發(fā)折疊,形成所需要的三維結(jié)構(gòu),并具有一定的功能,這就是蛋白質(zhì)設(shè)計(jì)了。蛋白質(zhì)設(shè)計(jì)可以分為蛋白質(zhì)的人工改造和蛋白質(zhì)從頭設(shè)計(jì)。蛋白質(zhì)的人工改造是基于現(xiàn)有蛋白質(zhì)的結(jié)構(gòu)進(jìn)行一定的突變和進(jìn)化。蛋白質(zhì)的從頭設(shè)計(jì),是完全基于生物物理與生物化學(xué)原理的——它不依賴現(xiàn)有的天然蛋白質(zhì)結(jié)構(gòu),而是從頭搭建、設(shè)計(jì)具有全新結(jié)構(gòu)和全新功能的蛋白質(zhì)。如果拿建房子來類比的話,前者類似于對(duì)現(xiàn)有房屋的裝修改造,細(xì)節(jié)上有變化,整體框架往往變動(dòng)不大;而后者就像是先從白紙上畫藍(lán)圖,設(shè)計(jì)房子的每個(gè)細(xì)節(jié),最終搭建出個(gè)性化的建筑。較之自然界演化的蛋白質(zhì),人工從頭設(shè)計(jì)蛋白質(zhì),可以幫助我們探索整個(gè)蛋白質(zhì)序列折疊空間,并在性能方面更好地滿足我們特定的需求(圖2)。蛋白質(zhì)設(shè)計(jì)領(lǐng)域的巨擘David Baker領(lǐng)導(dǎo)的蛋白質(zhì)設(shè)計(jì)研究所在這一領(lǐng)域取得了一系列奠基性的成果,并一直持續(xù)產(chǎn)生重要的突破與進(jìn)展。

圖2. 利用蛋白質(zhì)設(shè)計(jì)開發(fā)的可高效中和新冠病毒的人工蛋白質(zhì)(點(diǎn)擊看大圖) 丨UW Institute for Protein Design

蛋白質(zhì)設(shè)計(jì)是蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的逆操作,兩者就像一枚硬幣的正反面:結(jié)構(gòu)預(yù)測(cè)是從蛋白質(zhì)序列出發(fā),預(yù)測(cè)現(xiàn)有氨基酸序列能夠形成什么樣的三維結(jié)構(gòu);蛋白質(zhì)設(shè)計(jì)剛好相反,先確定我們需要什么樣的三維結(jié)構(gòu),再找到能夠自發(fā)折疊成所需三維結(jié)構(gòu)的蛋白質(zhì)序列。蛋白質(zhì)設(shè)計(jì)與蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)圍繞的都是“蛋白質(zhì)如何折疊”這一根本問題。無疑,蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)水平的提高會(huì)大大加速蛋白質(zhì)設(shè)計(jì)的過程。


深度學(xué)習(xí)如何影響蛋白質(zhì)設(shè)計(jì)領(lǐng)域?

AlphaFold2在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)中取得了巨大成功,將直接促進(jìn)蛋白質(zhì)設(shè)計(jì)的發(fā)展,并會(huì)催生出一系列基于深度學(xué)習(xí)的蛋白質(zhì)設(shè)計(jì)新方法。

首先,深度學(xué)習(xí)算法可直接用于提高蛋白質(zhì)設(shè)計(jì)的精度以及成功率。

當(dāng)前設(shè)計(jì)蛋白質(zhì)的基本思路是:通過編排氨基酸序列,使其可以自發(fā)折疊成所要設(shè)計(jì)的結(jié)構(gòu),并使整個(gè)體系自由能最低,以保證該三維結(jié)構(gòu)可以穩(wěn)定存在。但是,由于蛋白質(zhì)序列的排列組合空間極其巨大,且當(dāng)前能量計(jì)算函數(shù)精度不足,所以蛋白質(zhì)設(shè)計(jì)的成功率并不高。大部分計(jì)算機(jī)設(shè)計(jì)的全新氨基酸序列并不能折疊成、或者只能近似折疊成我們想要的結(jié)構(gòu)。而要讓設(shè)計(jì)出的蛋白質(zhì)具有期望的功能,必須保證三維結(jié)構(gòu)上的高精準(zhǔn)度。比如,只能通過特定離子的膜蛋白通道,以及可催化特定反應(yīng)的酶,要成功設(shè)計(jì)這些新型蛋白質(zhì),活性位點(diǎn)的原子級(jí)別的精準(zhǔn)度是關(guān)鍵之一。

囿于當(dāng)前蛋白質(zhì)設(shè)計(jì)領(lǐng)域的這些局限,設(shè)計(jì)者通常需要在實(shí)驗(yàn)室中花費(fèi)大量的時(shí)間與精力,通過高通量篩選以及定向進(jìn)化的方法,從大量的序列中篩選出具有特定結(jié)構(gòu)和高活性的蛋白質(zhì)。

此時(shí),AlphaFold2提供了一個(gè)非常好的結(jié)構(gòu)驗(yàn)證工具:通過高精度的結(jié)構(gòu)預(yù)測(cè),篩選出能折疊成目標(biāo)結(jié)構(gòu)的序列,還可以優(yōu)化氨基酸序列,使最終的三維結(jié)構(gòu)與所要設(shè)計(jì)的蛋白質(zhì)結(jié)構(gòu)更加接近。這將減少大量繁瑣的實(shí)驗(yàn)室篩選和優(yōu)化環(huán)節(jié),縮短蛋白質(zhì)設(shè)計(jì)的時(shí)間,降低人力成本,提高設(shè)計(jì)成功率,并有可能設(shè)計(jì)出結(jié)構(gòu)和功能更加復(fù)雜的蛋白質(zhì)。新舊兩種方法的對(duì)比可見圖3。

圖3. 采用高通量篩選和定向進(jìn)化方法的蛋白質(zhì)設(shè)計(jì)流程(黃色箭頭)vs. 通過深度學(xué)習(xí)算法優(yōu)化蛋白質(zhì)設(shè)計(jì)流程(綠色箭頭) 丨作者作圖

另一方面,AlphaFold2也會(huì)啟發(fā)人們開發(fā)基于深度學(xué)習(xí)的蛋白質(zhì)設(shè)計(jì)新方法 。

在AlphaFold之前的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)領(lǐng)域,深度神經(jīng)網(wǎng)絡(luò)主要是通過分析和提煉同源蛋白序列之間的進(jìn)化信息,預(yù)測(cè)出氨基酸之間的距離關(guān)系,進(jìn)而構(gòu)建出氨基酸序列所對(duì)應(yīng)的三維結(jié)構(gòu)。但在2018年的國際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽(CASP13)上,AlphaFold近乎完美地預(yù)測(cè)了一個(gè)沒有任何同源序列的、全新設(shè)計(jì)的蛋白質(zhì)的三維結(jié)構(gòu),極大地震撼了蛋白質(zhì)設(shè)計(jì)科學(xué)家。這表明,深度神經(jīng)網(wǎng)路并不僅僅從同源蛋白之間的進(jìn)化信息獲取三維結(jié)構(gòu)的特征,而是可以直接理解蛋白質(zhì)序列和結(jié)構(gòu)之間的復(fù)雜關(guān)系。

AlphaFold2更進(jìn)一步,它直接將蛋白質(zhì)一級(jí)序列和三維結(jié)構(gòu)通過一個(gè)精妙的深度神經(jīng)網(wǎng)絡(luò)關(guān)聯(lián)了起來,這就像是DeepMind找到了一個(gè)優(yōu)美的數(shù)學(xué)公式,可以將蛋白質(zhì)的序列和結(jié)構(gòu)用等號(hào)連接起來(圖4)。

圖4:通過深度神經(jīng)網(wǎng)絡(luò)構(gòu)建蛋白質(zhì)序列與結(jié)構(gòu)之間的關(guān)系丨作者作圖

AI蛋白質(zhì)設(shè)計(jì)的成就與挑戰(zhàn)

目前,科學(xué)家已經(jīng)使用深度學(xué)習(xí)在蛋白質(zhì)設(shè)計(jì)領(lǐng)域做了很多嘗試和努力,并取得了許多令人興奮的結(jié)果。比如,通過學(xué)習(xí)自然界中蛋白質(zhì)結(jié)構(gòu)與序列之間的關(guān)系,深度神經(jīng)網(wǎng)絡(luò)已經(jīng)可以直接根據(jù)蛋白質(zhì)的三維結(jié)構(gòu)預(yù)測(cè)最佳的可折疊成該結(jié)構(gòu)的氨基酸序列。這將大大加速整個(gè)蛋白質(zhì)設(shè)計(jì)的過程,甚至徹底替代傳統(tǒng)的、通過優(yōu)化能量來設(shè)計(jì)氨基酸序列的過程。

另外一個(gè)令人興奮的結(jié)果是美國華盛頓大學(xué)David Baker實(shí)驗(yàn)室開發(fā)的基于深度學(xué)習(xí)的蛋白質(zhì)設(shè)計(jì)方法——神經(jīng)網(wǎng)絡(luò)trDesign。通過不斷學(xué)習(xí)自然界中存在的蛋白質(zhì)一級(jí)序列和三維結(jié)構(gòu),trDesign竟能自己頓悟、設(shè)想出全新的、自然界中不存在的蛋白質(zhì)。經(jīng)實(shí)驗(yàn)驗(yàn)證,這些蛋白質(zhì)可以自發(fā)折疊成非常穩(wěn)定的三維結(jié)構(gòu)。自然界經(jīng)過了數(shù)千萬年的生命進(jìn)化過程,才產(chǎn)生了這么復(fù)雜而美麗的蛋白質(zhì)世界,而神經(jīng)網(wǎng)絡(luò)竟然用極短的時(shí)間就能模擬這一過程。如果添加一些限制條件,比如蛋白質(zhì)-蛋白質(zhì)結(jié)合位點(diǎn)信息或者酶催化活動(dòng)中心信息,trDesign甚至可以創(chuàng)造出具有這些關(guān)鍵結(jié)構(gòu)特征的蛋白質(zhì)。研究人員現(xiàn)在正運(yùn)用實(shí)驗(yàn)方法檢驗(yàn)這些蛋白質(zhì)是否具有相應(yīng)的功能。在未來幾年時(shí)間內(nèi),深度學(xué)習(xí)在蛋白質(zhì)設(shè)計(jì)中的應(yīng)用將會(huì)產(chǎn)生更多令人興奮的、現(xiàn)在難以預(yù)測(cè)的結(jié)果與發(fā)現(xiàn)。

圖5. David Baker博士因其在蛋白質(zhì)設(shè)計(jì)方面的貢獻(xiàn)獲得2021年生命科學(xué)突破獎(jiǎng)。| by Ian Haydon

正如DeepMind所提到的,AlphaFold2目前仍有一定的局限性:蛋白質(zhì)側(cè)鏈構(gòu)象與位置信息不能十分精確;暫時(shí)不能對(duì)于多鏈蛋白質(zhì)復(fù)合物、蛋白質(zhì)-DNA(RNA)、蛋白質(zhì)-小分子等復(fù)合物的結(jié)構(gòu)進(jìn)行預(yù)測(cè);暫時(shí)不能預(yù)測(cè)蛋白質(zhì)的多種結(jié)構(gòu)狀態(tài),動(dòng)態(tài)過程缺失。這些問題也是蛋白質(zhì)設(shè)計(jì)領(lǐng)域非常關(guān)心的。隨著利用深度學(xué)習(xí)的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法進(jìn)一步發(fā)展,這些方面將會(huì)取得進(jìn)一步突破,促進(jìn)人們?cè)O(shè)計(jì)更為復(fù)雜的,功能更加強(qiáng)大的新型蛋白質(zhì)。


人工智能,無限可能

AlphaFold2精確預(yù)測(cè)蛋白結(jié)構(gòu)的消息傳出后,圈內(nèi)圈外都在驚嘆深度神經(jīng)網(wǎng)絡(luò)所取得的偉大成就,調(diào)侃結(jié)構(gòu)生物學(xué)家失業(yè)的話題也熱鬧了一陣。這讓我們想起了七年前,冷凍電鏡技術(shù)取得革命性進(jìn)展時(shí),“以蛋白質(zhì)結(jié)晶學(xué)為主要技術(shù)手段的結(jié)構(gòu)生物學(xué)家是不是會(huì)失業(yè)”的話題。我們現(xiàn)在回頭看去,結(jié)構(gòu)生物學(xué)家不但沒有失業(yè),反而利用最新的技術(shù)手段做出了一個(gè)又一個(gè)重要發(fā)現(xiàn),并破解了大量以前我們不可能看到的生命奧秘。

在科學(xué)史上,技術(shù)的革新與科學(xué)的突破互為因果,相輔相成,我們要做的就是擁抱科技的進(jìn)步,并以此為基礎(chǔ)取得新的突破。以AlphaFold系列為代表的深度學(xué)習(xí)方法將給蛋白質(zhì)設(shè)計(jì)領(lǐng)域帶來深遠(yuǎn)影響,其中充滿了機(jī)遇與無限的可能性,我們對(duì)此無比期待。


本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
Nature|人工智能助力蛋白質(zhì)折疊預(yù)測(cè)
【科普】AlphaFold 開啟了新方向嗎?
PNAS | 一種用于蛋白質(zhì)側(cè)鏈裝配和逆向折疊的端到端深度學(xué)習(xí)方法
速度提高100萬倍,哈佛醫(yī)學(xué)院大神提出可預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的新型深度模型
Science:深度學(xué)習(xí)建模,AI巧手設(shè)計(jì)特定蛋白質(zhì)
同日兩篇Science論文,David Baker團(tuán)隊(duì)推出從頭設(shè)計(jì)蛋白質(zhì)序列新模型,幾秒即可設(shè)計(jì)出原創(chuàng)分子
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服