国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
曾引起人工智能、生命科學(xué)兩界大地震,DeepMind背后的AlphaFold2是什么來頭?

編譯| 渣渣輝   

出品| 科創(chuàng)實(shí)驗(yàn)室



7月15日,總部位于倫敦的DeepMind(2014年被谷歌收購)發(fā)布了其深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)AlphaFold2的開源版本,并在《自然》雜志上的一篇論文中描述了其方法,據(jù)悉該神經(jīng)網(wǎng)絡(luò)在去年的蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽中占據(jù)主導(dǎo)地位。

與此同時(shí),另一個(gè)學(xué)術(shù)團(tuán)隊(duì)已基于AlphaFold2開發(fā)出了自己的蛋白質(zhì)預(yù)測工具——RoseTTaFold,從7月15日發(fā)表的一篇科學(xué)論文中的描述來看,RoseTTaFold系統(tǒng)幾乎和AlphaFold2一樣強(qiáng)大。

伊利諾伊芝加哥大學(xué)(University of Illinois at Chicago)計(jì)算生物學(xué)家徐金波(音譯)表示:“這些工具的開源性意味著科學(xué)界應(yīng)該能夠在進(jìn)步的基礎(chǔ)上,創(chuàng)造出更強(qiáng)大、更有用的軟件?!?/p>

01

一場改變游戲規(guī)則的比賽

AlphaFold 首次登場是在 2018 年的最后一屆 CASP 中,雖首次參賽但成績?nèi)悦星懊?。或許部分讀者對DeepMind這家總部位于倫敦創(chuàng)業(yè)公司并不熟悉,但說到其產(chǎn)品可能就無人不知、無人不曉了,例如引起擊敗李世石、柯潔的AlphaGO。而首次登場的AlphaFold 也即將帶來一場生物科學(xué)界的大地震。

“這改變了游戲規(guī)則,”德國生物學(xué)家安德烈·盧帕斯表示:“在CASP不同團(tuán)隊(duì)中就DeepMind與眾不同,其AlphaFold已經(jīng)幫助我找到了困擾我十年的一種蛋白質(zhì)的結(jié)構(gòu),預(yù)計(jì)它會(huì)改變我的工作方式和處理問題的邏輯、改變醫(yī)學(xué)、改變研究、改變生物工程、改變一切?!?/p>

不過對于AlphaFold 一些科學(xué)家還是表示不能有太高期望,在某些情況下的結(jié)構(gòu)預(yù)測與使用'黃金標(biāo)準(zhǔn)'實(shí)驗(yàn)方法(如 X 射線晶體學(xué)和近年來低溫電子顯微鏡)確定的預(yù)測沒有區(qū)別。AlphaFold 也許還不能避免這些費(fèi)力和昂貴的方法的需求,但人工智能將使得以新的方式研究生物成為可能。

圖片來源:nature

但DeepMind的進(jìn)化速度遠(yuǎn)遠(yuǎn)超出預(yù)期。2020年初,該公司發(fā)布了對少數(shù)SARS-CoV-2蛋白質(zhì)結(jié)構(gòu)的預(yù)測,這些蛋白質(zhì)雖然尚未通過實(shí)驗(yàn)確定,但加州大學(xué)伯克利分校的分子神經(jīng)生物學(xué)家史蒂芬·布羅霍恩卻表示:“DeepMindDeepMind對一種叫做Orf3a的蛋白質(zhì)的預(yù)測最終與后來通過低溫EM確定的非常相似,他們能夠做的事情令人印象深刻?!?/p>

當(dāng)然引發(fā)生命科學(xué)界大震動(dòng)的還是在2020年末, AlphaFold2 基于氨基酸序列近乎完美地精確預(yù)測出了蛋白質(zhì)三維結(jié)構(gòu),其預(yù)測水準(zhǔn)與實(shí)驗(yàn)室水平相差無幾,一舉破解了困擾學(xué)界長達(dá)五十年之久的“蛋白質(zhì)折疊”難題。

Science 驚呼,“科學(xué)研究的游戲已經(jīng)改變了?!?/p>

02

AlphaFold2能夠解決生命科學(xué)哪些問題

在生命科學(xué)領(lǐng)域采用AI研究預(yù)測的并不只有DeepMind一家,近期華盛頓大學(xué)醫(yī)學(xué)院蛋白質(zhì)設(shè)計(jì)研究所 David Baker 教授領(lǐng)導(dǎo)生物信息學(xué)家團(tuán)隊(duì)也開發(fā)出了一款名為 RoseTTAFold 的深度學(xué)習(xí)工具。據(jù)官方介紹,RoseTTAFold 在短短十分鐘內(nèi)就可以準(zhǔn)確可靠地計(jì)算出蛋白質(zhì)結(jié)構(gòu),預(yù)測水準(zhǔn)與 AlphaFold2 水平相似(已開源)。這不禁令人想問:AI究竟能夠幫助生命科學(xué)解決哪些問題?為何能夠輕易破解困擾學(xué)界多年的難題?

圖片來源:nature

第一:結(jié)構(gòu)問題

蛋白質(zhì)是生命的基石,是細(xì)胞內(nèi)部發(fā)生的大多數(shù)事情的原因。蛋白質(zhì)的工作原理和作用取決于其3D形狀——'結(jié)構(gòu)就是功能'是分子生物學(xué)的公理。

幾十年來,實(shí)驗(yàn)室實(shí)驗(yàn)一直是獲得良好蛋白質(zhì)結(jié)構(gòu)的主要途徑。從20世紀(jì)50年代開始,利用X射線束射向結(jié)晶蛋白和將衍射光轉(zhuǎn)化為蛋白質(zhì)原子坐標(biāo)的技術(shù),確定了蛋白質(zhì)的第一個(gè)完整結(jié)構(gòu)。X射線晶體學(xué)在蛋白質(zhì)結(jié)構(gòu)中所占份額最大。但是,在過去的十年里,低溫EM已經(jīng)成為許多結(jié)構(gòu)生物學(xué)實(shí)驗(yàn)室的青睞工具。

長期以來,科學(xué)家們一直想知道蛋白質(zhì)的成分,一串不同的氨基酸是如何描繪出其最終形狀的許多曲折和褶皺的。研究人員說,在20世紀(jì)80年代和90年代,早期試圖利用計(jì)算機(jī)來預(yù)測蛋白質(zhì)結(jié)構(gòu)的嘗試表現(xiàn)不佳,直到2018年 CASP13 上DeepMind 的出現(xiàn)。

人類基因組擁有超過20000種蛋白質(zhì)的指令,但目前能夠確定的3D結(jié)構(gòu)大約只有三分之一,而AlphaFold 神經(jīng)網(wǎng)絡(luò)生成了一個(gè)'完全變革性'的數(shù)據(jù)庫,該數(shù)據(jù)庫包含來自智人和 20 種模型生物的 5 萬多個(gè)結(jié)構(gòu),目前已經(jīng)預(yù)測了幾乎整個(gè)人類蛋白質(zhì)組的結(jié)構(gòu)(由生物體表達(dá)的蛋白質(zhì)的全部補(bǔ)充)。此外,該工具還預(yù)測了從老鼠和玉米(玉米)到瘧原蟲等各種其他生物的幾乎完整的蛋白質(zhì)組(見'折疊選項(xiàng)')。研究人員表示到今年年底,資源結(jié)構(gòu)將增長到1.3億,這有可能徹底改變生命科學(xué)。

第二:預(yù)測及效率問題

DeepMind去年震驚了生命科學(xué)界,AlphaFold的一些預(yù)測與標(biāo)準(zhǔn)的實(shí)驗(yàn)?zāi)P筒幌嗌舷拢恍┛茖W(xué)家都不得不承認(rèn)神經(jīng)網(wǎng)絡(luò)的影響是劃時(shí)代的。

前不久,DeepMind 開源了 AlphaFold2 背后的源代碼,并詳細(xì)描述了其開發(fā)方式(學(xué)術(shù)團(tuán)隊(duì)已經(jīng)開始利用這些資源做出有用的預(yù)測)。在準(zhǔn)備AlphaFold的代碼供公開發(fā)布的過程中,DeepMind 改進(jìn)了代碼,使其運(yùn)行更加高效。據(jù)悉其效率已由此前在CASP的數(shù)天時(shí)間,縮短在開源版本中的幾分鐘到幾小時(shí)。

有了這種額外的效率,DeepMind團(tuán)隊(duì)開始預(yù)測幾乎所有由人類基因組編碼的已知蛋白質(zhì)的結(jié)構(gòu),以及20個(gè)模型生物體的結(jié)構(gòu)。這些結(jié)構(gòu)可在英國欣克斯頓的EMBL-EBI(歐洲分子生物學(xué)實(shí)驗(yàn)室歐洲生物信息學(xué)研究所)維護(hù)的數(shù)據(jù)庫中找到。

除了覆蓋98.5%已知人類蛋白質(zhì)和其他生物體的類似百分比的預(yù)測結(jié)構(gòu)外,AlphaFold還產(chǎn)生了對其預(yù)測信心的測量。'我們希望給實(shí)驗(yàn)家和生物學(xué)家一個(gè)非常清楚的信號(hào),說明他們應(yīng)該依靠哪些部分的預(yù)測,'凱瑟琳·圖尼亞蘇武納庫爾(DeepMind科學(xué)工程師、《自然》論文第一作者)說道。

對于人類蛋白質(zhì)組來說,如果它對單個(gè)氨基酸位置的預(yù)測有58%,那么足以去驗(yàn)證蛋白質(zhì)褶皺的形狀。如果這些預(yù)測的部分占到了總數(shù)的36% ,那么足以詳細(xì)說明可用于藥物設(shè)計(jì)的原子特征,如酶的活性部位。

即使是不太準(zhǔn)確的預(yù)測也可能提供見解。生物學(xué)家認(rèn)為,人類蛋白質(zhì)和其他具有核細(xì)胞的真核生物的蛋白質(zhì)中,有很大一部分含有天生紊亂的區(qū)域,并且只有與其他分子協(xié)同才能具有一種明確的結(jié)構(gòu)。AlphaFold首席研究員約翰說:'許多蛋白質(zhì)只是溶液中的擺動(dòng),它們沒有固定的結(jié)構(gòu)。

第三:數(shù)據(jù)泛濫問題

EMBL-EBI的結(jié)構(gòu)生物信息學(xué)家薩米爾·維蘭卡爾說:“本周沉積的大約36.5萬種結(jié)構(gòu)預(yù)測到今年年底將膨脹到1.3億種——幾乎是已知蛋白質(zhì)的一半。隨著新蛋白質(zhì)的識(shí)別和預(yù)測的改進(jìn),數(shù)據(jù)庫內(nèi)容規(guī)模還將呈現(xiàn)幾何增長,但這并不都是科學(xué)家所期望獲得的資源?!?/p>

研究人員已經(jīng)在使用AlphaFold和相關(guān)工具,以幫助理解使用X射線晶體學(xué)和低溫電子顯微鏡產(chǎn)生的實(shí)驗(yàn)數(shù)據(jù)。科羅拉多博爾德大學(xué)的生物化學(xué)家馬塞洛·蘇薩利用AlphaFold從細(xì)菌用來躲避一種叫做膽堿的抗生素的蛋白質(zhì)的X射線數(shù)據(jù)中制作模型。蘇薩指出,與阿爾法折疊預(yù)測不同的實(shí)驗(yàn)?zāi)P筒糠滞ǔJ擒浖缘椭眯哦确峙涞膮^(qū)域,這表明阿爾法折疊正在準(zhǔn)確預(yù)測其極限。

不過,英國劍橋MRC分子生物學(xué)實(shí)驗(yàn)室的結(jié)構(gòu)生物學(xué)家文基·拉馬克里什南說,生物學(xué)家們?nèi)韵M^續(xù)將這些預(yù)測作為實(shí)驗(yàn)數(shù)據(jù)的基準(zhǔn),以便更好地掌握它們的可靠性。'我們需要能夠信任這些數(shù)據(jù),'奧倫戈補(bǔ)充道。

但紐約市哥倫比亞大學(xué)從事蛋白質(zhì)結(jié)構(gòu)預(yù)測的計(jì)算生物學(xué)家穆罕默德·阿爾奎希說,這么多蛋白質(zhì)結(jié)構(gòu)的出現(xiàn)可能標(biāo)志著生物學(xué)的'范式轉(zhuǎn)變'。他的領(lǐng)域花了太多的時(shí)間和精力來預(yù)測如此大規(guī)模的精確蛋白質(zhì)結(jié)構(gòu),以至于它還沒有確定如何處理這些資源。'

奧倫戈希望數(shù)據(jù)庫能幫助她更好地了解蛋白質(zhì)的結(jié)構(gòu)約束。她已經(jīng)將已知蛋白質(zhì)的數(shù)據(jù)庫映射到大約5000個(gè)'結(jié)構(gòu)家族'中,但是數(shù)據(jù)庫中大約一半的蛋白質(zhì)被排除在外,因?yàn)闆]有其他蛋白質(zhì)可以確定結(jié)構(gòu)。阿爾法福爾德的預(yù)測可以幫助發(fā)現(xiàn)新的形狀,她說。'我們將真正看到折疊空間是什么樣子的。

03

AlphaFold翻越山丘

目前DeepMind對大部分蛋白質(zhì)結(jié)構(gòu)的預(yù)測與真實(shí)結(jié)構(gòu)只差一個(gè)原子的寬度,達(dá)到了人類利用冷凍電鏡等復(fù)雜儀器觀察預(yù)測的水平,AlphaFold就像是一顆核彈在人工智能與生命科學(xué)兩界引爆引掀起軒然大波,西雅圖華盛頓大學(xué)的生物化學(xué)家大衛(wèi)·貝克說:'當(dāng)時(shí)我感覺我好像失業(yè)了,但同樣也激發(fā)了對新式實(shí)驗(yàn)方式探索的好奇心?!?/p>

AlphaFold最直接的影響還是改變了蛋白質(zhì)結(jié)構(gòu)解析的手段,甚至是科學(xué)研究的方式與方法。利用實(shí)驗(yàn)室手段可能需要數(shù)年的研究才能解析一個(gè)蛋白質(zhì)結(jié)構(gòu),而利用計(jì)算結(jié)構(gòu)模型最快只需 10 分鐘。

不過AlphaFold不太可能關(guān)閉實(shí)驗(yàn)室,如布羅霍恩的實(shí)驗(yàn)室,使用實(shí)驗(yàn)方法來解決蛋白質(zhì)結(jié)構(gòu)。復(fù)旦大學(xué)生命科學(xué)學(xué)院教授丁澦預(yù)測:“對于已知的一些固有折疊模式,應(yīng)該深入了解其折疊的科學(xué)本質(zhì),為算法優(yōu)化打下基礎(chǔ);而對于一些未知、穩(wěn)定的構(gòu)象,隨著收集到的結(jié)構(gòu)數(shù)量增加,人工智能會(huì)算得更準(zhǔn);而對于柔性區(qū)域,特別是復(fù)合物中只有相互作用才會(huì)形成高級結(jié)構(gòu)的序列,可能需要開發(fā)更為特殊和精細(xì)的方法學(xué),目前還是離不開實(shí)驗(yàn)室。”

'對于相互作用才會(huì)形成高級結(jié)構(gòu)的序列,我開始認(rèn)為這個(gè)問題在我的有生之年無法解決,'英國欣克斯頓歐洲分子生物學(xué)實(shí)驗(yàn)室-歐洲生物信息學(xué)研究所的結(jié)構(gòu)生物學(xué)家珍妮特·桑頓(Janet Thornton)說道。但總體來說,AlphaFold2的的開源對于生命科學(xué)與人工智能來說是一件幸事。

文章原文:'It will change everything’: DeepMind’s AI makes gigantic leap in solving protein structures
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
“生化版”阿爾法狗來了,生命密碼的馬奇諾防線崩了
顛覆生物學(xué)!AlphaFold成功預(yù)測蛋白質(zhì)結(jié)構(gòu)
DeepMind的蛋白質(zhì)折疊AI解決了50年來的生物學(xué)重大挑戰(zhàn)
老年癡呆不再可怕了,用阿爾法折疊可提前十年檢測!
Nature|AlphaFold和AI蛋白質(zhì)折疊革命的下一步是什么
《Science》公布2021年度突破:一個(gè)困擾生物學(xué)家50年的難題,被AI解決了,并實(shí)現(xiàn)了一位諾獎(jiǎng)?wù)叩膲粝雦蛋白|生物化學(xué)家|細(xì)胞|蛋白質(zhì)|氨基酸
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服