国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項(xiàng)超值服

開通VIP
一天之內(nèi),兩大AI預(yù)測(cè)蛋白結(jié)構(gòu)算法開源,分別登上Nature、Science
機(jī)器之心報(bào)道
機(jī)器之心編輯部

這是科學(xué)激動(dòng)人心的新一步。我們將直播解讀這兩研究,詳見文后。

使用 氨基酸 序列預(yù)測(cè)蛋白質(zhì)形狀的 AphaFold2,終于開源了。

眾所周知,蛋白質(zhì)是生命活動(dòng)的基本組件,它們可以單獨(dú)存在,也會(huì)協(xié)同工作。為了發(fā)揮作用,這些長(zhǎng)鏈氨基酸扭曲、折疊并交織成復(fù)雜的形狀,這些形狀可能很難,甚至根本不可能破譯。

科學(xué)家們一直在夢(mèng)想通過(guò)基因序列簡(jiǎn)單地預(yù)測(cè)蛋白質(zhì)形狀——如果能夠成功,這將開啟一個(gè)洞察生命運(yùn)作機(jī)理的新世界。然而近五十年來(lái),人們的進(jìn)展緩慢。

7 月 15 日,《自然》雜志一篇論文被接收的消息引發(fā)了人們的關(guān)注,谷歌旗下人工智能公司 DeepMind 在研究《Highly accurate protein structure prediction with AlphaFold》中宣布,人們首次發(fā)現(xiàn)了一種通過(guò)計(jì)算來(lái)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)的方法。即使在不知道相似結(jié)構(gòu)的情況下,AI 也可以在原子層面上精確預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。也就是說(shuō),之前備受關(guān)注的 AlphaFold2 終于開源了。


無(wú)獨(dú)有偶,作為相當(dāng)熱門的研究領(lǐng)域,Science 同樣在今天發(fā)表了一篇論文,介紹并開源了一個(gè)可媲美 AlphaFold2 的新工具 RoseTTAFold。

所以說(shuō),賽馬了,感興趣的同學(xué)可以自由選擇。

AlphaFold2 開源,原子精度預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)

2020 年 12 月的國(guó)際蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)競(jìng)賽 CASP ,一項(xiàng)重磅成果引發(fā)了科技界所有人的關(guān)注:由 DeepMind 開發(fā)的 AlphaFold 2 擊敗一眾選手,在準(zhǔn)確性方面達(dá)到比肩人類實(shí)驗(yàn)結(jié)果,被認(rèn)為是蛋白質(zhì)折疊問(wèn)題的解決方案。

在兩年一次的 CASP 競(jìng)賽中,各組爭(zhēng)先預(yù)測(cè)蛋白質(zhì)的 3D 結(jié)構(gòu)。2020,AlphaFold 擊敗了所有其他小組,并在準(zhǔn)確性方面與實(shí)驗(yàn)結(jié)果相匹配。它能以就計(jì)算機(jī)方法而言前所未有的準(zhǔn)確度根據(jù)蛋白質(zhì)的氨基酸序列預(yù)測(cè)其三維結(jié)構(gòu)。

這破解了出現(xiàn)五十年之久的蛋白質(zhì)分子折疊問(wèn)題,同時(shí)證明了 AI 對(duì)于科學(xué)發(fā)現(xiàn),尤其是基礎(chǔ)科學(xué)研究的影響。

科學(xué)家們紛紛表示,這項(xiàng)突破極具意義。Alphafold 的突破性研究成果將幫助科研人員弄清引發(fā)某些疾病的機(jī)制,并為設(shè)計(jì)藥物、農(nóng)作物增產(chǎn),以及可降解塑料的「超級(jí)酶」研發(fā)鋪平道路。

因此,這段時(shí)間以來(lái),科研圈也在等待 AlphaFold 2 的技術(shù)細(xì)節(jié)。

不久之前,Demis Hassabis 就曾在 Twitter 上表示 DeepMind 將開源 AlphaFold2,如今終于兌現(xiàn)承諾。

7 月 15 日,Demis Hassabis、John Jumper 等人在 Nature 雜志上發(fā)表了文章《Highly accurate protein structure prediction with AlphaFold》,描述并開源了 AlphaFold2,它預(yù)測(cè)的蛋白質(zhì)結(jié)構(gòu)能達(dá)到原子水平的準(zhǔn)確度。


  • 鏈接:https://www.nature.com/articles/s41586-021-03819-2

  • 開源地址:https://github.com/deepmind/alphafold


在文章中,DeepMind 表示 AlphaFold 可以周期性的以原子精度預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。在技術(shù)上,AlphaFold 利用多序列對(duì)齊,進(jìn)行深度學(xué)習(xí)算法的設(shè)計(jì),還結(jié)合了關(guān)于蛋白質(zhì)結(jié)構(gòu)的物理和生物學(xué)知識(shí)提升效果。

作為通訊作者之一,Demis Hassabis 在一段聲明中寫到,「去年在 CASP14 大會(huì)上我們揭曉了一個(gè)可以將蛋白質(zhì) 3D 結(jié)構(gòu)預(yù)測(cè)精確到原子水平的全新 AlphaFold 系統(tǒng),此后我們承諾會(huì)分享我們的方法,并為科學(xué)共同體提供廣泛、免費(fèi)的獲取途徑。今天我們邁出了承諾的第一步,在《自然》期刊上分享 AlphaFold 的開源代碼,并發(fā)表了系統(tǒng)的完整方法論,詳盡細(xì)致說(shuō)明 AlphaFold 是如何做到精確預(yù)測(cè)蛋白質(zhì) 3D 結(jié)構(gòu)的。作為一家致力于推動(dòng)科學(xué)進(jìn)步的公司,我們期待看到我們的方法將為科學(xué)界啟發(fā)出什么其他新的研究方法,也期待很快能和大家分享更多我們的新進(jìn)展。」

AlphaFlod 首次參加 CASP 就在 98 名參賽者中名列榜首,準(zhǔn)確地從 43 種蛋白質(zhì)中預(yù)測(cè)出了 25 種蛋白質(zhì)的結(jié)構(gòu)。而同組比賽中獲得第二名的參賽者僅準(zhǔn)確預(yù)測(cè)出了 3 種。AlphaFold 專注于從頭開始建模目標(biāo)形狀,且并不使用先前已經(jīng)解析的蛋白質(zhì)作為模板。在大多數(shù)情況下,AlphaFold 的準(zhǔn)確性與實(shí)驗(yàn)相媲美,大大優(yōu)于其他方法。

圖 1:AlphaFold 產(chǎn)出高準(zhǔn)確度的架構(gòu)。

 AlphaFold 網(wǎng)絡(luò)直接預(yù)測(cè)給定蛋白質(zhì)的所有重原子的三維坐標(biāo),使用基本氨基酸序列和同源序列的對(duì)齊序列作為輸入 (如圖 1e)。

AlphaFold 網(wǎng)絡(luò)由兩個(gè)主要部分組成。首先,網(wǎng)絡(luò)的主干通過(guò)一個(gè)稱為 Evoformer 的新神經(jīng)網(wǎng)絡(luò)塊的重復(fù)層來(lái)處理輸入,產(chǎn)生一個(gè) Nseq × Nres 陣列 (Nseq: 序列數(shù),Nres: 殘差數(shù)) ,它表示一個(gè)處理過(guò)的 MSA 和一個(gè)表示剩余對(duì)的 Nres × Nres 陣列。Evoformer 塊包含許多新穎的基于注意力和非基于注意力的成分,它的關(guān)鍵創(chuàng)新是與 MSA 交換信息的新機(jī)制,并能直接推理空間和進(jìn)化關(guān)系的配對(duì)表征。

網(wǎng)絡(luò)的主干之后是結(jié)構(gòu)模塊(Structure Module),該模塊以蛋白質(zhì)的每個(gè)殘基的旋轉(zhuǎn)和平移的形式引入了顯式的 3-D 結(jié)構(gòu)。這些表征在微不足道的狀態(tài)下初始化,所有旋轉(zhuǎn)設(shè)置為同一性(identity),所有位置設(shè)置為原點(diǎn),但能夠快速開發(fā)和完善具有精確原子細(xì)節(jié)的高度準(zhǔn)確的蛋白質(zhì)結(jié)構(gòu)。這部分網(wǎng)絡(luò)的關(guān)鍵創(chuàng)新包括打破鏈原子結(jié)構(gòu),允許同時(shí)局部細(xì)化結(jié)構(gòu)的所有部分,一個(gè)新的「equivariant transformer」允許網(wǎng)絡(luò)隱式地推理未表示的側(cè)鏈原子,以及損失項(xiàng)可對(duì)殘基方向的正確性賦予重要權(quán)重。

圖 3:架構(gòu)細(xì)節(jié)

圖 4:解釋神經(jīng)網(wǎng)絡(luò)

更多細(xì)節(jié)大家可以查看 Nature 原文與 DeepMind 提供的補(bǔ)充材料。

最后提一句,也不知是何原因,該論文未經(jīng)編輯就出版了(5 月接收、7 月發(fā)表),難道是知道今天 Science 也將發(fā)表論文介紹一個(gè)可與 AlphaFold2 相匹配的研究?也就是下面這一篇。

華盛頓大學(xué)等開發(fā)媲美 AlphaFold2 的新工具 RoseTTAFold

DeepMind 在 2020 年的 CASP14 會(huì)議上展示了其在該領(lǐng)域的顯著成果 AlphaFold2,當(dāng)時(shí)該技術(shù)在預(yù)測(cè)蛋白質(zhì)方面取得了排名第一的準(zhǔn)確率。

華盛頓大學(xué)醫(yī)學(xué)院蛋白質(zhì)設(shè)計(jì)研究所(Institute for Protein Design)的研究者們很大程度上重現(xiàn)了 DeepMind 在蛋白質(zhì)預(yù)測(cè)任務(wù)上的表現(xiàn),他們聯(lián)合哈佛大學(xué)、德克薩斯大學(xué)西南醫(yī)學(xué)中心、劍橋大學(xué)、勞倫斯伯克利國(guó)家實(shí)驗(yàn)室等機(jī)構(gòu)研發(fā)出了一款基于深度學(xué)習(xí)的蛋白質(zhì)預(yù)測(cè)新工具 RoseTTAFold,在預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)上取得了媲美 AlphaFold2 的超高準(zhǔn)確率,而且速度更快、所需要的計(jì)算機(jī)處理能力也較低

這項(xiàng)研究已經(jīng)在 Science 上發(fā)表。


論文鏈接:https://science.sciencemag.org/content/early/2021/07/14/science.abj8754

華盛頓大學(xué)醫(yī)學(xué)院團(tuán)隊(duì)也向社區(qū)開源了該工具,來(lái)自世界各地的科學(xué)家都可以使用它來(lái)構(gòu)建蛋白質(zhì)模型,加速自己的研究。在上傳至 GitHub 后不久,該工具就已被 140 多個(gè)獨(dú)立研究團(tuán)隊(duì)下載。


項(xiàng)目地址 https://github.com/RosettaCommons/RoseTTAFold


具體地,在這項(xiàng)研究中,華盛頓大學(xué)醫(yī)學(xué)院生物化學(xué)系教授、蛋白質(zhì)設(shè)計(jì)研究所所長(zhǎng) David Baker 領(lǐng)導(dǎo)的計(jì)算生物學(xué)家團(tuán)隊(duì)開發(fā)了一款叫做「RoseTTAFold」的軟件工具,該工具利用深度學(xué)習(xí)技術(shù),根據(jù)有限信息準(zhǔn)確、快速地預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu),原本這一工作需要數(shù)年的實(shí)驗(yàn)室研究。

從結(jié)構(gòu)上來(lái)看,RoseTTAFold 是一個(gè)三軌(three-track)神經(jīng)網(wǎng)絡(luò),意味著它可以兼顧蛋白質(zhì)序列的模式、氨基酸如何相互作用以及蛋白質(zhì)可能的三維結(jié)構(gòu)。在這種結(jié)構(gòu)中,一維、二維、三維信息來(lái)回流動(dòng),使得網(wǎng)絡(luò)能夠集中推理蛋白質(zhì)的化學(xué)部分與它的折疊結(jié)構(gòu)。

下圖 A 為具有 1D、2D 和 3D 注意力軌跡(attention track)的 RoseTTAFold 架構(gòu);B 為 CASP14 目標(biāo)上蛋白質(zhì)預(yù)測(cè)方法的平均 TM-score;C 為 CAMEO 中介(medium)和硬(hard)目標(biāo)的盲基準(zhǔn)測(cè)試結(jié)果。


RoseTTAFold 方法的準(zhǔn)確率比目前可用的方法高得多,因而研究者想要測(cè)試是否可以利用它解決以前未解決且具有挑戰(zhàn)性的 MR 問(wèn)題,并改進(jìn)臨界個(gè)案的解決方案。四個(gè)最近的晶體數(shù)據(jù)集,包括牛屬甘氨酸 N - 酰基轉(zhuǎn)移酶(GLYAT)、細(xì)菌氧化還原酶以及細(xì)菌表面層蛋白(SLP)(下圖 A)和來(lái)自真菌平革菌屬金孢子菌屬的分泌蛋白(下圖 B),基于 PDB 蛋白質(zhì)數(shù)據(jù)庫(kù)中可用的模型無(wú)法利用 MR 解決,因此研究者使用 RoseTTAFold 模型進(jìn)行了重新分析:


另一方面,RoseTTAFold 能夠利用一臺(tái)游戲計(jì)算機(jī)在短短 10 分鐘內(nèi)計(jì)算出蛋白質(zhì)結(jié)構(gòu)。研究者使用 RoseTTAFold 計(jì)算出了數(shù)百種新的蛋白質(zhì)結(jié)構(gòu),其中包括許多人類基因組中認(rèn)知甚少的蛋白質(zhì)。此外,他們還生成了與人類健康直接相關(guān)的一些蛋白質(zhì)結(jié)構(gòu),包括與有問(wèn)題的脂質(zhì)代謝、炎癥和癌細(xì)胞生長(zhǎng)相關(guān)的蛋白質(zhì)。他們還表明,RoseTTAFold 可以用于建立復(fù)雜生物的模型,所需時(shí)間只是以前所需時(shí)間的一小部分。

下圖為使用 RoseTTAFold 的蛋白質(zhì)預(yù)測(cè)流程。其中,A 和 B 是從序列信息中預(yù)測(cè)大腸桿菌蛋白復(fù)合物的結(jié)構(gòu);C 表示由 RoseTTAFold 生成的 IL-12R/IL-12 復(fù)合結(jié)構(gòu)符合以前發(fā)表的低溫電子顯微鏡(cryo-EM)密度(EMD-21645)。


論文一作、華盛頓大學(xué)博士后研究員 Minkyung Baek 表示:「我們希望這個(gè)新工具將造福整個(gè)研究領(lǐng)域。」

參考鏈接:
https://newsroom.uw.edu/news/accurate-protein-structure-prediction-now-accessible-all

https://www.nature.com/articles/s41586-021-03819-2


今天兩大團(tuán)隊(duì)同時(shí)發(fā)布蛋白質(zhì)預(yù)測(cè)成果,其中DeepMind如約公布了AlphaFold2的詳細(xì)信息,另一團(tuán)隊(duì)的RoseTTaFold也基于同樣的思想,取得了接近AlphaFold2的效果。
本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
Science重磅:AlphaFold2從830萬(wàn)蛋白質(zhì)中挑出了700種「復(fù)合物」
10分鐘解析蛋白質(zhì)結(jié)構(gòu),免費(fèi)開源硬剛AlphaFold2?業(yè)內(nèi)人士:結(jié)構(gòu)解析新工具有望成主流
Nature子刊:百圖生科宋樂(lè)團(tuán)隊(duì)開發(fā)新型蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)工具,不依賴多序列對(duì)比,效率更高
Science | 面對(duì)alphafold,學(xué)術(shù)界沒有躺平:RoseTTAFold挑戰(zhàn)蛋白復(fù)合物預(yù)測(cè)
Nature|AlphaFold和AI蛋白質(zhì)折疊革命的下一步是什么
用AI創(chuàng)造全新的蛋白質(zhì)結(jié)構(gòu),這款軟件與AlphaFold的區(qū)別在哪里?
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服