本文來自微信公眾號:財健道(ID:ArtofWealthandHealth),作者:姚思妤(《財經(jīng)》實習研究員),編輯:尹莉娜
2017年,AlphaGo擊敗“最強大腦”柯潔,從此退隱江湖。
2018年,AlphaGo的“姊妹”系統(tǒng)AlphaFold亮相第13屆“蛋白質(zhì)結(jié)構(gòu)預測奧運會”CASP,擊敗97名參賽者,一舉奪魁。
兩年后的11月30日,AlphaFold在CASP中再次衛(wèi)冕,因AlphaGo名揚四海的DeepMind公司宣布,AlphaFold在解決生物學界50年難題方面又獲得了新的突破?!癉eepMind遙遙領(lǐng)先?!盋ASP主席John Moult說。
▲AlphaFold在“蛋白質(zhì)結(jié)構(gòu)預測奧運會”CASP中兩次奪冠
本屆CASP中,AlphaFold系統(tǒng)對所有蛋白靶點3D結(jié)構(gòu)預測的中位GDT評分高達92.4分。而達到90分以上就可以認為是與實驗所確定的結(jié)構(gòu)相一致。即便是針對最難解析的蛋白靶點,AlphaFold的中位GDT評分也達到了87.0分。
▲AlphaFold根據(jù)氨基酸序列預測的蛋白結(jié)構(gòu)與實驗手段解析的結(jié)果幾乎完全重合(綠色,實驗結(jié)果;藍色,計算預測結(jié)果;圖片來源:DeepMind Blog)
那么蛋白質(zhì)結(jié)構(gòu)到底有什么用?眾所周知,蛋白質(zhì)是維持生命所必需的分子,帶有蛋白質(zhì)編碼的DNA片段則稱為基因,而蛋白質(zhì)的功能一般取決于其獨特的3D結(jié)構(gòu)。
例如,構(gòu)成人體免疫系統(tǒng)的抗體蛋白是“Y 形”的,形狀類似于獨特的鉤。通過鎖定病毒和細菌,抗體蛋白能夠檢測和標記這些引發(fā)疾病的微生物并最終消滅它們。其他類型的蛋白質(zhì)包括CRISPR和Cas9,它們會像剪刀一樣剪切并粘貼DNA。
預測蛋白質(zhì)的結(jié)構(gòu)可以讓我們了解它在體內(nèi)的作用,幫助診斷和治療由蛋白質(zhì)堆疊錯誤引起的疾病,如阿爾茨海默癥、帕金森癥、亨丁頓舞蹈癥和囊腫性纖維化等。
但是從純粹的基因序列中找出蛋白質(zhì)結(jié)構(gòu)并不容易,其挑戰(zhàn)在于DNA僅包含有關(guān)蛋白質(zhì)構(gòu)建塊序列的信息——氨基酸殘基,它形成了長鏈,預測這些鏈如何折疊成蛋白質(zhì)的復雜3D結(jié)構(gòu)——即“蛋白折疊問題”,是科學家們幾十年來都未曾解決的難題。
▲預測蛋白質(zhì)3D結(jié)構(gòu)模型示意
有學者估計,一個典型的蛋白質(zhì)理論上可以形成103oo個可能構(gòu)象。用什么樣的計算方法,才能找出那個103oo分之一的正確構(gòu)象呢?
北宋科學家沈括曾在《夢溪筆談》中提到,19路圍棋,最多可以放361個子,每一步棋約有10的172次方種下法。而AlphaFold自誕生以來,僅僅在4年間就將運算量級提升遠遠超過了兄弟“AlphaGo”,進化速度之強令人驚嘆。
在過去的50年中,科學家們已經(jīng)能夠使用冷凍電子顯微鏡、核磁共振等技術(shù)來確定實驗室中的蛋白質(zhì)形狀。但是上述方法都需要大量反復的實驗,這將花費數(shù)年的時間和大量的金錢。所以,生物學家將目光轉(zhuǎn)向AI,希望可以解決這個問題。
AlphaFold則借助兩種不同的方法來預測蛋白質(zhì)結(jié)構(gòu)的物理性質(zhì),以此達到高度的準確性。
第一種方法建立在常用的結(jié)構(gòu)生物學中技術(shù)上,用新的蛋白質(zhì)片段反復替換蛋白質(zhì)結(jié)構(gòu)的片段,不斷提高所提出的蛋白質(zhì)結(jié)構(gòu)的得分;第二種方法則通過梯度下降優(yōu)化得分, 該技術(shù)應用于整個蛋白質(zhì)鏈,而不是在組裝之前必須單獨折疊的碎片,從而降低了預測過程的復雜性。
藥物靶點是指藥物在體內(nèi)的作用結(jié)合位點,識別新的有效的藥物靶點是新藥開發(fā)的重中之重。然而,發(fā)現(xiàn)和驗證大量分子靶標所涉及的工作極大增加了藥物開發(fā)的負擔。
以熱門的腫瘤新藥研發(fā)為例,人體所攜帶的癌癥相關(guān)基因近500個,會產(chǎn)生將近1000萬個基因的變異,涉及10多條信號通路和60多個藥物靶點,而且這個數(shù)字還將不斷擴大。
AI則可以很好地解決這個問題,通過實時抓取和動態(tài)學習更新,盡量窮盡腫瘤靶點的知識庫,提高這一環(huán)節(jié)的效率。幫助生物學家更早、更快地找到更佳的藥物作用靶點,減少研發(fā)時間和所需臨床試驗的數(shù)量。
曾在瑞士諾華制藥工作過的美國史賽克醫(yī)療器械全國銷售經(jīng)理金宏山對《財健道》說,蛋白質(zhì)結(jié)構(gòu)預測工作,已經(jīng)開拓了“已知藥物靶點正向篩選藥物”和“已知藥物反向篩選靶點”兩個領(lǐng)域。AlphaFold對蛋白質(zhì)結(jié)構(gòu)的預測則開啟AI藥物發(fā)現(xiàn)的第三大領(lǐng)域,即“發(fā)現(xiàn)新靶點,解析新靶點”。
AlphaFold不見得完全取代冷凍電子顯微鏡等其它實驗手段,但是DeepMind的研究人員表示,這一令人興奮的結(jié)果表明,生物學家們可以將計算結(jié)構(gòu)預測作為科學研究的核心工具之一。這一手段對于特定類型的蛋白來說可能尤為便利,例如膜蛋白一直非常難于結(jié)晶,因此很難用實驗手段獲得它們的結(jié)構(gòu)。
而對于從事計算和機器學習研究的DeepMind團隊來說,AlphaFold的表現(xiàn)證明了AI在輔助基礎(chǔ)科學發(fā)現(xiàn)方面的驚人潛力。該團隊在公司發(fā)布的博文中表示,他們相信,AI將成為人類拓展科學知識前沿最有力的工具之一!
參考文獻:
【1】《“阿爾法狗”親兄弟AlphaFold破解預測蛋白質(zhì)結(jié)構(gòu)50年難題》,騰訊新聞
【2】《AI引發(fā)制藥革命?26億美元的新藥成本魔咒就要被打破了》,億歐大健康
【3】《AlphaGo“兄弟”AlphaFold出世,DeepMind再創(chuàng)記錄》,CSDN
【4】《解決生物學50年來的重大挑戰(zhàn)!生物界“AlphaGo”精準預測蛋白質(zhì)結(jié)構(gòu)》,藥明康德
【5】《DeepMind開源AlphaFold,蛋白質(zhì)預測模型登上Nature》,CSDN
本文來自微信公眾號:財健道(ID:ArtofWealthandHealth),原標題《“AlphaGo”進化版來了!精準預測蛋白質(zhì)結(jié)構(gòu),“發(fā)現(xiàn)新靶點,解析新靶點”!》,作者:姚思妤(《財經(jīng)》實習研究員),編輯:尹莉娜