国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開APP
userphoto
未登錄

開通VIP,暢享免費(fèi)電子書等14項超值服

開通VIP
Nat. Biotechnol.| 生成式AI會怎么改變藥物發(fā)現(xiàn)領(lǐng)域?

今天為大家介紹的是來自Jean-Philippe Vert的一篇討論生成式AI對藥物發(fā)現(xiàn)領(lǐng)域的影響的論文。在ChatGPT發(fā)布僅僅幾個月之后,大型語言模型(LLMs)和生成式人工智能(AI)對藝術(shù)、營銷、新聞、文案、法律和軟件工程等領(lǐng)域的影響已經(jīng)開始顯現(xiàn)。這些技術(shù)利用深度學(xué)習(xí)模型在大量數(shù)據(jù)上訓(xùn)練,能夠生成新的文本或圖像。雖然它們只是被訓(xùn)練來捕捉訓(xùn)練數(shù)據(jù)中的統(tǒng)計規(guī)律,但一旦訓(xùn)練完成,它們可以以令人信服的方式模仿人類語言,生成逼真的圖像、聲音或軟件,甚至解決涉及更高認(rèn)知功能的推理等任務(wù),這一能力令世人驚訝。因此,它們也有望在科學(xué)家和工程師理解生物學(xué)、發(fā)現(xiàn)和開發(fā)新療法方面引發(fā)顛覆性變革。

首先,現(xiàn)有的大型語言模型已經(jīng)成為非凡的生產(chǎn)力工具,使數(shù)據(jù)科學(xué)家和工程師,包括從事醫(yī)學(xué)研究和藥物發(fā)現(xiàn)的人員,能夠更高效地完成工作。像GitHub Copilot和ChatGPT這樣的工具正迅速被軟件工程團(tuán)隊采用,以更快地編寫高質(zhì)量的代碼,而數(shù)據(jù)科學(xué)家也越來越多地借助基于人工智能的助手來生成圖表、起草報告和演示文稿。目前的大型語言模型還可以幫助處理更技術(shù)性和復(fù)雜的任務(wù),例如解決跨多個數(shù)據(jù)中心的數(shù)據(jù)協(xié)調(diào)問題,該問題在很大程度上依賴人工數(shù)據(jù)處理。特別是,處理異構(gòu)多隊列數(shù)據(jù)集的越來越流行的方法之一是使用生成式人工智能合成屬于缺失模態(tài)或領(lǐng)域的樣本,將數(shù)據(jù)協(xié)調(diào)視為風(fēng)格轉(zhuǎn)移問題。通過自動化和簡化與整合來自異構(gòu)數(shù)據(jù)源的技術(shù)流程,大型語言模型和生成式人工智能模型將促進(jìn)協(xié)作數(shù)據(jù)網(wǎng)絡(luò)的增長,使得人工智能模型能夠利用前所未有的大規(guī)模數(shù)據(jù)集。此外,除了協(xié)調(diào),合成數(shù)據(jù)生成還可以解決在具有差分隱私保證的情況下匿名化敏感數(shù)據(jù)的問題,從而為在每個參與合作的伙伴內(nèi)保護(hù)數(shù)據(jù)隱私的同時,提供了一種有前景的技術(shù)解決方案來推動協(xié)作數(shù)據(jù)網(wǎng)絡(luò)的發(fā)展。

其次,深度生成模型不僅可以生成文本和圖像,還可以生成具有所需結(jié)構(gòu)或功能的新型小分子、核酸序列和蛋白質(zhì)。在藥物發(fā)現(xiàn)領(lǐng)域,這些模型被越來越多地用于快速探索候選治療藥物的廣泛空間,并在計算機(jī)模擬中對其進(jìn)行優(yōu)化,以適應(yīng)特定的靶點或功能。例如,Shanehsazzadeh等人使用深度生成模型生成曲妥珠單抗(trastuzumab)的變體,曲妥珠單抗是一種針對人表皮生長因子受體2(HER2)的單克隆抗體,用于治療乳腺癌和胃癌,并通過實驗證實了三種由人工智能生成的變體與曲妥珠單抗具有較低的序列相似性,但與HER2的結(jié)合更好。除了設(shè)計治療藥物,基于人工智能的生物數(shù)據(jù)生成模型還被用于其他用途,例如準(zhǔn)確的長DNA讀取測序,以降低DNA測序的成本并提高準(zhǔn)確性;或者在單細(xì)胞基因組學(xué)模態(tài)之間進(jìn)行轉(zhuǎn)換,以允許對組織內(nèi)組學(xué)多模態(tài)多樣性的探索。

第三,LLMs和生成型AI模型可以增強(qiáng)現(xiàn)有的AI模型,并為異構(gòu)數(shù)據(jù)和概念的無縫集成提供令人興奮的框架。事實上,大多數(shù)基于深度學(xué)習(xí)的生成模型,包括LLMs,具有一個顯著的特點,即它們以統(tǒng)一的方式表示任何類型的數(shù)據(jù),即一列數(shù)字,常常被稱為數(shù)據(jù)的特征向量。例如,為了回答一個問題,ChatGPT首先將其從文本轉(zhuǎn)換為向量,然后根據(jù)該向量生成答案。

現(xiàn)代生成型AI系統(tǒng)(如用于文本數(shù)據(jù)的transformer或用于小分子的圖神經(jīng)網(wǎng)絡(luò))學(xué)習(xí)到的表示具有非凡的能力,能夠捕捉生成有意義的文本或相關(guān)分子所需的信息,但它們也可以用于其他目的。特別是通過將復(fù)雜數(shù)據(jù)表示為向量的能力,LLMs和生成型AI模型可以作為關(guān)于數(shù)據(jù)的強(qiáng)大先驗知識的來源,可以用于改進(jìn)其他機(jī)器學(xué)習(xí)系統(tǒng)的性能。在神經(jīng)符號表示學(xué)習(xí)領(lǐng)域,這已經(jīng)在發(fā)生著,通過深度表示學(xué)習(xí)從編碼有關(guān)生物學(xué)的大量數(shù)據(jù)的知識圖中學(xué)習(xí)基因或疾病的表示,然后使用這些學(xué)習(xí)到的表示來預(yù)測基因的特性或推斷基因-疾病關(guān)聯(lián)。作者預(yù)計將會出現(xiàn)更多應(yīng)用這些想法來改進(jìn)從患者數(shù)據(jù)中進(jìn)行診斷、預(yù)后或治療反應(yīng)預(yù)測的AI模型的情況。大多數(shù)患者數(shù)據(jù)具有非常高的維度(想象一下用于表示醫(yī)學(xué)影像、分子特征或電子健康記錄的數(shù)百萬個描述符),從這些數(shù)據(jù)中訓(xùn)練準(zhǔn)確的AI模型必然涉及對模型空間進(jìn)行先驗知識約束。LLMs通過捕捉生物學(xué)概念的復(fù)雜和上下文相關(guān)的表示,為訓(xùn)練AI模型提供了指導(dǎo),使其更準(zhǔn)確和穩(wěn)健。如何準(zhǔn)確實施這個想法以及它的有效性在很大程度上仍然是開放的研究問題,但將LLM學(xué)習(xí)到的基因或疾病表示轉(zhuǎn)移給基于組學(xué)的機(jī)器學(xué)習(xí)模型等簡單方法是一個有希望的方向。

第四,令人心動的是,LLMs的潛力遠(yuǎn)遠(yuǎn)超出了上述復(fù)雜的技術(shù)任務(wù)。它們能夠很快就可以成為科學(xué)家強(qiáng)大的助手,甚至成為真正的科學(xué)家嗎?憑借其能夠存儲從大量數(shù)據(jù)中提取的知識,包括科學(xué)文獻(xiàn)和內(nèi)部研究文件,LLMs可能能夠像科學(xué)家一樣進(jìn)行推理和生成科學(xué)假設(shè)和發(fā)現(xiàn)。一旦LLMs變得更加復(fù)雜,有希望能夠向它們提出相關(guān)的研究問題,例如:“對于這個具有醫(yī)學(xué)需求尚未滿足的患者群體,有哪些好的新藥物可用?”然而,現(xiàn)有的LLMs還遠(yuǎn)遠(yuǎn)不夠成熟來完成這樣的任務(wù)。盡管在許多基準(zhǔn)測試上取得了有希望的結(jié)果,但科學(xué)領(lǐng)域的LLM——Galactica,在線上僅存活了三天。雖然ChatGPT在網(wǎng)絡(luò)上迅速成為一種流行工具,但像所有LLMs一樣,它以“產(chǎn)生幻覺”的傾向而聲名狼藉——即,創(chuàng)造出不基于數(shù)據(jù)或邏輯推理的事實。這是科學(xué)研究中的一個重大問題,關(guān)于未來是否能夠解決這個問題,AI界存在激烈的爭論。為了解決這個問題,許多工作正在進(jìn)行,開發(fā)所謂的增強(qiáng)型語言模型(ALMs),將LLMs的靈活性和規(guī)模與其他機(jī)制結(jié)合起來以提高它們的推理和可靠性。在科學(xué)領(lǐng)域中,特別感興趣的一種機(jī)制是賦予LLM實時查詢和檢索相關(guān)信息的能力,從數(shù)據(jù)庫中獲取實時信息,這有助于它生成基于數(shù)據(jù)庫中真實信息的文本。

ChatGPT代表了人工智能在顛覆人類并希望產(chǎn)生積極影響方面的里程碑時刻。盡管技術(shù)專家、倫理學(xué)家和監(jiān)管機(jī)構(gòu)正在忙于討論類似LLM的技術(shù)的持久影響,但越來越明顯的是,藥物的發(fā)現(xiàn)和開發(fā)將發(fā)生變革。通過自動化耗時任務(wù)、生成新的分子和假設(shè)、提升現(xiàn)有預(yù)測模型的性能并充當(dāng)強(qiáng)化的研究助手,現(xiàn)有的生成式人工智能模型已經(jīng)證明了它們的變革潛力。在未來,更先進(jìn)的LLM很可能會進(jìn)一步改變我們在藥物發(fā)現(xiàn)和醫(yī)學(xué)研究中使用人工智能的方式。然而,與其他領(lǐng)域一樣,LLM也引發(fā)了許多倫理、法律和安全問題。除了上述提到的誤導(dǎo)風(fēng)險,如果模型產(chǎn)生幻覺,部署這些解決方案在制藥和醫(yī)療領(lǐng)域需要我們對其他風(fēng)險保持謹(jǐn)慎,比如與私人信息泄露相關(guān)的信息風(fēng)險,以及如果LLM強(qiáng)化了數(shù)據(jù)中存在的偏見,可能會導(dǎo)致歧視問題。雖然目前沒有簡單的解決方案來減輕這些風(fēng)險,但我們至少應(yīng)該對模型的構(gòu)建和驗證過程進(jìn)行全面透明,并使用模型卡片等模板進(jìn)行系統(tǒng)性的報告,以確??茖W(xué)研究基于堅實的基礎(chǔ),并使醫(yī)學(xué)進(jìn)步造福于所有人。

參考資料

Vert, JP. How will generative AI disrupt data science in drug discovery?. Nat Biotechnol (2023). 

https://doi.org/10.1038/s41587-023-01789-6

本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊舉報
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
「AI版YC」創(chuàng)始人:大模型正在改變商業(yè)模式,原生用戶將顛覆市場
ChatGTP全景圖 | 背景 技術(shù)篇
Palantir演示軍隊如何利用ChatGPT進(jìn)行作戰(zhàn)
談?wù)凣PT 模型背后以數(shù)據(jù)為中心的 AI
?GPT充當(dāng)大腦,指揮多個模型協(xié)作完成各類任務(wù),通用系統(tǒng)AutoML-GPT來了
ChatGPT之后,下一代大型語言模型在哪里?
更多類似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長圖 關(guān)注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服