隨著計(jì)算能力的發(fā)展和海量數(shù)據(jù)的產(chǎn)生和積累,人工智能(Artificial Intelligence, AI)技術(shù)近兩年內(nèi)在生物醫(yī)藥領(lǐng)域,從科研到應(yīng)用都取得了巨大的進(jìn)展。特別是以卷積神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)為核心算法的深度學(xué)習(xí)技術(shù),更是深刻重塑了生物醫(yī)學(xué)領(lǐng)域的現(xiàn)狀和未來。
目前,人工智能主要指深度學(xué)習(xí)技術(shù)(deep learning),其核心算法為卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks, RNN)。其主要原理是輸入高質(zhì)量的標(biāo)注后的數(shù)據(jù),經(jīng)過AI系統(tǒng)多層次的訓(xùn)練,最終輸出分類結(jié)果,用于新場景的預(yù)測(圖1)。由于輸入數(shù)據(jù)量大和訓(xùn)練層次深等特點(diǎn),AI在多個領(lǐng)域表現(xiàn)出準(zhǔn)確率高的優(yōu)勢。
下文主要是摘錄了近年來人工智能技術(shù)在生物醫(yī)學(xué)方面的研究進(jìn)展,包括人工智能在疾病診斷、新藥研發(fā)以及基因測序領(lǐng)域的應(yīng)用進(jìn)展。
一. 人工智能輔助疾病診斷
通過采用卷積神經(jīng)網(wǎng)絡(luò)算法對大量的臨床影像數(shù)據(jù)進(jìn)行學(xué)習(xí),訓(xùn)練診斷模型,可以實(shí)現(xiàn)對患者的高準(zhǔn)確率診斷,起到輔助臨床醫(yī)生的作用。目前報(bào)道的成功案例包括糖尿病視網(wǎng)膜病變[1],黃斑變性和糖尿病性黃斑水腫等致盲眼病[2](圖2),皮膚癌[3],乳腺癌(圖3)以及宮頸癌[4]等多種疾病的精確診斷。同時,研究表明基于圖像學(xué)習(xí)的診斷模型雖然具有疾病特異性,但仍然表現(xiàn)出較好的擴(kuò)展性。綜合看,此類模型的構(gòu)建一般需要大量高質(zhì)量的醫(yī)學(xué)數(shù)據(jù)的積累,同時需要臨床經(jīng)驗(yàn)豐富的臨床醫(yī)生對影像數(shù)據(jù)進(jìn)行標(biāo)注。目前,由于深度學(xué)習(xí)技術(shù)在圖像識別領(lǐng)域的良好應(yīng)用性,國內(nèi)出現(xiàn)了大量的基于醫(yī)療影像數(shù)據(jù)的AI公司,通過AI訓(xùn)練和識別大量的影像數(shù)據(jù),以實(shí)現(xiàn)臨床輔助診斷的目標(biāo)。
圖2:基于AI開發(fā)的黃斑變性和糖尿病性黃斑水腫診療系統(tǒng)CC-Cruiser
圖3:與現(xiàn)有的計(jì)算機(jī)分析方案(中)相比,新型人工智能(右)能更準(zhǔn)確地找到腫瘤(圖片來源:谷歌)
二. 人工智能輔助新藥研發(fā)
新藥研發(fā)涉及到從上游到下游的幾個環(huán)節(jié):藥物靶標(biāo)的確定,先導(dǎo)化合物的篩選,先導(dǎo)化合物的優(yōu)化,以及最終的臨床實(shí)驗(yàn)。其具有研發(fā)周期長、資金投入大、失敗率高等特定,一直是制藥界的痛點(diǎn)。之前,計(jì)算機(jī)輔助藥物設(shè)計(jì)(computer aided drug design,CADD)的引入雖然給制藥業(yè)帶來了一些成功的案例,但依然沒有根本的改觀。而人工智能技術(shù)的崛起,則為新藥研發(fā)帶來了新的曙光[5]。自2017年以來,人工智能在制藥領(lǐng)域的應(yīng)用可謂如火如荼,國際制藥巨頭紛紛部署自己的AI系統(tǒng),用于提高新藥的研發(fā)效率,如Merck,Novatis, Roche, Pfizer, Johnson & Johnsone等。國內(nèi)的晶泰科技 (XtalPi) 是一家以計(jì)算驅(qū)動創(chuàng)新的藥物研發(fā)初創(chuàng)公司,其基于人工智能與云計(jì)算等技術(shù),結(jié)合計(jì)算物理、量子化學(xué)、分子動力學(xué)等,旨在提高藥物發(fā)現(xiàn)與發(fā)展這一關(guān)鍵環(huán)節(jié)的效率與成功率,從而降低研發(fā)成本。
三. 人工智能輔助基因數(shù)據(jù)分析
二代測序技術(shù)產(chǎn)生了大量的測序數(shù)據(jù),AI在基因大數(shù)據(jù)的分析上亦表現(xiàn)出良好的應(yīng)用趨勢。谷歌子公司Deep mind的科學(xué)家發(fā)表了一篇論文,提出一個名為DeepVariant[6]的檢測工具,使用深度神經(jīng)學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)來檢查基因組上的單堿基突變(SNP)和小的插入缺失(Indel),其準(zhǔn)確性超越了當(dāng)前主流的生物信息學(xué)軟件GATK。傳統(tǒng)的基因組關(guān)聯(lián)分析(GWAS)大多只能檢測單個點(diǎn)突變(SNP)與所研究疾病的關(guān)系,而DeepWAS[7],這一新提出的框架則能夠根據(jù)功能單元,選擇出一組SNP的集合,來更加綜合地研究致病的基因突變,并能直接尋找調(diào)控區(qū)域的基因突變。在一項(xiàng)針對抑郁癥的研究中,使用DeepWAS框架的研究發(fā)現(xiàn)了一個新的控制抑郁癥的主要基因MEF2C。此外,人工智能分析基因組數(shù)據(jù)還可以實(shí)現(xiàn)對多種腫瘤的精確診斷。
結(jié)語:
目前,人工智能在醫(yī)藥領(lǐng)域的科研和產(chǎn)業(yè)發(fā)展均表現(xiàn)的可圈可點(diǎn)。毫無疑問,人工智能和生物醫(yī)藥領(lǐng)域的融合必將不斷的深化和廣化,更多的成功案例將不斷涌現(xiàn)。但是也可以預(yù)見,AI應(yīng)用的落地,仍需面對和解決許多問題,不僅僅是技術(shù)問題,還有倫理問題和社會問題。
參考文獻(xiàn)