在全球范圍內(nèi),人工智能的應(yīng)用已經(jīng)非常普及。根據(jù) Statista 預(yù)計(jì),人工智能市場(chǎng)增速將保持年均50.7%的增速增長(zhǎng),到 2025 年,全球人工智能市場(chǎng)規(guī)模將高達(dá)369億美元,隨著人工智能在圖像(包括人臉)識(shí)別、語音識(shí)別、工業(yè)/制造業(yè)大腦、預(yù)測(cè)分析、自動(dòng)化(包括自動(dòng)駕駛)等方面的能力不斷提升,數(shù)字經(jīng)濟(jì)時(shí)代的發(fā)展與人工智能應(yīng)用的推進(jìn)已經(jīng)密不可分,零售業(yè)、醫(yī)療健康、金融行業(yè)、交通行業(yè)、教育行業(yè)、商業(yè)服務(wù)業(yè)、安全行業(yè)、農(nóng)業(yè)等行業(yè)都將被人工智能深度滲透。但對(duì)于整個(gè)人工智能產(chǎn)業(yè)來說,在行業(yè)領(lǐng)域的高度滲透性并非是全部,人工智能發(fā)展存在著其獨(dú)特并持續(xù)動(dòng)態(tài)變化的發(fā)展現(xiàn)狀。上個(gè)月,阿里云研究中心聯(lián)合埃森哲發(fā)布了《中國(guó)企業(yè)2020》系列報(bào)告之《人工智能紅利滲透與爆發(fā)》,從投資、產(chǎn)業(yè)、技術(shù)等角度闡述人工智能究竟是降溫還是升溫。下面,本文重點(diǎn)解讀該報(bào)告的技術(shù)趨勢(shì)部分,看從實(shí)驗(yàn)AI到產(chǎn)業(yè)AI存在哪些差距。
一、無監(jiān)督學(xué)習(xí)正在突破通用智能
過去十年,機(jī)器學(xué)習(xí)在圖像識(shí)別、自動(dòng)駕駛汽車和圍棋等領(lǐng)域取得了前所未有的進(jìn)步。這些成功在很大程度上是監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)來實(shí)現(xiàn)的,這兩種方法都要求由人設(shè)計(jì)訓(xùn)練信號(hào)并傳遞給計(jì)算機(jī):在監(jiān)督學(xué)習(xí)的情況下,這些是“目標(biāo)”(例如圖像的正確標(biāo)簽);在強(qiáng)化學(xué)習(xí)的情況下,它們是成功行為的“獎(jiǎng)勵(lì)”(例如在Atari游戲中獲得高分)。因此,強(qiáng)化學(xué)習(xí)也可以被認(rèn)為是一種監(jiān)督學(xué)習(xí),這兩者構(gòu)成了當(dāng)前機(jī)器學(xué)習(xí)的主要學(xué)習(xí)方式,也為機(jī)器學(xué)習(xí)構(gòu)建了一個(gè)極限:人類訓(xùn)練師和數(shù)據(jù)量決定了機(jī)器學(xué)習(xí)的深度和精度。
很顯然,機(jī)器學(xué)習(xí)如今遇到了瓶頸,無論是人類訓(xùn)練師還是數(shù)據(jù)量,都難以支撐機(jī)器學(xué)習(xí)更進(jìn)一步地發(fā)展出高水平的人工智能,更不用提通用智能,人類和數(shù)據(jù)成為了通用智能發(fā)展的阻礙,無監(jiān)督學(xué)習(xí)則是這一難題當(dāng)前唯一的解決途徑。
無監(jiān)督學(xué)習(xí)是一種旨在通過獎(jiǎng)勵(lì)智能體(即計(jì)算機(jī)程序)來創(chuàng)建自主智能以便在不考慮特定任務(wù)的情況下學(xué)習(xí)其觀察到的數(shù)據(jù)的范式。換句話說,智能體是為了學(xué)習(xí)而學(xué)習(xí)。無監(jiān)督學(xué)習(xí)的一個(gè)關(guān)鍵動(dòng)機(jī)是,雖然傳遞給學(xué)習(xí)算法的數(shù)據(jù)擁有很豐富的內(nèi)部結(jié)構(gòu)(如圖像、視頻和文本),但用于訓(xùn)練的目標(biāo)和獎(jiǎng)勵(lì)通常都非常稀疏(例如,標(biāo)簽「狗」指的是尤其多變的物種,標(biāo)簽「0」或「1」表示游戲中的「失敗」或「成功」)。這表明算法學(xué)到的大部分內(nèi)容必須包括對(duì)數(shù)據(jù)本身的理解,而不是將這種理解應(yīng)用于特定任務(wù)。
無監(jiān)督學(xué)習(xí)研究的主要目標(biāo)是預(yù)訓(xùn)練一個(gè)模型(稱作“識(shí)別”或“編碼”)網(wǎng)絡(luò),供其他任務(wù)使用。編碼特征通常能夠用到分類任務(wù)中:例如在ImageNet上訓(xùn)練會(huì)表現(xiàn)出很好的結(jié)果,這與監(jiān)督模型非常接近。迄今為止,監(jiān)督模型總是比無監(jiān)督的預(yù)訓(xùn)練模型表現(xiàn)的要好。其主要原因是監(jiān)督模型對(duì)數(shù)據(jù)集的特性編碼的更好。但如果模型運(yùn)用到其他任務(wù),監(jiān)督工作是可以減少的。在這方面,希望達(dá)到的目標(biāo)是無監(jiān)督訓(xùn)練可以提供更一般的特征,用于學(xué)習(xí)并實(shí)現(xiàn)其它任務(wù)。
目前,無監(jiān)督學(xué)習(xí)主要有兩類方法。第一類的典型代表是 BERT 和變分自編碼器(VAE),它們使用深度神經(jīng)網(wǎng)絡(luò)重建輸入。但這類方法無法很好地處理圖像問題,因?yàn)榫W(wǎng)絡(luò)最深層需要編碼圖像的細(xì)節(jié);另一類方法由 Becker 和 Hinton 于 1992 年提出,即對(duì)一個(gè)深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練兩個(gè)副本,這樣在二者的輸入是同一圖像的兩個(gè)不同剪裁版本時(shí),它們可以生成具備高度互信息的輸出向量。這類方法的設(shè)計(jì)初衷是,使表征脫離輸入的不相關(guān)細(xì)節(jié)。由于Becker 和 Hinton 使用的優(yōu)化互信息方法存在一定缺陷,因此后來 Pacannaro 和 Hinton 用一個(gè)判別式目標(biāo)替換了它,在該目標(biāo)中一個(gè)向量表征必須在多個(gè)向量表征中選擇對(duì)應(yīng)的一個(gè)。
隨著硬件的加速,近期表征對(duì)比學(xué)習(xí)變得流行,并被證明非常高效,但它仍然存在一個(gè)主要缺陷:要想學(xué)習(xí)具備 N bits 互信息的表征向量對(duì),我們需要對(duì)比正確的對(duì)應(yīng)向量和 2 N 個(gè)不正確的向量。2020年2月,Hinton和其團(tuán)隊(duì)推出的 SimCLR 無監(jiān)督方法,無需類標(biāo)簽即可讓 AI 學(xué)會(huì)視覺表示,而且可以達(dá)到有監(jiān)督學(xué)習(xí)的準(zhǔn)確度。論文作者表示,經(jīng)過 ImageNet 上 1% 圖片標(biāo)簽的微調(diào),SimCLR 即可達(dá)到 85.8%的 Top-5 精度——在只用 AlexNet 1% 的標(biāo)簽的情況下性能超越后者。
二、實(shí)時(shí)強(qiáng)化學(xué)習(xí)受到追捧
機(jī)器學(xué)習(xí)被越來越廣泛的進(jìn)行應(yīng)用,不僅是使用靜態(tài)模型進(jìn)行預(yù)測(cè),還作為一些涉及動(dòng)態(tài)實(shí)時(shí)決策的反饋環(huán)路的重要組件。這些應(yīng)用提出了一組新的需求,單獨(dú)地實(shí)現(xiàn)這些需求并沒有什么難度,但是它們的組合卻給現(xiàn)有的分布式執(zhí)行框架帶來了挑戰(zhàn):高吞吐量時(shí)的毫秒級(jí)延遲計(jì)算,在不同資源集上的任意任務(wù)圖的自適應(yīng)構(gòu)造及執(zhí)行異構(gòu)核。比如用戶在瀏覽網(wǎng)站時(shí),可以根據(jù)用戶歷史行為數(shù)據(jù)來推送新聞。而一些新的涉及動(dòng)態(tài)實(shí)施決策的業(yè)務(wù),比如具備時(shí)效性的熱點(diǎn)新聞,或是用戶想要看點(diǎn)新東西,這就需要用一種新的算法來實(shí)現(xiàn),即實(shí)時(shí)機(jī)器學(xué)習(xí)Real-Time Machine Learning。
以頭條的核心技術(shù)“個(gè)性化推薦算法”為例,其核心原理就是根據(jù)用戶對(duì)文章的歷史行為數(shù)據(jù)反饋,進(jìn)行統(tǒng)計(jì)挖掘和判斷。比如具有相同偏好的三個(gè)用戶,分別選擇了自己喜歡的文章,得到最高票數(shù)的文章就會(huì)被推薦給被系統(tǒng)打上同一屬性標(biāo)簽的第四個(gè)人……以此類推。不難發(fā)現(xiàn),傳統(tǒng)機(jī)器學(xué)習(xí)算法的成功,依賴于對(duì)用戶的“知根知底”,需要用戶不斷開放自己的私人領(lǐng)地。而實(shí)時(shí)機(jī)器學(xué)習(xí),更擅長(zhǎng)對(duì)用戶的當(dāng)下需求體察入微,讓用戶在保持隱私安全感的同時(shí),獲得如沐春風(fēng)的瀏覽體驗(yàn)。
實(shí)時(shí)機(jī)器學(xué)習(xí)是一項(xiàng)前沿的人工智能研究項(xiàng)目,2017年才由加州大學(xué)伯克利分校的研究團(tuán)隊(duì)發(fā)布了《Real-Time Machine Learning: The Missing Pieces》論文給出了實(shí)時(shí)機(jī)器學(xué)習(xí)應(yīng)用運(yùn)行于分布式系統(tǒng)的七大要求,并提出了一種能夠滿足這些要求的解決方案。實(shí)時(shí)強(qiáng)化學(xué)習(xí)是實(shí)時(shí)機(jī)器學(xué)習(xí)的一個(gè)分支,實(shí)時(shí)強(qiáng)化學(xué)習(xí)能夠?yàn)橥扑]、營(yíng)銷系統(tǒng)帶來強(qiáng)大的技術(shù)升級(jí),用戶反饋分鐘級(jí)回流回來,在線更新模型。實(shí)時(shí)強(qiáng)化學(xué)習(xí)的應(yīng)用領(lǐng)域非常廣泛,比如說,新聞網(wǎng)站或是電商促銷,每天都有新資訊、新促銷,用戶還在不斷創(chuàng)造內(nèi)容,可供推薦的內(nèi)容既在不斷累積,也在不斷變化。模型的準(zhǔn)確率來自于對(duì)數(shù)據(jù)的學(xué)習(xí),數(shù)據(jù)變了,自然模型就要變,否則給出的智能推薦,提供的AI服務(wù),用戶肯定不滿意,但如果現(xiàn)在還只是10-30分鐘做一次的模型更新,未來能做到1分鐘之內(nèi)就更新一次,用戶的滿意度將獲得極大的提高。
隨著實(shí)時(shí)強(qiáng)化學(xué)習(xí)的逐漸成熟,未來商業(yè)領(lǐng)域能夠做出效益最高的模型,效率最好的架構(gòu),而且,以后這些模型的生成都是機(jī)器自動(dòng)實(shí)現(xiàn)的,不需要人工干預(yù),當(dāng)然,現(xiàn)在的人工智能還都只是“數(shù)據(jù)智能”,遠(yuǎn)未達(dá)到“知識(shí)智能”的階段,機(jī)器還做不了基于知識(shí)推理(即缺乏常識(shí)),這是做人工智能的人未來幾年要突破的方向。
三、對(duì)實(shí)時(shí)決策的需求推動(dòng)邊緣人工智能發(fā)展
近年來,隨著萬物互聯(lián)時(shí)代的到來和無線網(wǎng)絡(luò)的普及,網(wǎng)絡(luò)邊緣的設(shè)備數(shù)量和其產(chǎn)生的數(shù)據(jù)量都急劇增長(zhǎng)。根據(jù)Cisco云指數(shù)的預(yù)測(cè),到2021年,全球范圍內(nèi)將有超過500億的終端設(shè)備,這些設(shè)備每年產(chǎn)生的數(shù)據(jù)總量將達(dá)到847 ZB,其中約有10%的數(shù)據(jù)需要進(jìn)行計(jì)算處理。另外,智能終端設(shè)備已成為人們生活的一部分,人們對(duì)服務(wù)質(zhì)量的要求有了進(jìn)一步提升。在這種情況下,以云計(jì)算為代表的集中式處理模式,由于實(shí)時(shí)性不夠、帶寬不足等問題,將無法高效地處理邊緣設(shè)備產(chǎn)生的數(shù)據(jù),無法滿足人們對(duì)服務(wù)質(zhì)量的需求,于是邊緣計(jì)算模型應(yīng)運(yùn)而生。
邊緣計(jì)算是部署在邊緣終端設(shè)備和云計(jì)算中心之間的一種新型計(jì)算模型。邊緣計(jì)算的資源是指從數(shù)據(jù)源到云計(jì)算中心路徑上的任意計(jì)算和網(wǎng)絡(luò)資源,是一個(gè)連續(xù)系統(tǒng)。在該模式下,邊緣設(shè)備上亦有計(jì)算。邊緣計(jì)算具有幾個(gè)明顯的優(yōu)點(diǎn):首先,邊緣設(shè)備處理了部分產(chǎn)生的臨時(shí)數(shù)據(jù),不再需要將全部數(shù)據(jù)上傳至云端,只需要傳輸有價(jià)值的數(shù)據(jù),這極大地減輕了網(wǎng)絡(luò)帶寬的壓力,且減少了對(duì)計(jì)算存儲(chǔ)資源的需求。其次,在靠近數(shù)據(jù)源端進(jìn)行數(shù)據(jù)處理,能夠大大地減少系統(tǒng)時(shí)延,提高服務(wù)的響應(yīng)時(shí)間。
另一方面,人工智能的出現(xiàn),具有對(duì)數(shù)據(jù)實(shí)現(xiàn)加速處理的特定,已成功應(yīng)用于目標(biāo)識(shí)別、智能搜索、語言處理、智能交通等領(lǐng)域。然而,由于人工智能方法包含大量的計(jì)算,當(dāng)前人工智能大部分計(jì)算任務(wù)部署在云計(jì)算中心等大規(guī)模計(jì)算資源集中的平臺(tái)上,這極大地限制了人工智能帶給人們的便利。為此,邊緣智能應(yīng)聲而出。邊緣智能是指終端智能,它是融合網(wǎng)絡(luò)、計(jì)算、存儲(chǔ)、應(yīng)用核心能力的開放平臺(tái),并提供邊緣智能服務(wù),滿足行業(yè)數(shù)字化在敏捷連接、實(shí)時(shí)業(yè)務(wù)、數(shù)據(jù)優(yōu)化、應(yīng)用智能、安全與隱私保護(hù)等方面的關(guān)鍵需求。將智能部署在邊緣設(shè)備上,可以使智能更貼近用戶,更快、更好為用戶地提供智能服務(wù)。
邊緣智能不是邊緣計(jì)算和人工智能的簡(jiǎn)單結(jié)合,雖然目前國(guó)際上尚未建立邊緣人工智能的標(biāo)準(zhǔn)架構(gòu)和統(tǒng)一算法,但各大廠商已經(jīng)開始在相關(guān)領(lǐng)域進(jìn)行探索。谷歌、亞馬遜和微軟等傳統(tǒng)云服務(wù)提供商推出了邊緣人工智能服務(wù)平臺(tái),通過在終端設(shè)備本地運(yùn)行預(yù)先訓(xùn)練好的模型進(jìn)行ML(Machine Learning,機(jī)器學(xué)習(xí))推斷,將智能服務(wù)推向邊緣。此外,市場(chǎng)上已經(jīng)出現(xiàn)多種邊緣人工智能芯片,如谷歌edge TPU、英特爾Nervana NNP、華為Ascend 910和Ascend 310等。
另外,還有很多企業(yè)都試圖在智能手機(jī)、汽車甚至可穿戴設(shè)備等邊緣設(shè)備上運(yùn)行人工智能算法,而不是跟中心云平臺(tái)或服務(wù)器通信,使得邊緣設(shè)備具備了在本地處理信息的能力,并且可以更快速地對(duì)情況做出響應(yīng)。邊緣人工智能對(duì)消費(fèi)者電子、電信、醫(yī)療影像等主流行業(yè)均有應(yīng)用意義。比如說在監(jiān)控?cái)z像頭上運(yùn)行人臉識(shí)別、肩頸識(shí)別等人工智能算法,可以快速提供安防威脅識(shí)別,如果結(jié)合本地?cái)?shù)據(jù)存儲(chǔ),則能夠更進(jìn)一步發(fā)現(xiàn)和定位安全威脅嫌疑人,此外,邊緣人工智能在即時(shí)駕駛決策、嬰兒監(jiān)視器、無人機(jī)、機(jī)器人視覺能力(無互聯(lián)網(wǎng)連接)等方面也具有非常積極的價(jià)值。
需要指出的是,邊緣人工智能具有減少延遲、快速做出決策的優(yōu)勢(shì),但也存在計(jì)算和存儲(chǔ)能力受限的問題,因此邊緣人工智能未來將與云端人工智能構(gòu)成混合模式,從而提供更好的人工智能服務(wù)。
四、人工智能正變得性能更高和理解人類
眾所周知,人工智能技術(shù)的發(fā)展需要三個(gè)要素:數(shù)據(jù)、算法和算力。今天的人工智能熱潮主要是由于機(jī)器學(xué)習(xí),特別是深度學(xué)習(xí)技術(shù)在大數(shù)據(jù)、大算力的支持下取得的巨大進(jìn)展。訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)往往需要面臨三個(gè)問題:
時(shí)間:訓(xùn)練一個(gè) CNN 或 RNN 通常需要數(shù)周的時(shí)間。這還不算上為了達(dá)到所需的性能表現(xiàn),花在定義問題以及編程深度網(wǎng)絡(luò)時(shí)迭代成敗上的數(shù)周甚至數(shù)月的時(shí)間;
成本:數(shù)百美元GPU連續(xù)數(shù)周的計(jì)算成本高昂,這還沒開始算上人力成本。完成一個(gè) AI 項(xiàng)目往往需要要占用最優(yōu)秀人才數(shù)月、一年甚或更多的時(shí)間;
數(shù)據(jù):由于缺乏足夠數(shù)量的標(biāo)注數(shù)據(jù)而使項(xiàng)目無法展開的情況比比皆是。由于無法以合理的價(jià)格獲取訓(xùn)練數(shù)據(jù),很多好創(chuàng)意被迫放棄。
因此,取得較好商業(yè)表現(xiàn)的多是圖像處理、文本和語音識(shí)別。根據(jù)斯坦福百年研究(AI100)發(fā)布的全球“2018年人工智能指數(shù)”(AI Index)報(bào)告顯示,就人工智能性能而言,“能力持續(xù)飆升”,特別是在計(jì)算機(jī)視覺等領(lǐng)域。通過測(cè)量廣泛使用的圖像訓(xùn)練數(shù)據(jù)庫(kù)ImageNet的基準(zhǔn)性能,該報(bào)告發(fā)現(xiàn),啟動(dòng)可以按照最新精度對(duì)圖片進(jìn)行分類的模型所需的時(shí)間從“大約一小時(shí)到大約4分鐘”下降在短短18個(gè)月內(nèi)。
這相當(dāng)于訓(xùn)練速度大約提高了16倍;其他領(lǐng)域,如對(duì)象分割,這是軟件區(qū)分圖像的背景和主題,在短短三年內(nèi),精度提高了72%;對(duì)于機(jī)器翻譯和解析等領(lǐng)域,軟件可以理解語法結(jié)構(gòu),更容易回答問題,準(zhǔn)確性和熟練程度越來越高;在識(shí)別表情方面,計(jì)算機(jī)已經(jīng)可以超越人類,MIT媒體實(shí)驗(yàn)室數(shù)據(jù)顯示,對(duì)于真笑和苦笑的實(shí)驗(yàn)中,機(jī)器學(xué)習(xí)的成功率是92%,大幅優(yōu)于人類。不過雖然情感計(jì)算已經(jīng)深入生活,而要讓機(jī)器人更加懂你卻并非易事,還需要人機(jī)交互、心理學(xué)、認(rèn)知學(xué)等多學(xué)科領(lǐng)域共同努力。
從長(zhǎng)遠(yuǎn)看,克服速度與成本、提升人工智能性能,要從高性能計(jì)算、神經(jīng)形態(tài)計(jì)算和量子計(jì)算方向發(fā)展。
在高性能計(jì)算方面,芯片制造商以及以及谷歌等巨頭正在開展競(jìng)爭(zhēng),爭(zhēng)相打造深度學(xué)習(xí)專用芯片。比如NVIDIA A100 GPU和DGX SuperPOD系統(tǒng)當(dāng)選全球AI訓(xùn)練領(lǐng)域速度最快的市售商用產(chǎn)品。目前,包括AWS、百度云、微軟Azure和騰訊云等全球領(lǐng)先的云提供商都在使用A100以應(yīng)對(duì)AI、數(shù)據(jù)科學(xué)和科學(xué)計(jì)算中最為復(fù)雜的挑戰(zhàn)。其中有些正在賦能新一代的推薦系統(tǒng)或?qū)υ捠紸I應(yīng)用,或進(jìn)一步探索新冠病毒的治療方法,這些都在受益第八代NVIDIA GPU所帶來的迄今為止幅度最大的性能提升。
另外兩個(gè),神經(jīng)形態(tài)計(jì)算(也被稱為脈沖神經(jīng)網(wǎng)絡(luò))和量子計(jì)算看起來似乎還需要幾年。但事實(shí)是商用神經(jīng)形態(tài)芯片和商用量子計(jì)算機(jī)已投入應(yīng)用于機(jī)器學(xué)習(xí)之中。例如,在神經(jīng)形態(tài)計(jì)算芯片應(yīng)用方面,BrainChip Holdings 已經(jīng)在拉斯維加斯最大的賭場(chǎng)應(yīng)用了商業(yè)安防監(jiān)控系統(tǒng),并且它宣稱還有一些其他應(yīng)用也已經(jīng)交付。在拉斯維加斯,該系統(tǒng)的功能就是通過標(biāo)準(zhǔn)攝像頭的視頻流自動(dòng)監(jiān)控dealer的錯(cuò)誤,該系統(tǒng)完全通過觀察學(xué)習(xí)游戲規(guī)則;在量子計(jì)算應(yīng)用方面,IBM于2019美國(guó)CES展以及IBM Think大會(huì)上,展示了目前全球唯一一臺(tái)脫離實(shí)驗(yàn)室環(huán)境運(yùn)行的量子計(jì)算機(jī)“IBM Q System One”,該量子計(jì)算機(jī)擁有20個(gè)量子位的計(jì)算力。
總之,神經(jīng)形態(tài)計(jì)算和量子計(jì)算都是很有潛力的方向,它們都有可能令深度學(xué)習(xí)甚至是新型人工智能更快地運(yùn)行。
編輯:黃繼彥
——END——
想要獲得更多數(shù)據(jù)科學(xué)領(lǐng)域相關(guān)動(dòng)態(tài),誠(chéng)邀關(guān)注清華-青島數(shù)據(jù)科學(xué)研究院官方微信公眾平臺(tái)“ 數(shù)據(jù)派THU ”。
聯(lián)系客服