作者:聞菲
AI芯片的戰(zhàn)場更加熱鬧了。4月18日,Facebook宣布招聘ASIC和FPGA設計工程師,向設計自己的AI芯片邁出了第一步。
4月19日,國內巨頭阿里巴巴宣布正在自主研發(fā)AI芯片。這款由阿里巴巴達摩院研發(fā)的AI芯片是一款神經網絡芯片,名叫Ali-NPU,將用于圖像和視頻分析、云計算等商業(yè)場景的AI推理運算問題。
Facebook和阿里巴巴的入局,表明互聯網巨頭自主研發(fā)AI芯片已是大勢所趨。在此之前,谷歌、蘋果、微軟、亞馬遜等公司,都紛紛自研AI芯片。
谷歌從2012年左右開始研發(fā)名為張量處理器(TPU)的專用AI芯片,現在已經公布到第二代,既能推理也能訓練,針對谷歌的深度學習框架TensorFlow做了優(yōu)化;2017年谷歌開放Cloud TPU云服務,任何人都能通過谷歌云租借TPU。此外,谷歌還自研了圖像專用芯片Pixel Visual Core,用于谷歌的智能手機Pixel 2,今年下半年發(fā)布的Google Pixel 3也采用自主研發(fā)的SoC芯片。
蘋果公司則為iPhone設計芯片,并在去年隨著iPhone 8和iPhone X的發(fā)布,公布了神經引擎(Neural Engine),作為其A11仿生芯片的一部分。微軟早前投注FPGA,這已經成為微軟Azure云計算系統的基礎,提供比GPU更靈活的架構和更低的功耗;微軟也在為下一代HoloLens混合現實頭戴設備研發(fā)專門的AI芯片。至于亞馬遜,則是在今年初宣布為智能音箱Echo/Alexa打造專用AI芯片,同時也有外媒報道,亞馬遜可能正在為其云計算部門AWS開發(fā)AI處理器。芯片支撐未來發(fā)展,但如今似乎軟件定義硬件的趨勢愈加明顯。
芯片是支撐AI的基礎。而由于AI芯片受算法和模型影響非常大,因此掌握算法和模型,自己做軟件和服務的公司,如果精確地了解自己要什么,比如谷歌,比如最新加入戰(zhàn)局的Facebook和阿里,與其等待英特爾和英偉達等傳統硬件商,自己出手造芯反而能更快更準,更能滿足自己特定的需求。
同時,像谷歌這樣,將TPU與谷歌云和TensorFlow綁定——TensorFlow在TPU上會有更好的運行效果,而谷歌也將TPU實現的AI計算優(yōu)勢通過谷歌云提供,為自己構建起生態(tài)閉環(huán)。
所有這些,無疑都對傳統的硬件制造商,提出了更大的挑戰(zhàn)。在AI芯片戰(zhàn)火更旺的當下,CPU巨頭英特爾通過收購Nervana Systems(神經網絡專用加速器NNP)、Mobileye(自動駕駛)、Movidius(視覺處理芯片)、Altera(FPGA)等公司,在AI芯片領域構建起從云到端各種應用比較完善的布局。然而,收購這一行為本身,從一定程度上反映了自主研發(fā)的滯后。
在谷歌、阿里等巨頭紛紛進軍AI芯片,眾多AI芯片初創(chuàng)公司涌現的當下,英特爾如何應對?
日前,英特爾人工智能事業(yè)部副總裁、人工智能實驗室和軟件總經理Arjun Bansal博士接受了新智元的專訪,對AI芯片局勢以及AI技術的發(fā)展做了分析。
英特爾人工智能事業(yè)部副總裁、人工智能實驗室和軟件總經理Arjun Bansal。在2016年8月英特爾收購Nervana System之前,他是Nervana的聯合創(chuàng)始人兼算法副總裁,領導機器學習軟件與數據科學部。他的研究領域包括神經生理學和大規(guī)模機器學習。Arjun在加州理工大學獲得了計算機科學學士學位,在布朗大學獲得了神經科學博士學位,并在波士頓兒童醫(yī)院和哈佛醫(yī)學院完成了博士后研究。
Bansal博士是Nervana的聯合創(chuàng)始人之一,他表示英特爾的優(yōu)勢在于從芯片設計、制造到銷售一整套流程和生態(tài)的強大。作為曾經的AI芯片初創(chuàng)公司的一份子,他十分了解初創(chuàng)芯片公司面臨的挑戰(zhàn)。要真正實現原型的量產,有很多具體的細節(jié)需要去考慮,包括市場和銷售?!坝⑻貭柕膬?yōu)勢并不是只在芯片本身,而是結合了產品、技術、生態(tài)系統的一個合力?!盉ansal博士說。
或許這也是在眾多公司進軍AI芯片,眾多初創(chuàng)公司喊出在速度或性能上超越CPU多少多少倍,而英特爾Nervana神經網絡專用處理器延遲發(fā)布,英特爾仍然游刃有余的一個原因。
同時,這也再次印證了AI芯片創(chuàng)業(yè)和市場開拓的艱難。中國的眾多AI芯片初創(chuàng)公司,即使擁有很好的產品,前路也似乎依然坎坷。
采訪中的另一個重點,是英特爾的定位——Bansal博士在介紹英特爾智能醫(yī)療布局時表示,英特爾要做的,是成為對客戶和合作伙伴來說,能夠實現選擇最大化的一家公司。
“我們英特爾主要還是根據不同客戶的需求,在全棧的不同層級上都有相應的能力匹配,英特爾并不認為可以一刀切?!?/p>
這一點也體現在英特爾的AI處理器——英特爾Nervana神經網絡處理器(NNP)上面。英特爾Nervana NNP是專為深度學習設計的架構。這種新架構的目標是提供深度學習所需的靈活性,以支持所有深度學習元語(primitives),同時使核心硬件組件盡可能高效。
Nervana從2016年前開始規(guī)劃神經網絡處理器(也即現在英特爾Nervana NNP),Bansal博士說,如今AI的發(fā)展符合他們的預期,雖然市面上出現了眾多AI芯片,但他們仍然有自信NNP能滿足當前以及未來深度學習所需。
與谷歌、亞馬遜專門為了自己的軟件和應用而設計的AI芯片相比,英特爾Nervana NNP可以稱得上是“大家的AI處理器”。
PC時代X86架構一統天下的時代已經過去,未來也不大可能出現一款AI芯片統領一切。然而,還是會有勝利者,在各個不同的垂直領域,分得更大的蛋糕。
以下為整理后的采訪錄音文字片。
深度學習發(fā)展保持穩(wěn)定,軟件整合是痛點
新智元:對于計算機體系結構來說現在是一個令人激動的新時代。得益于深度學習,AI芯片領域出現了很多新的架構,在這些眾多新架構里面,有英特爾沒有考慮過的嗎?考慮過但沒有繼續(xù)深入的原因是什么?
Arjun Bansal:的確現在有很多新的面向深度學習的架構,英特爾在這方面有自己的Nervana神經網絡處理器(NNP),NNP專為加速神經網絡設計,采用標準緩存層次結構,在片上片下都有大量存儲,并使用軟件來管理片上內存,連接也使用大的帶寬,從而為深度學習模型實現更快的訓練時間。另外比如說Movidius架構,用于要求低功耗和邊緣計算應用,它和X86非常不一樣,能夠用在AR相機或無人機上進行視頻分析。英特爾還收購了Mobileye公司,它的能力主要是在汽車領域。還有FPGA,很靈活,實際上有很多自動駕駛公司使用FPGA,因為算法和模型在不斷演變。還有一種是集成GPU,很多產品比如筆記本,都已經使用,可以用于語音識別、圖像識別等任務?,F在市面上有很多新的想法,英特爾不會輕易追隨,但是我們會仔細地觀察每一個新的想法。
新智元:設計芯片需要對技術的發(fā)展進行預判。Nervana在2016年之前就考慮做神經網絡加速器,現在看AI技術發(fā)展是否符合你們當初的預期?
Arjun Bansal:設計處理器的目的是優(yōu)化深度學習的元語(primitives),而我們看深度學習中進行的計算,主要是卷積、密集矩陣乘積、elementwise operations、非線性等等,過去三四年里,這些primitives基本保持穩(wěn)定,沒有超出我們當時的預期,未來三到四年也將繼續(xù)如此。因此,我們仍然很有能力滿足當前和今后神經網絡計算所需。在編譯器方面,我們有nGraph,能夠讓開發(fā)人員比較簡單易行地從事相關的開發(fā),可以運行在英特爾至強可擴展處理器上。
新智元:剛才您提到nGraph,去年Facebook、亞馬遜等聯合發(fā)布了ONNX,同樣作為深度學習的中間表示,現在已經獲得相當大的受眾和競爭力。nGraph如何與ONNX以及其他類似的IR競爭?您如何看未來深度學習軟件整合的發(fā)展?
Arjun Bansal:我們與ONNX并不是直接競爭關系,英特爾也是ONNX聯盟的一分子,也參與一些標準界定工作,nGraph也支持ONNX中間表示(IR),nGraph有編譯器和執(zhí)行器,可以在CPU上實現,可以在NNP上實現,也可以在GPU上實現,支持不同的框架。目前nGraph的IR只支持推理,因此很顯然我們還需要能夠支持訓練的。
目前ONNX在做的和nGraph在做的更多是互補,我們還需要繼續(xù)工作,確保一個API或者一個中間表示能夠適用于不同的框架,這樣數據科學家就可以無縫的“開箱即用”。nGraph和ONNX都是開源的項目,我們也邀請其他感興趣的方面可以一起參與到我們的合作中。我們的重點就在于把研究開發(fā)的成果盡早、盡快的體現在具體的產品當中。目前的一個技術難點是在模型研究、數據中心部署、邊緣計算方面有很多不同的方法,但是這些方法之間彼此切換并不容易,這是英特爾想要解決的一個痛點。
單靠芯片并不能贏得市場,創(chuàng)業(yè)公司難以撬動既有生態(tài)
新智元:英特爾Nervana神經網絡處理器是業(yè)界非常關注的一款處理器產品,但一直沒有發(fā)布。與此同時,以谷歌TPU為代表,各種AI芯片產品問世,今年很多AI芯片創(chuàng)業(yè)公司也都發(fā)布產品,沖擊市場。這種情況下您是否感到有壓力?
Arjun Bansal:我不會用“壓力”這個詞,我覺得現在正是進入市場一個非常有趣的時間點。把一個產品帶入市場是非常復雜的過程,我們的信心來自于英特爾在制造的能力、算法和模型的能力,并且和客戶已有的pipeline、工具鏈進行集成的能力。英特爾有自己專業(yè)的技術,但更重要的是我們和現有的整個生態(tài)系統的配合非常好,比如不同的用戶對于功耗、對于尺寸、對于形態(tài)都會有自己的想法和考慮,英特爾在這方面有很豐富和專業(yè)的經驗。
作為Nervana的聯合創(chuàng)始人之一,我非常了解初創(chuàng)芯片公司面臨的挑戰(zhàn)。要真正實現原型的量產,實際上是有很多具體的細節(jié)需要去考慮,包括市場和銷售?,F在加入英特爾,我們能有效利用英特爾和整個生態(tài)系統不同的相關方之間的關系。我們的優(yōu)勢并不是只在芯片本身,而是結合了產品、技術、生態(tài)系統的一個合力。
新智元:基礎算法發(fā)展會給行業(yè)帶來很多不確定性,五年以后可能算法全都變了,英特爾為此做了哪些準備?
Arjun Bansal:我們做了大量的研究工作,密切關注追蹤這些趨勢的發(fā)展。英特爾有自己的研究院,還有專門的AI部門,也在做大量工作。我們會關注業(yè)界最新發(fā)布的成果,我們和學界,包括面向整個產業(yè),服務于整個產業(yè)的研究機構之間都有配合,看看能夠怎么比較好的把研究成果和我們的硬件匹配起來。在研究和硬件開發(fā)之間我們有非常緊密的配合,不會說市場突然出現一個東西,忽然讓我們大吃一驚,這種情況不會出現。
未來四五年的重點是將AI能力變?yōu)楫a品原型
新智元:您怎么看未來算法的發(fā)展?有什么值得關注的趨勢?
Arjun Bansal:現在推動AI發(fā)展的主導力量是監(jiān)督學習,需要大量帶標簽的數據集。未來值得關注的方向是無監(jiān)督學習、半監(jiān)督學習、強化學習,其中有的會不需要那么多數據但需要更多計算,還有的則需要在模擬和計算之間有新的動態(tài),從硬件的角度看,這些都是值得關注的趨勢。從AI研究的角度,則是如何讓AI技術賦能產品。所以未來四五年的重點,是將這些AI能力變?yōu)楫a品原型,比如將語音識別或圖像識別模型融入pipeline,為各行各業(yè)帶來能力。再遠一點,則是構建能夠綜合語音、圖像等能力的系統,結合強化學習,甚至類腦計算系統,得到更加有常識的機器。
新智元:硬件團隊最該過硬的是軟件部門。作為軟件部門負責人,你們在招收人才時有怎樣的標準?如何吸引人才?
Arjun Bansal:對外界來說“軟件”只是一個詞,實際上軟件可以細分到四五個層級,在比較低的層級上,比如說驅動、固件、系統級的軟件,在此之上是優(yōu)化層,這里面可以用到NNP,這之上是編譯器,比如NGraph,還要確保它們能夠在框架當中正常運行,各家都有自己的框架,比如TensorFlow、BigDL,在系統編譯器方面我們能夠為數據科學家提供他們所需要的編譯器。在上述幾個領域我們都要招募人才。
英特爾對產業(yè)有很大影響力,基本上你走到世界上任何一個屋子里都能找到一個用到英特爾的東西,從這一點上說,我們對人才還是很有吸引力的。在AI方面,實際上英特爾做了很多工作,也有很多的部署,雖然并不是家喻戶曉,但從事這一行的人還是知道的,英特爾對于AI的影響還是非常大。所以我們能夠吸引到人才。
新智元:那這些人都從哪里來?
Arjun Bansal:各方各面都有。在數據科學家方面,我們關注Kaggle專業(yè)類競賽,也會招收神經科學、物理學博士,在硬件還有系統級方面,英特爾現有人才已經非常豐富了。
英特爾的定位:實現選擇最大化
新智元:英特爾與許多醫(yī)療相關的企業(yè)和研究機構合作,在選擇合作伙伴和項目方面的標準是什么?
Arjun Bansal:英特爾在智能醫(yī)療領域的合作伙伴,比如說生物技術公司、醫(yī)院還有醫(yī)藥公司,很多都是我們既有的客戶,他們已經大量使用英特爾的計算和存儲產品。我們和這些既有的合作伙伴一起,在新的AI領域當中合作。有一些合作方可能沒有自己的數據科學家資源,我們會為他們提供相應的能力,有一些合作方有自己的數據科學家資源,我們英特爾幫他們做的主要是對模型進一步優(yōu)化,比如軟件或者芯片。因為我們能夠提供全棧式解決方案,所以具體的合作取決于合作方的需求和他們內部的能力,比如需要獲得診斷能力的醫(yī)院,我們會按照他們需要的方式,將技術或者原型投入到主流的實際產品當中去。
新智元:英特爾對于精準醫(yī)療的生態(tài)有怎樣的設想和布局?最先落地的或者說目前成果最多的是哪方面的應用?
Arjun Bansal:我們密切關注著這個市場的變化,精準醫(yī)療需要大量的技術支撐,所以算法和模型會很關鍵。我們有和數據收集和分析有關的項目,也有針對個人用戶的核磁共振和CT掃描的解決方案,還有對系統收集和觀察到的東西進行分析的能力。我們在智能醫(yī)療上大力投入,但我們的工作目標并不是生產面向最終消費者的產品,而是與合作伙伴,包括獨立軟件開發(fā)商共同合作。英特爾擁有端到端的、業(yè)界領先的人工智能全棧解決方案,我們會與合作方配合,針對不同的使用目的,提供特定的解決方案。
我認為落地比較快的是CPU方面的成果。從數據科學家角度來說,第一步還是從CPU開始的。再下一步要看具體的情況,比如說對于計算能力的要求、對于數據分析能力的要求、對于延時的要求、對于速度的要求、對于內存規(guī)模的要求,不同的要求會有不同的解決方案,這取決于最終的用途到底是什么。所以,英特爾的優(yōu)勢是在于我們提供選擇的空間,你可以根據自己的實際需要來選擇,是使用FPGA還是CPU還是NNP(神經網絡處理器)。
至于應用,在輔助醫(yī)生閱片方面,我們與浙江醫(yī)院合作,已經有實際部署,病人已經在使用了。算法有一定的能力,準確度也在不斷提高,但是仍然處在將原型帶到這個市場變成實際產品的過程當中。在這個過程當中,還是要針對不同的用途,面向不同的挑戰(zhàn)來進行處理。比如說有一些我們的合作方或者客戶,它面臨的是政府監(jiān)管的挑戰(zhàn),還有一些是社會認知上的誤解,覺得這些新技術的采用會讓很多人失去飯碗。還有一些人比較關注個人隱私,數據會不會被泄露。所以還是要看不同用途、不同挑戰(zhàn),根據合作伙伴的實際需要相應的加以處理。在中國和印度這種人口很多,但相對來說醫(yī)生數量又不夠的國家,相應的部署速度還是非常快的。
新智元:現在醫(yī)療領域很大一部分數據是圖像數據,而說到影像處理,GPU有天然的優(yōu)勢,英偉達也在智能醫(yī)療領域大量投入,建立了生態(tài)。與之相比,英特爾的特點和優(yōu)勢在哪里?
Arjun Bansal:前面我提到英特爾與浙江醫(yī)院的合作,甲狀腺檢測,就是處理醫(yī)療影像。另外我們與GE醫(yī)療合作,主要是做CT掃描,還有合作方做核磁共振,以及做腫瘤檢測、人體器官掃描分析,這些都涉及圖像處理。實際上現在在醫(yī)學影像方面,我們做得還是不錯的,也有實際客戶在使用。醫(yī)學影像一個很大的挑戰(zhàn),就是需要在內存里面放大量的數據組,這意味著要實現深度學習的能力,需要占用很大的字節(jié)空間,而CPU在處理大量數據的時候,精度是比GPU更高的。在自然語言處理和字節(jié)空間上我們有一定的技術優(yōu)勢,這也是我們接下來繼續(xù)努力的方向,就是如何把大規(guī)模的數據放在內存里面。然后在此基礎上,還要有空間去訓練模型,這也是英特爾可以做的。
總之,對客戶也好、對供應商也好、對伙伴也好,我們是可以實現選擇最大化的那一家公司。