本文最初發(fā)布于 IEEE Spectrum。
吳恩達(dá)在人工智能領(lǐng)域可謂聲名顯赫。2000 年底,他與斯坦福大學(xué)的學(xué)生一起開創(chuàng)了使用圖形處理單元(GPU)訓(xùn)練深度學(xué)習(xí)模型的先河,并在 2011 年共同創(chuàng)立了谷歌大腦,然后在百度擔(dān)任了三年的首席科學(xué)家,幫助這家科技巨頭創(chuàng)立了人工智能小組。因此,很多人都相信他所說(shuō)的,人工智能將迎來(lái)下一個(gè)重大轉(zhuǎn)變。本文是他某次接受 IEEE Spectrum 獨(dú)家采訪的內(nèi)容整理。
目前,他的主要精力都放在其公司Landing AI上。該公司構(gòu)建了一個(gè)名為 LandingLens 的平臺(tái),幫助制造商利用計(jì)算機(jī)視覺(jué)改善視覺(jué)檢測(cè)。他還成為了他所謂的以數(shù)據(jù)為中心的人工智能運(yùn)動(dòng)的布道者,他說(shuō)這可以為人工智能領(lǐng)域的大問(wèn)題提供“小數(shù)據(jù)”解決方案,涉及模型效率、準(zhǔn)確性和偏見。
本文主要內(nèi)容包括:
IEEE Spectrum:在過(guò)去十年左右的時(shí)間里,深度學(xué)習(xí)的巨大進(jìn)步是以越來(lái)越大的模型處理越來(lái)越多的數(shù)據(jù)為基礎(chǔ)。有人認(rèn)為,這種發(fā)展模式是不可持續(xù)的。您是否同意這種說(shuō)法,深度學(xué)習(xí)不能再以這種方式繼續(xù)發(fā)展下去?
吳恩達(dá):這個(gè)問(wèn)題很大。我們已經(jīng)看過(guò)了 NLP(自然語(yǔ)言處理)中的基礎(chǔ)模型。我對(duì) NLP 模型變得越來(lái)越大感到興奮,同時(shí)也對(duì)在計(jì)算機(jī)視覺(jué)領(lǐng)域構(gòu)建基礎(chǔ)模型的潛力感到興奮。我認(rèn)為,視頻中仍有很多訊息可以利用:受限于計(jì)算帶寬和視頻處理成本,我們還無(wú)法為視頻構(gòu)建出不再依賴文本分詞的基礎(chǔ)模型。因此我認(rèn)為,這個(gè)擴(kuò)展深度學(xué)習(xí)算法的引擎,雖然已經(jīng)運(yùn)行了大約 15 年,但仍然有活力。話雖如此,那也只適用于某些問(wèn)題,還有其他一系列問(wèn)題需要小數(shù)據(jù)解決方案。
IEEE Spectrum:當(dāng)您說(shuō)您希望有一個(gè)計(jì)算機(jī)視覺(jué)的基礎(chǔ)模型時(shí),您指的是什么?
吳恩達(dá):這是由Percy Liang和我在斯坦福的一些朋友們創(chuàng)造的一個(gè)術(shù)語(yǔ),指的是非常大的模型,在非常大的數(shù)據(jù)集上訓(xùn)練,可以針對(duì)特定的應(yīng)用進(jìn)行調(diào)優(yōu)。例如,GPT-3就是一個(gè)基礎(chǔ)模型[用于 NLP]的例子?;A(chǔ)模型作為開發(fā)機(jī)器學(xué)習(xí)應(yīng)用的一個(gè)新范式,有很大的應(yīng)用前景,但同時(shí)也面臨著挑戰(zhàn),即如何確保它們合理、公平、沒(méi)有偏見,特別是如果我們中的許多人將以它們?yōu)榛A(chǔ)進(jìn)行構(gòu)建。
IEEE Spectrum:在什么情況下才會(huì)有人針對(duì)視頻構(gòu)建一個(gè)基礎(chǔ)模型?
吳恩達(dá):我認(rèn)為有一個(gè)可擴(kuò)展性問(wèn)題。處理視頻中的大量圖片所需的計(jì)算能力非常大,我想這就是為什么基礎(chǔ)模型會(huì)首先出現(xiàn)在 NLP 中。許多研究人員正在研究這個(gè)問(wèn)題,我認(rèn)為我們已經(jīng)看到了在計(jì)算機(jī)視覺(jué)領(lǐng)域開發(fā)這種模型的早期跡象。我相信,如果有一家半導(dǎo)體制造商給我們提供 10 倍的處理能力,那么我們就很容易找到 10 倍的視頻來(lái)構(gòu)建這樣的視覺(jué)模型。
話雖如此,在過(guò)去十年里,經(jīng)常出現(xiàn)的情況是,深度學(xué)習(xí)發(fā)生在面向消費(fèi)者的公司。這些公司擁有龐大的用戶群,有時(shí)是數(shù)十億用戶,他們也因此擁有非常龐大的數(shù)據(jù)集。雖然這種機(jī)器學(xué)習(xí)范式為消費(fèi)類軟件帶來(lái)了巨大的經(jīng)濟(jì)價(jià)值,但我發(fā)現(xiàn),適用于這種規(guī)模的方法對(duì)其他行業(yè)并不適用。
IEEE Spectrum:聽您這么說(shuō)很有意思,因?yàn)槟缙诰褪窃谝患颐嫦蛳M(fèi)者而且有數(shù)百萬(wàn)用戶的公司工作。
吳恩達(dá):十多年前,當(dāng)我提議啟動(dòng)谷歌大腦項(xiàng)目,利用谷歌的計(jì)算基礎(chǔ)設(shè)施來(lái)構(gòu)建非常大的神經(jīng)網(wǎng)絡(luò)時(shí),是有爭(zhēng)議的。一個(gè)非常資深的人把我拉到一邊,警告我說(shuō),啟動(dòng)谷歌大腦對(duì)我的職業(yè)生涯不利。我想,他是覺(jué)得行動(dòng)不能只停留在擴(kuò)大規(guī)模上,而應(yīng)該把重點(diǎn)放在架構(gòu)創(chuàng)新上。
在許多行業(yè)中,巨型數(shù)據(jù)集根本不存在,所以我認(rèn)為,關(guān)注點(diǎn)必須從大數(shù)據(jù)轉(zhuǎn)向好數(shù)據(jù)。有 50 個(gè)精心設(shè)計(jì)的樣本就足以向神經(jīng)網(wǎng)絡(luò)解釋你想讓它學(xué)習(xí)什么。
我記得,在我和我的學(xué)生發(fā)表第一篇NeurIPS研討會(huì)論文,提倡使用CUDA(一種在 GPU 上進(jìn)行處理的平臺(tái))進(jìn)行深度學(xué)習(xí)時(shí),一位與眾不同的 AI 資深人士對(duì)我說(shuō):“CUDA 編程真的很復(fù)雜。作為一種編程范式,這么做工作似乎太多?!蔽以O(shè)法說(shuō)服了他;但另一個(gè)人我卻沒(méi)能說(shuō)服。
IEEE Spectrum:我希望他們現(xiàn)在都信服了。
吳恩達(dá):我認(rèn)為是這樣。
在過(guò)去一年里,當(dāng)我與人們談?wù)撘詳?shù)據(jù)為中心的人工智能運(yùn)動(dòng)時(shí),我一直在回想 10 或 15 年前在與人們談?wù)撋疃葘W(xué)習(xí)和可擴(kuò)展性時(shí)的情景。在這一年里,我一直聽到同樣的雜音:“這沒(méi)有什么新東西”和“這似乎是一個(gè)錯(cuò)誤的方向”。
IEEE Spectrum:您是怎么定義以數(shù)據(jù)為中心的 AI 的?為什么您將其視為一場(chǎng)運(yùn)動(dòng)?
吳恩達(dá):以數(shù)據(jù)為中心的 AI 是一門系統(tǒng)地設(shè)計(jì)數(shù)據(jù)以促成人工智能系統(tǒng)構(gòu)建的學(xué)科。人工智能系統(tǒng)必須在代碼中實(shí)現(xiàn)一些算法,比如說(shuō)神經(jīng)網(wǎng)絡(luò),然后在數(shù)據(jù)集上訓(xùn)練它。過(guò)去十年的主流范式是下載數(shù)據(jù)集,并專注于改進(jìn)代碼。得益于這種范式,在過(guò)去十年中,深度學(xué)習(xí)網(wǎng)絡(luò)有了顯著的改善,以至于對(duì)于很多應(yīng)用程序來(lái)說(shuō),代碼——神經(jīng)網(wǎng)絡(luò)架構(gòu)——基本上是一個(gè)已解決的問(wèn)題。因此,對(duì)于許多實(shí)際應(yīng)用來(lái)說(shuō),將神經(jīng)網(wǎng)絡(luò)架構(gòu)固定下來(lái),轉(zhuǎn)而尋找改善數(shù)據(jù)的方法,會(huì)更有成效。
當(dāng)我開始談?wù)撨@個(gè)問(wèn)題時(shí),有許多從業(yè)者舉手說(shuō),“是的,我們已經(jīng)做了 20 年了”?,F(xiàn)在,是時(shí)候把一些人一直憑直覺(jué)在做的事情,變成一門系統(tǒng)的工程學(xué)科了。
與一家公司或一群研究人員相比,以數(shù)據(jù)為中心的人工智能運(yùn)動(dòng)的規(guī)模要大得多。我和我的合作者在 NeurIPS 上組織了一個(gè)以數(shù)據(jù)為中心的人工智能研討會(huì),前來(lái)參加的作者和演講者的數(shù)量讓我感到非常高興。
IEEE Spectrum:您經(jīng)常談到,有些公司或機(jī)構(gòu)只有少量的數(shù)據(jù)可供利用。以數(shù)據(jù)為中心的人工智能如何為他們提供幫助?
吳恩達(dá):你應(yīng)該聽說(shuō)過(guò),很多視覺(jué)系統(tǒng)的構(gòu)建使用了數(shù)百萬(wàn)張圖片,我曾經(jīng)用 3.5 億張圖片構(gòu)建了一個(gè)面部識(shí)別系統(tǒng)。為數(shù)以億計(jì)的圖片構(gòu)建的架構(gòu)在只有 50 張圖片時(shí)是行不通的。但事實(shí)證明,如果有 50 個(gè)非常好的樣本,那么你就可以構(gòu)建一些有價(jià)值的東西,比如缺陷檢測(cè)系統(tǒng)。在許多行業(yè),根本不存在非常大的數(shù)據(jù)集,所以我認(rèn)為,關(guān)注點(diǎn)必須從大數(shù)據(jù)轉(zhuǎn)移到好數(shù)據(jù)。有 50 個(gè)精心設(shè)計(jì)的樣本就足以向神經(jīng)網(wǎng)絡(luò)解釋你想讓它學(xué)習(xí)什么。
IEEE Spectrum:您說(shuō)用 50 張圖片訓(xùn)練一個(gè)模型的意思是對(duì)一個(gè)現(xiàn)有的、在非常大的數(shù)據(jù)集上訓(xùn)練的模型進(jìn)行微調(diào),還是說(shuō)一個(gè)全新的模型,只是它被設(shè)計(jì)成只從小數(shù)據(jù)集學(xué)習(xí)?
吳恩達(dá):讓我描述一下 Landing AI 的作用。在幫助制造商實(shí)現(xiàn)視覺(jué)檢測(cè)時(shí),我們經(jīng)常使用我們自己的RetinaNet。它是一個(gè)預(yù)訓(xùn)練的模型。話雖如此,預(yù)訓(xùn)練只是整個(gè)拼圖的一小部分。更大的難題是提供工具,使制造商能夠挑選合適的圖片集[用于調(diào)優(yōu)],并用同樣的方式標(biāo)記它們。我們看到,有一個(gè)非常實(shí)際的問(wèn)題,橫跨視覺(jué)、NLP 和語(yǔ)音,即使是人類標(biāo)注者也沒(méi)法一致地給出適當(dāng)?shù)臉?biāo)簽。對(duì)于大數(shù)據(jù)應(yīng)用,常見的反應(yīng)是:如果數(shù)據(jù)嘈雜,我們就獲取大量的數(shù)據(jù),然后由算法來(lái)均化處理。但是,如果你能開發(fā)一些工具來(lái)標(biāo)記數(shù)據(jù)不一致的地方,并給出一個(gè)非常有針對(duì)性的方法來(lái)改善數(shù)據(jù)的一致性,那么這將是構(gòu)建一個(gè)高性能的系統(tǒng)更有效的方法。
收集更多的數(shù)據(jù)往往是有幫助的,但如果你什么時(shí)候都設(shè)法收集更多的數(shù)據(jù),那可能是一項(xiàng)非常昂貴的活動(dòng)。
例如,如果你有 1 萬(wàn)張圖片,其中 30 張屬于一個(gè)類別,而這 30 張圖片的標(biāo)簽不一致,我們所做的其中一件事就是構(gòu)建工具,幫助你發(fā)現(xiàn)不一致的數(shù)據(jù)子集。那樣,你就可以非常迅速地重新標(biāo)注這些圖片,提升圖片一致性,進(jìn)而提升性能。
IEEE Spectrum:這種對(duì)高質(zhì)量數(shù)據(jù)的關(guān)注是否能幫助解決數(shù)據(jù)集偏見,如果能在訓(xùn)練前更多地挑選數(shù)據(jù)?
吳恩達(dá):幫助非常大。已經(jīng)有許多研究人員指出,數(shù)據(jù)偏見是導(dǎo)致系統(tǒng)偏見的眾多因素之一。人們?cè)跀?shù)據(jù)設(shè)計(jì)方面已經(jīng)付出了許多努力。在 NeurIPS 研討會(huì)上,Olga Russakovsky就這個(gè)問(wèn)題做了一個(gè)非常好的演講。我也非常喜歡 NeurIPS 大會(huì)上Mary Gray的演講,她提到,以數(shù)據(jù)為中心的人工智能只是解決方案的一部分,但不是全部解決方案。像Datasheets for Datasets這樣的新工具似乎也是拼圖的重要組成部分。
以數(shù)據(jù)為中心的人工智能為我們提供的其中一個(gè)強(qiáng)大的工具是設(shè)計(jì)數(shù)據(jù)子集的能力。想象一下,訓(xùn)練一個(gè)機(jī)器學(xué)習(xí)系統(tǒng),發(fā)現(xiàn)它在大部分?jǐn)?shù)據(jù)集上的表現(xiàn)都還可以,但只是對(duì)數(shù)據(jù)的一個(gè)子集有偏見。如果你為了提高在那個(gè)數(shù)據(jù)子集上的性能,試圖改變整個(gè)神經(jīng)網(wǎng)絡(luò)的架構(gòu),這相當(dāng)困難。但是,如果你能對(duì)數(shù)據(jù)的一個(gè)子集進(jìn)行設(shè)計(jì),你就能以更有針對(duì)性的方式解決這個(gè)問(wèn)題。
IEEE Spectrum:準(zhǔn)確地說(shuō),您所說(shuō)的數(shù)據(jù)設(shè)計(jì)是指什么?
吳恩達(dá):在人工智能領(lǐng)域,數(shù)據(jù)清理很重要,但數(shù)據(jù)清理的方式往往需要大量的手動(dòng)工作。在計(jì)算機(jī)視覺(jué)中,有人可能通過(guò)Jupyter筆記本將圖片可視化,也許會(huì)發(fā)現(xiàn)問(wèn)題,也許會(huì)修復(fù)它。但對(duì)于那些讓我們可以擁有一個(gè)非常大的數(shù)據(jù)集的工具,那些可以快速有效地定位存在標(biāo)簽噪聲的數(shù)據(jù)子集的工具,我感到非常興奮。或者是快速將你的注意力吸引到 100 個(gè)類中的某一類,從中收集更多的數(shù)據(jù)會(huì)讓你受益。收集更多的數(shù)據(jù)往往是有幫助的,但是如果你什么時(shí)候都設(shè)法收集更多的數(shù)據(jù),那可能是一項(xiàng)非常昂貴的活動(dòng)。
例如,我曾經(jīng)指出,當(dāng)背景中有汽車噪音時(shí),語(yǔ)音識(shí)別系統(tǒng)的表現(xiàn)很差。了解了這一點(diǎn),我就可以在有汽車噪音時(shí)收集更多的數(shù)據(jù),而不是什么時(shí)候都設(shè)法收集更多的數(shù)據(jù),那樣成本又高又耗時(shí)。
IEEE Spectrum:使用合成數(shù)據(jù)怎么樣,通常這是一個(gè)好的解決方案嗎?
吳恩達(dá):我認(rèn)為,合成數(shù)據(jù)是以數(shù)據(jù)為中心的人工智能工具箱中的一個(gè)重要工具。在 NeurIPS 研討會(huì)上,Anima Anandkumar做了一個(gè)關(guān)于合成數(shù)據(jù)的精彩演講。我認(rèn)為,合成數(shù)據(jù)的重要用途不僅僅是作為一個(gè)預(yù)處理步驟來(lái)增加學(xué)習(xí)算法的數(shù)據(jù)集。我希望看到更多的工具,讓開發(fā)者可以把合成數(shù)據(jù)生成作為機(jī)器學(xué)習(xí)迭代開發(fā)閉環(huán)的一部分。
IEEE Spectrum:您是說(shuō)合成數(shù)據(jù)可以讓我們?cè)诟嗟臄?shù)據(jù)集上試驗(yàn)?zāi)P蛦幔?/strong>
吳恩達(dá):不是這樣。舉個(gè)例子。比方說(shuō),你試圖檢測(cè)智能手機(jī)外殼的缺陷。智能手機(jī)上有許多不同類型的缺陷。那可能是劃痕、凹痕、坑痕、材料變色或其他類型的瑕疵。如果你訓(xùn)練了模型,然后通過(guò)誤差分析發(fā)現(xiàn)它總體上表現(xiàn)很好,但在坑痕上表現(xiàn)很差,那么合成數(shù)據(jù)生成讓你可以更有針對(duì)性地解決這個(gè)問(wèn)題。你可以只針對(duì)坑痕類別生成更多的數(shù)據(jù)。
在消費(fèi)類軟件互聯(lián)網(wǎng)中,我們可以訓(xùn)練少數(shù)幾種機(jī)器學(xué)習(xí)模型來(lái)服務(wù) 10 億用戶。但在制造業(yè),你可能要為 1 萬(wàn)個(gè)制造商構(gòu)建 1 萬(wàn)個(gè)定制化的人工智能模型。
合成數(shù)據(jù)生成是一個(gè)非常強(qiáng)大的工具,但也有許多簡(jiǎn)單一些的工具,我經(jīng)常會(huì)先試一下。比如說(shuō)數(shù)據(jù)增強(qiáng),改善標(biāo)簽一致性,或者只是要求工廠收集更多的數(shù)據(jù)。
IEEE Spectrum:為了使這些問(wèn)題更加具體化,您能通過(guò)一個(gè)例子來(lái)更具體地說(shuō)明下這些問(wèn)題嗎?當(dāng)一家公司找到Landing AI并說(shuō)它在視覺(jué)檢測(cè)方面存在問(wèn)題時(shí),您如何讓他們參與進(jìn)來(lái)并努力實(shí)現(xiàn)部署?
吳恩達(dá):當(dāng)客戶找到我們時(shí),我們通常會(huì)就他們?cè)跈z測(cè)方面遇到的問(wèn)題進(jìn)行交談,并查看一些圖片,以驗(yàn)證該問(wèn)題是否可以通過(guò)計(jì)算機(jī)視覺(jué)來(lái)解決。假如可以,我們會(huì)要求他們將數(shù)據(jù)上傳到LandingLens平臺(tái)。我們經(jīng)?;谝詳?shù)據(jù)為中心的人工智能方法論向他們提供建議,并幫助他們對(duì)數(shù)據(jù)進(jìn)行標(biāo)注。
Landing AI 的其中一個(gè)重要目標(biāo)是讓制造企業(yè)可以自己完成機(jī)器學(xué)習(xí)工作。我們的很多工作都是為了確保軟件快速且易于使用。我們通過(guò)機(jī)器學(xué)習(xí)開發(fā)的迭代過(guò)程為客戶提供建議,比如如何在平臺(tái)上訓(xùn)練模型,何時(shí)以及如何改進(jìn)數(shù)據(jù)的標(biāo)注,從而提高模型的性能。我們會(huì)一直提供培訓(xùn)和軟件支持,直到他們將訓(xùn)練好的模型部署到工廠的邊緣設(shè)備上。
IEEE Spectrum:你們?nèi)绾翁幚聿粩嘧兓男枨螅咳绻a(chǎn)品發(fā)生變化或工廠的照明條件發(fā)生變化,模型能跟得上嗎?
吳恩達(dá):這和制造商有關(guān)系。在許多情況下都會(huì)有數(shù)據(jù)漂移。但也有一些制造商,一條生產(chǎn)線運(yùn)行了 20 年,幾乎沒(méi)有什么變化,所以他們不覺(jué)得未來(lái) 5 年內(nèi)會(huì)有什么變化。穩(wěn)定的環(huán)境使事情變得相對(duì)簡(jiǎn)單。對(duì)于其他制造商,我們提供工具,在發(fā)生重大數(shù)據(jù)漂移問(wèn)題時(shí)進(jìn)行標(biāo)記。我發(fā)現(xiàn),賦予制造業(yè)客戶糾正數(shù)據(jù)、重新訓(xùn)練和更新模型的能力真的很重要。因?yàn)槿绻惺裁醋兓?,而且現(xiàn)在是美國(guó)時(shí)間凌晨 3 點(diǎn),我希望他們能夠立即調(diào)整他們的學(xué)習(xí)算法,以保證運(yùn)營(yíng)。
在消費(fèi)類軟件互聯(lián)網(wǎng)中,我們可以訓(xùn)練少數(shù)幾個(gè)機(jī)器學(xué)習(xí)模型來(lái)服務(wù) 10 億用戶。但在制造業(yè),你可能要為 1 萬(wàn)個(gè)制造商構(gòu)建 1 萬(wàn)個(gè)定制化的人工智能模型。這里的挑戰(zhàn)是,如果沒(méi)有 Landing AI ,你如何做到這一點(diǎn),是雇用 10000 名機(jī)器學(xué)習(xí)專家嗎?
IEEE Spectrum:所以您是說(shuō),為了使其可擴(kuò)展,您必須賦能客戶來(lái)做大量的訓(xùn)練及其他工作。
吳恩達(dá):是的,完全正確!這是涉及全行業(yè)的人工智能問(wèn)題,不僅僅是在制造業(yè)??纯葱l(wèi)生保健領(lǐng)域。每家醫(yī)院的電子健康記錄格式都略微不同。每家醫(yī)院該如何訓(xùn)練自己定制化的人工智能模型?指望每家醫(yī)院的 IT 人員發(fā)明新的神經(jīng)網(wǎng)絡(luò)架構(gòu)是不現(xiàn)實(shí)的。擺脫這種困境的唯一方法是構(gòu)建工具賦能客戶,為他們提供工具來(lái)設(shè)計(jì)數(shù)據(jù)和表示領(lǐng)域知識(shí),使他們能夠構(gòu)建自己的模型。這就是 Landing AI 希望在計(jì)算機(jī)視覺(jué)領(lǐng)域達(dá)成的目標(biāo),人工智能領(lǐng)域需要其他團(tuán)隊(duì)在其他領(lǐng)域完成類似的目標(biāo)。
IEEE Spectrum:關(guān)于您所做的工作或以數(shù)據(jù)為中心的人工智能運(yùn)動(dòng),您認(rèn)為還有什么需要人們了解的嗎?
吳恩達(dá):在過(guò)去十年中,人工智能最大的轉(zhuǎn)變是向深度學(xué)習(xí)轉(zhuǎn)變。我認(rèn)為,在這個(gè)十年里,最大的轉(zhuǎn)變很有可能是向以數(shù)據(jù)為中心的人工智能轉(zhuǎn)變。隨著現(xiàn)如今神經(jīng)網(wǎng)絡(luò)架構(gòu)的成熟,我認(rèn)為,對(duì)于很多實(shí)際的應(yīng)用來(lái)說(shuō),瓶頸將是我們能否有效地獲得我們所需的數(shù)據(jù),開發(fā)出效果良好的系統(tǒng)。以數(shù)據(jù)為中心的人工智能運(yùn)動(dòng)在整個(gè)社區(qū)有著巨大的活力和動(dòng)力。我希望有更多的研究人員和開發(fā)人員能夠加入進(jìn)來(lái),為之努力。
聯(lián)系客服