問題一:AI對人類存在威脅嗎?
在當今,擔心人工智能的罪惡超能力就如同擔心火星移民計劃導致的人口過剩一樣,為時過早。因為實際上,我們甚至還沒有登陸到火星表面!
人工智能目前已經有了巨大的進展,并且我對于機器智能技術由上之下構建服務更好的人類社會抱持樂觀態(tài)度。但是到目前為止,人工智能的發(fā)展仍然非常局限。幾乎所有深度學習的經濟價值和社會價值仍然依賴于監(jiān)督學習,即同時受限制于特定格式(比如,標記過的數據)。即便人工智能已經能夠幫助者數億人,并以積極的姿態(tài)準備去幫助更多的人,我也仍然沒有發(fā)現任何現實意義上能夠威脅到人類社會的人工智能方法。
長久來看,我發(fā)現很多種除了監(jiān)督式學習之外的人工智能方法技術都非常激動人心,比如無監(jiān)督式學習(由于數據無需再被標記,就有了更多的可用數據)。我個人或是其他的研究組在其他形式的學習方面也都有很多令人振奮的進展。我們所有人都希望看到一個技術性的突破,但誰都沒法預測什么時候會真正到來。
我認為諸如對于 「邪惡智能殺手」的恐懼,已經都成為了決策者和領導人濫用資源來解決一個根本不存在的幻影的借口。實際上人工智能會引發(fā)的其他問題,但更集中于工作的取代上。即便人工智能在未來十年能夠幫助我們建立一個更好的社會,我們作為人工智能的創(chuàng)造者同時也應該對可能引發(fā)的一系列問題肩負起應有的責任。我希望 MOOCs(Coursera)成為解決問題的一部分,但是我們仍需要除教育之外更多的東西。
對于這個問題,我們看看深度學習三巨頭之一的Yoshua Bengio的回答:
在未來,我們是否能研發(fā)出具備人類水平智能、甚至超越人類的AI?這個問題依然有很大的不確定性。盡管我是一個樂觀主義者,但基于上述不確定性,我不能否認,我們不想看到的事依然有可能會發(fā)生。這就是我在FLI(Future of Life)呼吁AI應該穩(wěn)健且有益于人類的公開信上簽字的原因。
然而,必須注意到,這種潛在的危險距離現在的我們還很遙遠。新聞媒體總傾向于在這方面夸大其詞,以吸引注意力。這將損害AI研究。相反,我們應該鼓勵研究者去更好地理解這些問題,如果有那么一天這些問題真的迫在眉睫,他們能讓我們準備好,并為我們提供尊重人類價值的更安全的AI。
說到這里,我相信,將媒體的注意力從科幻片中的長期恐懼轉向AI短期內可能帶來的更具體的社會、經濟和政治問題上,是一件很重要的事。但是,我們必須提前思考這些問題,不要等到大多數人遭受不幸(比如失業(yè))而少數幸運者變得超級富裕且強勢時才想到這些問題。在決定要怎樣使用AI帶來的進展時,我們必須發(fā)揮群體的智慧,讓它有利于大多數人,而不是少數人。為了與科技帶來的不斷增長的力量相匹配,弱肉強食的叢林法則是不合適的:為了當代人以及我們后代的利益,個人和群體的智慧都必須有所增長。
問題二:無人駕駛汽車何時能真正上路?
我希望在三年之內能夠看到大量的無人駕駛汽車問世,而在五年之內能夠進行大規(guī)模生產。(如果你愿意,你可以在你的日程中寫下這一點,三到五年之后再來檢驗我的預測是否正確。)
最近我們剛剛度過了斯坦福大學贏得DARPA無人駕駛汽車挑戰(zhàn)賽十周年紀念日。但是為什么無人駕駛技術花費了這么久的時間還沒有成熟呢?
首先,我認為建造一輛可以滿世界跑的汽車的方法本身就非常具有挑戰(zhàn)性,而且通常情況下第一個要解決的目標也是錯誤的(或者說不切實際的)。無人駕駛汽車最大的問題是解決所有的極端情況——即每行駛1萬甚至10萬英里才會發(fā)生的一些奇怪的事情。機器學習有助于將你的表現從90%的準確率提高到99.9%,但是卻不會從99.9%提高到99.9999%。我認為以另外一個目標為起點或許更合適(更有希望):區(qū)間車只能選擇一條巴士路線,或者僅僅在很小的范圍內活動。如果我們可以保證該路線的道路表面和車道標線維護良好,例如沒有進行施工等;這樣我們可以使得可觸范圍內保持真正的安全;然后依照這樣我們可以慢慢加入新的路線,從而逐漸使得在這個區(qū)域內我們都能安全行駛。這也是百度正在進行的方案,我希望其他的小組也能采取這樣的方法。
其次,汽車看待世界的方式和我們不一樣。例如,今天的計算機視覺不能有效地分辨建筑工人朝你揮手時是在讓你「過來」還是「停下來」。另一方面,我們的無人駕駛汽車并沒有任何的盲點,隨時都可以進行360°全方位觀察;我們的車載HPC系統(tǒng)的反應速度也要比人類的反應速度要快。因此,我并不認為我們應該期待無人駕駛汽車和人類駕駛汽車的方式一樣。我們可以讓無人駕駛汽車變得安全、有預測能力和更加可靠;但是,它們將會和人類駕駛的汽車不同。作為技術人員,我們必須要有政府和社會的參與,他們的參與不僅可以幫助建立新的法規(guī),而且能有效l了解社會對于這些汽車的新期望。
當然,對于無人駕駛汽車的未來,我們非常樂觀。它將幫助人類節(jié)省大量的時間,以及避免大量的交通事故。我希望全球的科技社群能夠和政府與社會一起,通力合作,早日實現這一美好愿景。
問題三:未來20年的工作會是什么?
如果你是一名50歲的貨車司機,有一天你的工作突然被自動駕駛汽車搶了,你該怎么辦?
其實,我們的社會是很擅長為有技能的人提供機會的, 問題在于30多年累計的經驗技能在一息之間就貶值了。在這種情況下,我們有道德上的義務去幫助這些受影響的個體,獲取新技能和新機會。
幸運的是,隨著MOOCs及其他可快速擴張的教育形式的興起(如 Coursera, Khan Academy, Lynda),我們現在可以用較為實際的成本做到這點。我并不為20年后我們是否會缺少重要的工作崗位而擔心,因為其實有很多人們正在擔任的工作是機器在當下或許在可預見的未來都無法勝任的; 但是我為個體的再教育需求感到擔心。
同時,我認為基礎收入也是有必要的。這樣做可以為個體提供保障措施以及獲取新技能的機會。當今社會以及政治現狀可能還不能接受「毫無緣由地付錢給人們」這個想法。所以,我提議向人們支付薪水,作為他們學習的回報。 這樣,既不會使大家無所事事,又可以有效地引導失業(yè)者去做一些有利于他們重新進入勞動大軍的事情。
我十分喜歡Erik Brynjolfsson和Andrew McAfee寫的 「第二次機器時代」,他們在其中有討論這些問題。
問題四:開啟機器學習職業(yè)生涯最好的方法是什么?
Cousera上的斯坦福大學的機器學習課程就是為了讓更多的人可以開始接觸機器學習而設計的。如果你熟悉基本的編程(通過任何一種語言),我都推薦你從這個課程開始。
很多人通過完成了這門網絡公開課得到了機器學習相關的工作。還有一些其他的類似的課程也很有用;比如約翰霍普金斯的數據科學專家系列。參加Kaggle或者其他的機器學習競賽也幫助很多人獲得了不少經驗。Kaggle有一個帶有在線討論的社區(qū),你可以從中學到很多實用的技巧。參加本地的meetup見面會或學術會議(如果你愿意付這個價錢),還有多和有經驗的人聊聊也很有幫助。
但是最重要的是要堅持學習。不單單是幾個月,而是幾年。
每周六,你都要在是在家里讀論文或實踐算法與看電視之間選擇。如果你整個周六都在工作,短期內也不會有太多回報,而且你現在的老板甚至不會知道,也不會對你說「干得好」。此外,即使一個周六的學習過后,你也不是真的就對機器學習那么在行。但是秘密在于:如果你不僅僅只是一個周末如此,而是堅持這樣學習一年,那么你會變得非常優(yōu)秀。
如今社會對具備機器學習技能的人才有很高的需求;一旦你得到一份機器學習的工作,你的學習只會進步的更快。
世界需要更多的懂得機器學習的人來幫助解決問題。我們的社會有太多的數據和計算資源,(這些使得)機器學習就像有超能力一般,允許你創(chuàng)造令人震驚的東西; 但是現在只是沒有足夠的(懂的機器學習)的我們來做這些事。我希望我的讀者們可以更加努力,學好機器學習。
對這個問題,我們來聽聽Yoshua Bengio的回答:
首先,你要經過基礎的數學和計算機科學的訓練。就深度學習而言,你可以看麻省理工出版社出版的深度學習的書的第一部分(現在網上有電子版,最終麻省理工出版社會出版紙質版)來溫習或者看數學和計算機科學領域最相關的內容。然后你需要閱讀機器學習方面的內容,比如Chris Bishop和 Kevin Murphy的書,Andrew Ng的coursera課程,和Hugo Larochelle關于神經網絡的視頻,然后你在深度學習書的第五部分中總結出許多基本問題。然后你就需要開始練習了,比如自己編寫一些算法,用數據訓練它們,試著參加Kaggle的比賽。試著在優(yōu)化超參數和選擇合適模型方面成為專家,同時繼續(xù)閱讀。如果你對深度學習感興趣,我的書的第二部分會告訴你最基本的算法基礎。此時,你已經有足夠的知識背景積累,可以開始選擇你喜歡的書籍閱讀了。
問題五:Coursera早期時候最有趣的故事是什么?
慕課(MOOCs)從早期創(chuàng)建就與眾不同。
2011年,斯坦福大學推出了三個引人注目的MOOCs,包括機器學習、數據庫和人工智能;也正是這一舉動導致了今天的MOOC運動。人們當時的反應是,「哇,這真的是橫空出世的新鮮事物!」
但是如果你是其中的建造者之一,你就會看到它一步步的發(fā)展歷程,到最后如何實現了「橫空出世」。2011年推出的這個MOOC是我做的第六個在線教育網站。之前的一些都遠不如這一個網站成功,或許你從未聽說過。但是我們從早期的原型中不斷地學習、總結,直到2011年我們成功地建立了這樣實現質變的產品。從 Jennifer Widom和我寫的《現代MOOC的起源》中你可以讀到更多早期的故事(我們倆負責2011年MOOC推出的三門課中的兩門)。
后來,在深度學習中我們也看到了類似的現象。在外行人看來,他們的印象是「哇,這真的是橫空出世的新鮮事物!」(這種類似反應出現在2012年,當時我正負責谷歌大腦計劃,并宣布了貓的研究結果。)但是對于我們中這些為MOOC工作多年的人來說,這種進步真的是一步步取得的。
線性范疇上的指數式進步看起來通常都是一個不連續(xù)的變化過程。在科技領域我們看到了太多這樣的例子。
既然你問了這樣的問題,這里我就講述一個故事:2011年,我與斯坦福大學的四個學生一起工作。我們需要為已經注冊的10萬學生建造新的功能,因此我們的壓力非常大。其中的一名學生(Frank Chen)聲稱另一名學生Jiquan Ngiam經常將他滯留在斯坦福大學的大樓中,知道深夜才讓他搭車會宿舍,因此他沒有別的選擇,只有留下來并繼續(xù)工作。我從來沒有去核實這件事情的真實性。
當面臨該如何支配時間這個問題時,我建議你考慮以下兩個方面:
你正在做的事情是否能夠改變世界
你能夠從中學到多少
即便是今天,這兩個標準也是決定我如何分配時間的標準。
我們現今的社會能夠給你非常多的機會讓你你去改變這個世界。在數字技術和先進通信技術的幫助下,靈感和產品以前所未有的速度進行傳播。擁有一個不錯的想法以及強大的執(zhí)行力,任何人都可以很快的幫助到地球上的很多人。
所以,問問自己:如果你正在做的事情是為了極力追求那些能夠超越你狂熱夢想的成功,那么你也沒有zai很大程度上幫助到其他人?如果不能,那么應該保持探索的心去尋找一些其他的事情來做。而如果恰恰答案是肯定的,那么你就要全力以赴發(fā)揮自己最大的潛能去追求。
第二點,特別是當你還年輕的時候,不要去試圖預估投資在你自己未來教育中的價值。
我定義的「年輕」是任何在100歲以下的人。
任何你所學習的東西都能夠在數十年后給予你回報。但這并不容易。一旦你離開了學校,投資于學習的時間在短時間內幾乎很難看到明顯回報。沒有老師會站在你身后給你一個分數評語或者督促你繼續(xù)用功。但是如果你肯自我激勵或者保持閱讀的習慣,繼續(xù)跟自己的想法較勁,和能夠讓你獲益的人保持溝通,那么在數年之后你可能會成為在特定個人領域學習之中的佼佼者。
拿我自己來說,我喜歡閱讀。我的kindle上有超過1000本的書籍,并且我每天晚上、每個周末都會花費很多時間進行閱讀。我的閱讀范圍包括了學術研究論文、商業(yè)策略、創(chuàng)新過程、產品、我欣賞的人物的自傳,等等。有時我還會參加MOOC課程學習,同時我也非常喜歡與那些能夠教會我新知識的人交談,無論新知還是故交。
學習的過程也會幫助你決定真正該從事什么,當你看到了足夠多的關于別人如何改變世界的實例,你也會得到更多靈感來啟發(fā)自己如何去改變世界。
做一個簡單總結:即使并不容易,但還是應該堅持在學習中探索,同時積極尋找一種能幫助整個人類的事業(yè),并投身其中。
是什么促使你追求人工智能?
我希望我們可以使用人工智能建設一個更好的社會。
就如工業(yè)革命將人類從大量的體力苦工中解放出來(想想你的生活得是個什么樣子,如果你的衣服都需要你自己縫?)在未來,人工智能將會將人類從腦力苦工中解放出來。比如說,有了自動駕駛汽車,就意味著我們不再需要浪費一生中的三年時間在開車上。這將帶給我們更多的時間,用以陪伴所愛之人,以及追求更有價值的目標。
我從16歲時就開始做神經網絡(現在被稱作「深度學習」)。當時我在新加坡國立大學實習。拿今天的標準來看,我們當時做的非常微不足道,但是當時我想幾行代碼就可以讓一個電腦來學習,這件事實在太神奇了!
學霸小爆料:由于當年我們的電腦用emacs太慢,我學會了用vi,并且一直對其有所偏愛使用至今。(譯者注:emacs是一種很古老的文本編輯器。在Unix文化里,Emacs是黑客們關于編輯器之戰(zhàn)的兩大主角之一,它的對手是vi、Vim。)
那段時間,我還做了另外一個實習——辦公室助理,并且做了一大堆復印工作。(技術上來說,我是辦公室助理的助理。)正是在那時,我意識到更聰明的機器可以幫人類做很多事情,這樣人類就可以去做更多在智力上有挑戰(zhàn)的事情。
在接下來的十年里,人工智能將改變社會。它將把我們所做的事情轉變?yōu)槲覀冏岆娔X為我們做的事情。也許在接下來的數十年里,將有人在Quora提出這樣的問題:「如果你不得不自己駕駛汽車,你的生活會是什么樣子?」
當人們向我咨詢自己該去產業(yè)界還是學術界時,我通常建議他們應該先認清自己想做什么。 比如,自己身上的使命是什么?你想為改變世界做些什么?當你對以上問題有了答案時,就自然而然明白自己的心之所向了。
在產業(yè)界工作有這些東西是吸引我的:
為大型項目提供核心資源。人工智能研究是一個對于數據密度、計算資源要求極高的領域。這些資源在企業(yè)里相對容易得到。
團隊意識很強。在團隊工作中,如果不必擔心諸如作者排名或者博士論文發(fā)表數的問題,你會更容易擁有一種團隊意識,也更愿意看到一個集體的成功。
快速決斷力(依公司而定) 。我喜歡在一個高強度的工作環(huán)境中工作,迅速根據需要提供解決方案,無論是搭建一個計算集群還是大量數據的采購。
通過新產品的發(fā)布和產業(yè)服務更直觀地去幫助大量的人。
當然,學術環(huán)境也有它自身的優(yōu)勢:
可以探討任何類型的問題。比如,我之前在斯坦福做過一些教育視頻的工作。一開始并沒有人認為這是「正經」的斯坦福的工作,但后來它發(fā)展成了Coursera (讓Stanford也有受益)。在這里,當我和我的學生想要搭建一個開源的機器人平臺時,我們就會按照自己想的直接去實行。這一切促使了 ROS(Robot Operating System)的產生,一個非常成功的開源平臺。
你可以完全自由得支配自己的學習時間,好幾年都沒有任何科研產出也沒有關系。像類似百度這樣的公司就非常支持員工們的自我學習,鼓勵他們花好幾個月去學習充電,但也不可能讓他們持續(xù)好幾年的時間。
擁有一個學位。在當今的社會擁有一個高等教育的學位是很有幫助的。學校和企業(yè)都善于培養(yǎng)人才,社會只負責甄別人才,無論你的才能是怎么習得的。
對于我而言,讓我振奮的一個使命是構建一個獲取最佳教育資源的普世方法,我認為Coursera就是一條捷徑。我越來越喜歡通過人工智能技術的發(fā)展去幫助成千上萬的人,并且我認為百度是實現這個夢想的平臺。但是也有很多同樣重要的使命,比如傳道授業(yè)、特定領域的投資研發(fā)等,這些我覺得更適合在高校中完成。
深度學習是一個已經在幫助數不清的小組制造了令人興奮的人工智能應用的極棒的工具。它正在幫我們建造自動駕駛汽車,準確的語音識別,能夠理解圖像的電腦,以及很多很多其他的。
在最近的一些進步之外,我還是看到前方有大量的尚未被挖掘出來的機會。在精準農作、消費金融、醫(yī)藥等領域已經出現了很多項目,在這些方面,我看到非常清晰的看到了深度學習大有作為的機會,但是至今卻尚未有人有時間專注其中。所以我對深度學習在近期絕對不會進入「平臺期」很有信心,它會持續(xù)快速增長。
同時深度學習被過度炒作了。因為神經網絡非常專業(yè)而且很難解釋,我們中的很多人過去習慣通過繪制人類大腦的類比圖來解釋它。但是我們其實基本上對生物腦到底是怎么工作的一無所知。加州伯克利大學的Michael Jordan將深度學習稱作生物腦的「卡通版」,即一個對于我們并不了解的東西的大量過度簡化的版本,我同意這個看法。除了在媒體的炒作中,我們離真正造出人類級別的智能還沾不到邊呢。因為我們從根本上就不知道到底人腦是如何工作的,我們試圖盲目地在計算機上復刻我們根本不了解的東西并沒有造出有用的人工智能系統(tǒng)。相反的,當今最有效的深度學習工作是基于計算機科學和工程原則逐漸發(fā)展起來的,最多也就從生物領域獲得了一點點靈感,而不是試圖盲目的抄襲生物。
具體來說,如果你聽到有人說「大腦可以做X。我的系統(tǒng)也做X。因此,我們在建造大腦的路上」,我的建議是立刻掉頭別理他。
很多深度學習使用的思路已經存在了好幾十年了。為什么它現在才開始起飛呢? 兩個主要的推動因素是1)數據規(guī)模;2)計算規(guī)模。鑒于我們的社會在網絡和移動設備上花費了更多時間,在過去的20年里我們一直在快速地積攢數據。也是到了最近我們才搞清楚如何通過大量增加計算來建造可以利用這些海量數據的深度學習算法。
以上已經將我們帶入了兩個加速深度學習進程的正循環(huán):
首先,我們現在有可以吸收海量數據的機器了,數據的價值逐漸清晰。這給獲取更多數據帶來了更大的激勵,與此同時,更多的數據又激勵我們建造更大更快的神經網絡。
其次,我們現在有高速的深度學習裝備,這可以加速創(chuàng)新,并且加速深度學習研究的進度。很多人低估了在計算機系統(tǒng)上的投資對于深度學習的影響。當進行深度學習研究時,我們一開始對哪些算法有效、哪些沒效一無所知,并且我們的工作就是進行一大堆實驗,并且搞清楚到底哪些有效哪些無效。如果我們有一個高效的計算基礎設施,可以讓你可以用一天完成本來需要一周的實驗,那么你的研究進度將要有7倍那么快。
這就是為什么2008 年左右,我在斯坦福的團隊開始支持將深度學習轉移到圖形處理單元(GPU)上(當時這相當的具有爭議;但是現在每個人都這么做);現在我支持轉移到高性能超級計算策略(HPC)來增量深度學習。機器學習應該擁抱高性能計算。這些手段將使得研究者更高效,并且加速我們整個領域的進程。
總結一下:深度學習已經幫助人工智能取得了巨大的進展。但最好的還在未來!
來源:機器學習之心。