說起人工智能你會(huì)想到什么?是《終結(jié)者》中的T-800,《黑客帝國(guó)》中的“矩陣”?還是生產(chǎn)線上的工業(yè)機(jī)器人,頂尖棋手“阿爾法狗”?人類一直希望創(chuàng)造出一種與人類智能類似的機(jī)器,為人提供全方位的服務(wù),這種對(duì)人工智能的幻想和追求從未停止。1936年,英國(guó)數(shù)學(xué)家圖靈首次提出計(jì)算機(jī)構(gòu)想;1946年,世界上第一臺(tái)通用計(jì)算機(jī)在美國(guó)問世;1956年,人工智能的概念首次被提出;1997年,國(guó)際商業(yè)機(jī)器公司研制的“深藍(lán)”計(jì)算機(jī)擊敗世界國(guó)際象棋冠軍;4、2016年、2017年,由谷歌旗下公司研制的阿爾法圍棋上演人機(jī)大戰(zhàn),戰(zhàn)勝人類圍棋世界冠軍......近年來,隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,人臉識(shí)別、語(yǔ)音識(shí)別、自動(dòng)駕駛、遠(yuǎn)程控制,人類的許多幻想變成了現(xiàn)實(shí)。人工智能被視為第四次工業(yè)革命的一個(gè)標(biāo)志,發(fā)達(dá)國(guó)家和眾多的科技公司,紛紛投入巨資展開研發(fā)和布局,我國(guó)也在全力構(gòu)筑人工智能發(fā)展的先發(fā)優(yōu)勢(shì)。十九大報(bào)告明確提出,要“推動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實(shí)體經(jīng)濟(jì)深度融合”。如何在這場(chǎng)技術(shù)革命中搶占先機(jī)?中國(guó)的機(jī)會(huì)在哪里?
嘉 賓 簡(jiǎn) 介
高文,現(xiàn)任中國(guó)工程院院士,北京大學(xué)信息科學(xué)技術(shù)學(xué)院院長(zhǎng),中國(guó)計(jì)算機(jī)學(xué)會(huì)理事長(zhǎng)。四十年前,他還只是一家電冰箱廠的學(xué)徒工,恢復(fù)高考之后,他決心繼續(xù)深造,填報(bào)志愿時(shí),在工廠師傅們的建議下,他選擇了當(dāng)時(shí)大家都感覺“前途無量的”計(jì)算機(jī)專業(yè)。從那時(shí)出發(fā),他見證和參與了中國(guó)計(jì)算機(jī)行業(yè)的高速發(fā)展,見證了人工智能的成長(zhǎng)壯大。他先后主持的國(guó)家級(jí)科研項(xiàng)目達(dá)20多項(xiàng),涉及人工智能、視頻編碼與分析、計(jì)算機(jī)視覺等前沿領(lǐng)域。高文帶領(lǐng)的數(shù)字視頻編解碼技術(shù)國(guó)家工程實(shí)驗(yàn)室,經(jīng)過近十年的潛心研究,憑借完全自主創(chuàng)新,完成了我國(guó)具備自主知識(shí)產(chǎn)權(quán)的第二代信源編碼標(biāo)準(zhǔn)體系,達(dá)到與國(guó)際標(biāo)準(zhǔn)相當(dāng)?shù)乃健?/p>
以下為本次演講的核心內(nèi)容
人類智能就是我們大家都具有的這樣一個(gè)智能。人類智能是從哪里來的?首先是從我們生活和社會(huì)實(shí)踐當(dāng)中來,其次是我們通過語(yǔ)言、文字、印刷傳承下來的智能。所以不要忘了,語(yǔ)言、文字和印刷在人類智能的發(fā)展脈絡(luò)當(dāng)中是非常關(guān)鍵的一個(gè)技術(shù)。根據(jù)現(xiàn)在考古的發(fā)現(xiàn),我們?nèi)祟愔悄苓M(jìn)化到今天,經(jīng)歷了大約三百萬(wàn)年,而人工智能其實(shí)它發(fā)展的歷史并不長(zhǎng),只發(fā)展了63年?,F(xiàn)在一講人工智能,有的人喜歡得不得了,有的人害怕得不得了,為什么會(huì)這樣呢?是因?yàn)榇蠹沂褂玫年P(guān)于人工智能的概念不盡相同。
那么首先到底什么是人工智能?
一、
高開低走、起起落落,人工智能曲折的前半生
人工智能也可以叫人造智能,是由人制造出來,當(dāng)然,它是模仿人的一個(gè)智能。它肯定要通過一個(gè)載體表現(xiàn)出來,這個(gè)載體可以是機(jī)器人,也可以是一臺(tái)計(jì)算機(jī)。人工智能有兩個(gè)很重要的概念,大家不能混淆。一個(gè)概念叫做通用人工智能,或叫強(qiáng)人工智能,就是人工智能的系統(tǒng),如果它的功能、能力和人是一樣的,甚至超過人了,那就叫強(qiáng)人工智能系統(tǒng)。第二個(gè)概念叫專用人工智能,或叫弱人工智能,如果這個(gè)智能系統(tǒng)只能干一件事,盡管可能比人厲害,沒關(guān)系,那它也是弱人工智能。比如說我們現(xiàn)在去乘高鐵,以前還要檢票,現(xiàn)在身份證往那兒一放,刷個(gè)臉你就進(jìn)去了,這就是一個(gè)刷臉人工智能系統(tǒng)。語(yǔ)音識(shí)別也是同樣的道理,不管它做得有多好,比別人強(qiáng)多少,如果它只是這一項(xiàng)功能的話,這就是一個(gè)弱人工智能系統(tǒng)。
1
出身“名門”
1956年被稱作人工智能元年,我們說那是它出生之年。因?yàn)樵?956年,有十位年輕的學(xué)者在美國(guó)的達(dá)特茅斯市搞了一個(gè)暑期研究所。在那個(gè)研究所經(jīng)過兩個(gè)月的討論,就人工智能應(yīng)該干什么、怎么干,進(jìn)行了一番討論,最后寫了一個(gè)報(bào)告,大家公認(rèn)是對(duì)人工智能比較完整的一個(gè)描述。
這十個(gè)人中當(dāng)時(shí)七個(gè)坐在草坪上照了張相,最前面這五個(gè)人是非常厲害的“大?!薄W筮叺乃膫€(gè)都是圖靈獎(jiǎng)的得主,大家知道圖靈獎(jiǎng)是計(jì)算機(jī)界的諾貝爾獎(jiǎng);第四位是諾貝爾獎(jiǎng)獲得者,所以第四位是比較厲害的,他一個(gè)人既得了圖靈獎(jiǎng)、又得了諾貝爾獎(jiǎng);第五位他不用得任何獎(jiǎng),他叫山農(nóng),有的翻譯成香農(nóng),他是信息論的創(chuàng)始人,是我們整個(gè)信息領(lǐng)域的一個(gè)鼻祖。這十個(gè)年輕人在兩個(gè)月期間討論了七個(gè)問題,包括自動(dòng)計(jì)算機(jī)、編程語(yǔ)言、神經(jīng)網(wǎng)絡(luò)、計(jì)算規(guī)模理論,也就是說,做人工智能系統(tǒng)什么樣的計(jì)算機(jī)能做,然后是自我改進(jìn),這就是今天所說的機(jī)器學(xué)習(xí)。然后還有抽象,我們現(xiàn)在所有的大數(shù)據(jù),你把數(shù)據(jù)直接喂進(jìn)去,它是不能處理的,你要把這個(gè)數(shù)據(jù)提煉出來,這就是抽象。然后是隨機(jī)性和創(chuàng)造性,創(chuàng)造性的思維其實(shí)現(xiàn)在的機(jī)器還是做不了。他們當(dāng)時(shí)就把人工智能領(lǐng)域需要研究的問題列了一下,所以這一年被稱為是人工智能的元年。
從1956年到1976年這二十年,人工智能發(fā)展的第一個(gè)階段,主要工作是在模擬大腦是怎么工作的。它這個(gè)模擬不是說信號(hào)級(jí)的模擬,而是在更高層面的、在邏輯推理這個(gè)層面上去模擬大腦。那么用什么辦法來模擬呢?用邏輯推理的手段來模擬?,F(xiàn)在回過頭來看,在人工智能的第一階段,留下來比較珍貴的一個(gè)成果,就是數(shù)學(xué)定理證明。也就是說,用計(jì)算機(jī)自動(dòng)進(jìn)行數(shù)學(xué)定理的證明,一個(gè)是代數(shù)定理證明,一個(gè)是幾何定理證明,都是由兩位華人完成的。一位華人叫王浩,他實(shí)際上是和楊振寧先生同時(shí)代的人,他主要做的是代數(shù)的機(jī)器定理證明;還有一位非常有名的學(xué)者叫做吳文俊,他的幾何定理證明是世界上做得最好的。但是后來發(fā)現(xiàn),僅僅通過模擬人的大腦來實(shí)現(xiàn)人工智能這條路太難走,除了機(jī)器定理證明做得還不錯(cuò)以外,當(dāng)時(shí)第一階段設(shè)定的其它一些目標(biāo)都沒有完成,比方說希望能夠戰(zhàn)勝國(guó)際象棋的國(guó)際冠軍、機(jī)器能夠譜曲等等。實(shí)際上只有數(shù)學(xué)定理證明的這件事完成了,其它都沒有完成。后來整個(gè)人工智能從高潮跌到低谷以后,學(xué)者們就在反思,是不是人工智能走歪路了?技術(shù)方法雖然沒問題,但是不是要做點(diǎn)實(shí)事兒?
2
初露鋒芒
學(xué)者們反思完了以后,他們就說大概需要做一點(diǎn)對(duì)社會(huì)有影響力的系統(tǒng)出來,這樣大家就會(huì)開始認(rèn)可人工智能了。那什么系統(tǒng)行呢?比如說我們能不能做一些醫(yī)療診斷專家系統(tǒng),可以代替醫(yī)生診斷疾病。有了這樣一些方向以后,根據(jù)剛才的邏輯推理,用這種方法去做專家系統(tǒng)。比如說心理咨詢專家系統(tǒng),一個(gè)人有了抑郁癥或者處于抑郁癥前期,他有心理負(fù)擔(dān)的時(shí)候,并不愿意去找醫(yī)生或者朋友說,但如果是計(jì)算機(jī),他就可以說了,所以用計(jì)算機(jī)做一個(gè)這樣的系統(tǒng)進(jìn)行心理咨詢,可能會(huì)有用。
又比如說像故障診斷,最好把那些有限的專家的知識(shí),把它抽取出來做成一個(gè)系統(tǒng),然后放到計(jì)算機(jī)里。這個(gè)計(jì)算機(jī)可以到現(xiàn)場(chǎng),直接代替專家去做一些故障診斷,這是一條技術(shù)路線;另外一條技術(shù)路線,就是模擬神經(jīng)系統(tǒng)來做專家系統(tǒng)。第二條技術(shù)路線在哪些領(lǐng)域是比較有效呢?比如說字符識(shí)別、文字識(shí)別。以前寄一張明信片,寄一封信,前面都要寫郵政編碼,那個(gè)郵政編碼最開始是用人去分揀的,需要耗費(fèi)很多人力。后來就想能不能用機(jī)器自動(dòng)識(shí)別、自動(dòng)分揀,后來發(fā)現(xiàn)用神經(jīng)網(wǎng)絡(luò)做這個(gè)效果不錯(cuò),包括今天我們的語(yǔ)音識(shí)別,這些東西基本上都是走神經(jīng)網(wǎng)絡(luò)這條技術(shù)路線的。所以這兩條技術(shù)路線就導(dǎo)致在第二次人工智能發(fā)展專家系統(tǒng)的這三十年,其實(shí)真是百花齊放。
但是到了2006年,人工智能又在慢慢跌落,因?yàn)楫?dāng)時(shí)專家系統(tǒng)雖然做了很多,好用的卻不太多,大部分都是演示還不錯(cuò),真的上線去用的時(shí)候效果不那么好。因?yàn)楹芏嗷谶壿嬐评淼膶<蚁到y(tǒng),實(shí)際上還是把人的知識(shí)做成規(guī)則放進(jìn)計(jì)算機(jī),因?yàn)槭峭ㄟ^一問一答的方式把東西提煉出來,但可能會(huì)忘一些東西。實(shí)際上,它會(huì)遇到這個(gè)情況,人剛好把這個(gè)東西忘了,我們把它叫作“掛一漏萬(wàn)”,這個(gè)系統(tǒng)就有點(diǎn)問題了,就是我們經(jīng)常說的“不堪大用”。專家系統(tǒng)又開始熱度降低,一直到2006年發(fā)生了一件大事。
那一年一下爆出了至少三篇重量級(jí)的文章,一下子轟動(dòng)了做人工智能的這個(gè)圈子。
3
突飛猛進(jìn)
這三篇重量級(jí)的文章是誰(shuí)寫的呢?就是圖上這三個(gè)人。第一個(gè)人叫辛頓,多倫多大學(xué)的教授,最能坐冷板凳的,研究神經(jīng)元網(wǎng)絡(luò)研究了一輩子,從最開始到成名就做這一件事;第二個(gè)人叫楊立昆,他不是中國(guó)人,他是美國(guó)人,是紐約大學(xué)的教授;第三位叫本杰奧,他是蒙特利爾大學(xué)的教授。這三個(gè)人在2006年幾乎同時(shí)發(fā)了三篇重量級(jí)的文章,從不同的角度闌述了深度神經(jīng)網(wǎng)絡(luò)是可以起大作用的,是可以進(jìn)行大規(guī)模學(xué)習(xí)訓(xùn)練的,只要輸入的數(shù)據(jù)好,它就可以解決問題。換句話來說,我們今天人工智能的原型系統(tǒng),很多人說就是神經(jīng)系統(tǒng)。
那什么是神經(jīng)系統(tǒng)?有一些我們叫做神經(jīng)元,就是圖片中那個(gè)紅的、最中間那個(gè)核叫神經(jīng)元。那邊上綠的連進(jìn)去的那些呢,我們把很多這種輸入叫突觸。然后它也有輸出,那么我們現(xiàn)在要做的就是輸入、輸出和中間這個(gè)神經(jīng)元,是不是有辦法用數(shù)學(xué)把它模擬出來,或者說用數(shù)學(xué)把它描述出來,這個(gè)數(shù)學(xué)模型是有辦法構(gòu)建的。有了這個(gè)數(shù)學(xué)模型,這是一個(gè)神經(jīng)元,神經(jīng)元可以是一層的,也可以是N層的。所以有了數(shù)學(xué)模型以后,你就可以構(gòu)造出這樣的一個(gè)系統(tǒng)來,這樣一個(gè)網(wǎng)絡(luò)來。有了這個(gè)網(wǎng)絡(luò),你就可以通過演算,模擬仿真這樣一個(gè)系統(tǒng)了。所以實(shí)際上,現(xiàn)在我們所說的這個(gè)深度神經(jīng)網(wǎng)絡(luò),或者今天的人工智能系統(tǒng),它的原型就是這個(gè)原型。
剛才我說的2006年那三位很有名的人發(fā)表了論文以后,大家先是高興了一下,但是后面怎么樣,那要看這個(gè)東西能解決什么問題,摸索了幾年小有收獲,但是并沒有說,哇!這東西這么厲害。一直到2010年以后這件事才發(fā)生,和兩個(gè)中國(guó)人有關(guān)系。一位是斯坦福大學(xué)的華裔女教授,叫李飛飛,另外一位是普林斯頓大學(xué)的華人教授,叫李凱。他們兩個(gè)在2009年就是想弄一個(gè)規(guī)模特別大的圖像數(shù)據(jù)庫(kù),而且標(biāo)注出來,然后就拿這個(gè)數(shù)據(jù)庫(kù)比賽。當(dāng)時(shí)很多大學(xué)、公司都派代表隊(duì)去比賽,那時(shí)候比賽比誰(shuí)做的系統(tǒng)錯(cuò)誤率比較低。2010年的時(shí)候,成績(jī)最好的隊(duì)是28%的錯(cuò)誤率,下一年是26%的錯(cuò)誤率。2012年的時(shí)候有了一個(gè)突破,錯(cuò)誤率從26%一下子降到16%,性能一下子就提高了十個(gè)百分點(diǎn)。所有的人都很吃驚,說你到底用了什么招,你怎么能進(jìn)展得這么快。這個(gè)參賽的領(lǐng)隊(duì)是一個(gè)學(xué)生,說我也沒用什么特殊的招,我就用了我老師給我的那個(gè)東西做了個(gè)網(wǎng),然后就用這個(gè)網(wǎng)來參加比賽,沒有什么,那東西我老師都發(fā)表過。那么他老師是誰(shuí)呀?就是剛才說的那個(gè)辛頓,辛頓的學(xué)生拿著辛頓的這個(gè)東西來參加比賽,2012年第一次就打敗了所有的對(duì)手,這是一個(gè)很了不得的大進(jìn)展。
到了2013年的時(shí)候,就是深度網(wǎng)絡(luò)一統(tǒng)天下的時(shí)候了,全是這個(gè)技術(shù),沒有別的,剩下就是使用多深的網(wǎng),有多少個(gè)節(jié)點(diǎn),參數(shù)怎么設(shè)定,這就變成了一些技巧性的東西,而不是方法上的革命了。所以這就是為什么說神經(jīng)元網(wǎng)絡(luò)突然一夜一統(tǒng)天下,開的都是神經(jīng)元網(wǎng)絡(luò)的花了。
到2015年有一個(gè)革命性的突破,它的錯(cuò)誤率變成了3.6%,3.6%是什么概念?人的平均錯(cuò)誤率是5%,這個(gè)系統(tǒng)的錯(cuò)誤率3.6%,超過人了。在圖像分類這件事上,神經(jīng)元網(wǎng)絡(luò)已經(jīng)超過了人,那這事是誰(shuí)做的呢?是一位中國(guó)人做的。我們中國(guó)有一位學(xué)者叫做孫劍,孫劍他當(dāng)時(shí)帶了一個(gè)團(tuán)隊(duì),提出了一個(gè)網(wǎng)絡(luò),叫做殘差網(wǎng)絡(luò)。他拿這個(gè)殘差網(wǎng)絡(luò)去比賽,一舉拿了個(gè)第一名。而且這個(gè)殘差網(wǎng)絡(luò),不僅是在圖像分類比賽里面拿了第一名,圍棋比賽里面它仍然是最厲害的。大家都知道AlphaGo,它和李世石下的那五盤棋,它輸了一盤,回去以后課題組就推演一下,復(fù)了一下盤,想弄清楚輸?shù)脑?,結(jié)果發(fā)現(xiàn)是李世石走了一步棋譜上沒有的棋。也就是說,每次AlphaGo和人下棋,如果人每次都走棋譜上沒有的棋,那人就有很大的勝算。
那到底有多少棋是當(dāng)時(shí)棋譜上沒有的呢?后來他們一算,當(dāng)時(shí)訓(xùn)練AlphaGo這個(gè)機(jī)器的棋譜占所有可能棋譜的20%。也就是說,當(dāng)時(shí)的AlphaGo如果和人下棋,如果這個(gè)棋手他腦子真的夠用,能記住哪步棋是棋譜里沒有的話,那么他就有80%的概率獲勝,這是很大的一個(gè)概率。
所以回去以后他們就說這不行,這個(gè)太容易被人擊破了,怎么辦呢?他們要重新設(shè)計(jì)AlphaGo的網(wǎng)絡(luò),然后他們就把原來的網(wǎng)絡(luò)重新設(shè)計(jì)、提升,就是使用孫劍他們提出的殘差網(wǎng)絡(luò)。AlphaGo經(jīng)過重新設(shè)計(jì),從AlphaGo變成了Alphazero以后,那一個(gè)系統(tǒng)和人類棋手下棋就從來沒輸過,因?yàn)樗阉械钠遄V上沒有的棋全都生成出來,然后用一個(gè)完整的數(shù)據(jù)訓(xùn)練了系統(tǒng)。
在下圍棋這件事上,應(yīng)該說深度網(wǎng)絡(luò)已經(jīng)把這個(gè)問題解決掉了。基于這樣的一個(gè)情況,我們對(duì)人工智能的判斷,基本上可以這樣講,在深度網(wǎng)絡(luò)適合的那一些弱人工智能領(lǐng)域,人工智能可以廣泛進(jìn)行應(yīng)用、研究,做產(chǎn)品、做產(chǎn)業(yè)化。
二、
促進(jìn)與約束,人工智能如何繼續(xù)健康成長(zhǎng)?
1
從感知到認(rèn)知,智能更上一層樓
人工智能在智能水平上,它的感知智能日益成熟。我們可以把智能分成感知智能、認(rèn)知智能和決策智能,所謂的感知智能就是和我們感官直接相連的這些智能,比如說眼睛看的、耳朵聽的、手摸的等等,這些方面其實(shí)弱人工智都可以做得非常好。現(xiàn)在不管你是刷臉,還是語(yǔ)音識(shí)別,甚至機(jī)器翻譯,識(shí)別一個(gè)病例,識(shí)別一個(gè)產(chǎn)品有沒有殘次等等,這些方面都發(fā)展得非常好,人工智能正在慢慢地從一般的感知智能向認(rèn)知智能進(jìn)行升級(jí)。
2
類腦計(jì)算和量子計(jì)算,兩條突破之路
如果做更大規(guī)模的或者和認(rèn)知有關(guān)的人工智能產(chǎn)品,或者我們想做強(qiáng)人工智能,靠現(xiàn)有的計(jì)算機(jī)是做不到的,那怎么辦呢?就要尋找出路,可能的出路有兩個(gè):在技術(shù)路線上面,一個(gè)出路叫做類腦智能。人其實(shí)還是很厲害的,我們一天消耗的能量,相當(dāng)于一個(gè)20瓦燈泡的能量,但是我們要干的事,可是比一個(gè)巨型計(jì)算機(jī)還要厲害。人對(duì)信息處理的能效比非常之高,但現(xiàn)在的計(jì)算機(jī)不行,能效比太低了。我們就希望能找一個(gè)能效比更高一點(diǎn)的機(jī)器來做這件事,類腦計(jì)算能效比可能較高一些。另一個(gè)可能的技術(shù)途徑就是量子計(jì)算。量子計(jì)算的能效比也極高,所以把量子計(jì)算做成比較穩(wěn)定的一個(gè)系統(tǒng)也是有可能的。當(dāng)然不管是類腦計(jì)算還是量子計(jì)算,現(xiàn)在還有很大的不確定性,到底什么時(shí)候能夠做出來,像今天的計(jì)算機(jī)這么穩(wěn)定、可靠、低價(jià),這個(gè)還是需要去做很多研究的積累。
3
人與機(jī)器,混合智能具備獨(dú)特優(yōu)勢(shì)
在智能形態(tài)方面,越來越多的是人和計(jì)算機(jī)混合在一起的,我們叫人機(jī)混合智能。比如說,你想做一個(gè)純粹把人100%甩在環(huán)外的無人駕駛系統(tǒng),其實(shí)是非常難的,但如果人介入一下,很多問題解決起來就簡(jiǎn)單很多了。機(jī)器能做的事交給機(jī)器去做,如果機(jī)器做得不那么好的事,人就可以介入一下。這樣的人機(jī)混合智能,可能是現(xiàn)階段發(fā)展人工智能一個(gè)比較重要的技術(shù)途徑。
4
應(yīng)用先行,有助于技術(shù)發(fā)展
以前做研究,大部分是先把技術(shù)都做好,然后去轉(zhuǎn)化技術(shù),去做應(yīng)用,而現(xiàn)在是靠應(yīng)用去拉動(dòng)技術(shù)發(fā)展,這條路也是人工智能非常重要的一個(gè)發(fā)展形態(tài)。深度神經(jīng)網(wǎng)絡(luò)出來的時(shí)候,在哪兒好用,不知道,最后幸虧辛頓的學(xué)生拿這個(gè)東西去參加圖像網(wǎng)絡(luò)的比賽。如果不是參加那個(gè)比賽,可能這個(gè)深度神經(jīng)網(wǎng)絡(luò)的熱潮,說不定還會(huì)再拖一些年才到來,所以說,就是你要找一個(gè)很好的應(yīng)用場(chǎng)景把它用起來。
5
未雨綢繆,防止技術(shù)失控
人工智能它不像別的技術(shù),它有社會(huì)屬性,這也是為什么前一段時(shí)間有很多爭(zhēng)論說,我們以后會(huì)不會(huì)被機(jī)器、人工智能奴役、擺布?我們會(huì)不會(huì)這樣?這個(gè)社會(huì)屬性,恰恰是我們做人工智能的時(shí)候要非常認(rèn)真對(duì)待的一個(gè)問題,如果你不認(rèn)真對(duì)待,可能就會(huì)吃大苦頭?,F(xiàn)在其實(shí)已經(jīng)有幾個(gè)例子:波音737 MAX 8,波音公司對(duì)人工智能怎么用或者對(duì)無人駕駛怎么用,就太大意。那兩架掉下來的飛機(jī),駕駛員拼命和飛機(jī)搏斗,要往上拉,就是拉不起來,結(jié)果飛機(jī)就一頭兒栽下來了。這里頭它錯(cuò)在哪兒?人機(jī)混合系統(tǒng),人是最關(guān)鍵的,所以在這個(gè)環(huán)節(jié)里面,你不能讓機(jī)器跑到人前面去了,這就犯錯(cuò)了。所以我們說,在人工智能的社會(huì)屬性這方面,一定要擺正人和智能系統(tǒng)它們之間的關(guān)系。其實(shí)對(duì)將來人工智能到底能干什么,不能干什么,我們現(xiàn)在可能就要不停地去做這種研究、立法,從法律上面就給它約束好。所有的技術(shù)都是這樣,一定有它的好的一面和壞的一面,要防止壞的一面發(fā)生,要通過法律、道德規(guī)范等手段去約束它。
從2013年起,世界各國(guó)政府紛紛調(diào)研人工智能對(duì)社會(huì)、經(jīng)濟(jì)可能帶來的顛覆性影響,相繼發(fā)布符合自身國(guó)情的人工智能戰(zhàn)略。2016年,美國(guó)連續(xù)發(fā)布《國(guó)家人工智能研究與發(fā)展戰(zhàn)略計(jì)劃》等三份重要報(bào)告;2017年3月份,日本發(fā)布《人工智能技術(shù)戰(zhàn)略》報(bào)告,闡述了日本人工智能產(chǎn)業(yè)化發(fā)展路線圖;10月份,英國(guó)政府發(fā)布了《在英國(guó)發(fā)展人工智能》報(bào)告,旨在推動(dòng)英國(guó)成為全球人工智能領(lǐng)導(dǎo)者;2018年4月,歐盟委員會(huì)也發(fā)布政策文件《歐盟人工智能》,提出將采取三管齊下的方式推動(dòng)歐洲人工智能的發(fā)展。如今,全球人工智能正處于加速發(fā)展階段,世界主要國(guó)家都對(duì)人工智能進(jìn)行系統(tǒng)性布局,目標(biāo)直指第四次工業(yè)革命的全球競(jìng)爭(zhēng),在這場(chǎng)事關(guān)未來的技術(shù)革命中,我們的機(jī)會(huì)在哪里??jī)?yōu)勢(shì)和短板分別是什么?
三、
中國(guó)人工智能的發(fā)展的優(yōu)勢(shì)與差距
人工智能總體上來說,在我們國(guó)家是非常受重視,從三個(gè)方面來看看中國(guó)在人工智能發(fā)展的一些大的情況。
1
我國(guó)已經(jīng)成為人工智能領(lǐng)域的超級(jí)大國(guó)之一
第一個(gè)方面,我們整體來說,這些年中國(guó)人工智能到底是怎么樣的一個(gè)狀況?改革開放以后,我們國(guó)家在基礎(chǔ)研究方面的投入巨大,人工智能的發(fā)展有了非常好的沉淀。
第二個(gè)方面,一些核心關(guān)鍵技術(shù),中國(guó)應(yīng)該說已經(jīng)走在了世界的前列。比如說人臉識(shí)別技術(shù)、語(yǔ)音識(shí)別技術(shù),這兩項(xiàng)技術(shù)全世界都公認(rèn)中國(guó)是做得最好的。
第三個(gè)方面,中國(guó)人工智能,它的發(fā)展和各行各業(yè)的結(jié)合越來越緊密,從互聯(lián)網(wǎng)往各行各業(yè)都在開始推廣和滲透。對(duì)于中國(guó)來講,人工智能的應(yīng)用,比世界任何一個(gè)國(guó)家都做得更好。
第四個(gè)方面,人工智能發(fā)展的創(chuàng)新生態(tài)環(huán)境已經(jīng)初步形成。比如說科技部已經(jīng)布局了五個(gè)開放平臺(tái),包括百度的無人駕駛、阿里的城市大腦、騰訊的智能醫(yī)療、科大迅飛的語(yǔ)音識(shí)別、商湯的圖像與視頻處理。
第五個(gè)方面,我們國(guó)家在全球人工智能整個(gè)這個(gè)領(lǐng)域,占有的位勢(shì)非常重要。基本上美國(guó)和中國(guó),在人工智能領(lǐng)域就是兩個(gè)超級(jí)大國(guó)。美國(guó)可能在基礎(chǔ)研究方面強(qiáng)一些,中國(guó)可能在應(yīng)用方面強(qiáng)一些。全世界在2017年對(duì)人工智能企業(yè)的投入,中國(guó)一家占了48%,那么美國(guó)只有百分之三十幾。2017年、 2018年中國(guó)人工智能的專利總數(shù)都超過美國(guó)和日本。
2
四大優(yōu)勢(shì)護(hù)航中國(guó)人工智能發(fā)展
中國(guó)發(fā)展人工智能有四個(gè)優(yōu)勢(shì):
第一個(gè)優(yōu)勢(shì)是政策優(yōu)勢(shì)。人工智能現(xiàn)在已經(jīng)被列為整個(gè)中國(guó)優(yōu)先發(fā)展的領(lǐng)域,所以我們有非常好的政策優(yōu)勢(shì)。
第二個(gè)優(yōu)勢(shì)是海量數(shù)據(jù)資源的優(yōu)勢(shì)。我們國(guó)家人口是美國(guó)的四倍多;手機(jī)群體全球最大,用手機(jī)做支付也是全球最大;在醫(yī)院里面看病、在旅游、在物流方面,所有這些數(shù)據(jù)都是全世界規(guī)模最大的。這就是在應(yīng)用方面,任何一個(gè)國(guó)家都和中國(guó)沒法比的一個(gè)主要原因。
第三個(gè)優(yōu)勢(shì)是應(yīng)用場(chǎng)景的優(yōu)勢(shì)。因?yàn)槲覀兪前l(fā)展中國(guó)家,從農(nóng)業(yè)社會(huì)到工業(yè)社會(huì),現(xiàn)代社會(huì)發(fā)展的時(shí)間非常短。所以很多東西,基礎(chǔ)設(shè)施都沒有到位,但是恰恰給人工智能的應(yīng)用提供了一些深的場(chǎng)景。比如說我們城市化,原來就是一個(gè)鄉(xiāng)鎮(zhèn),突然就變成城市了。那里很多基礎(chǔ)設(shè)施都不行,要改造成一個(gè)完全城市的基礎(chǔ)設(shè)施架構(gòu)的話,那你得花時(shí)間,拿錢來吧。但是很多東西,其實(shí)如果人工智能介入進(jìn)去,它的服務(wù)一下就上來了,多快好省?,F(xiàn)在老齡化非常嚴(yán)重,社會(huì)服務(wù)哪里來?就要靠人工智能系統(tǒng)來做,比如說醫(yī)療、教育。所以像這樣一些民生的問題,有人工智能進(jìn)來以后,都可以快速得到解決。
第四個(gè)優(yōu)勢(shì)是青年人才優(yōu)勢(shì)。我們的大學(xué)毛入學(xué)率現(xiàn)在已經(jīng)接近40%了,而且中國(guó)有一個(gè)特點(diǎn),學(xué)理工科的比例很高。不像西方發(fā)達(dá)國(guó)家,它們國(guó)家毛入學(xué)率高了以后,很多學(xué)生學(xué)的是法律,學(xué)的是文科,學(xué)工科的比例很低。那這些學(xué)生將來都可以成為我們做人工智能的系統(tǒng)工程師,這個(gè)是一個(gè)非常大的儲(chǔ)備庫(kù)。而且這個(gè)儲(chǔ)備庫(kù)不是光講一講,因?yàn)檫@些年包括國(guó)家自然科學(xué)基金委員會(huì),專門給人工智能設(shè)立了一個(gè)一級(jí)學(xué)科代碼,專門有一類,很多年輕人都可以申請(qǐng)到人工智能的項(xiàng)目,所以高校里面的年輕老師拿項(xiàng)目沒那么困難?,F(xiàn)在你要看大的國(guó)際會(huì)議或者是最頂級(jí)的人工智能的國(guó)際雜志,基本上有一半的投稿人和參會(huì)者是中國(guó)的年輕人。
3
四個(gè)薄弱環(huán)節(jié)急需加強(qiáng)
我們也有一些短板,我們還有四個(gè)薄弱環(huán)節(jié):第一個(gè)薄弱環(huán)節(jié),我們?cè)诨A(chǔ)理論和原創(chuàng)算法這方面,我們得老老實(shí)實(shí)承認(rèn),還是有差距的。一個(gè)原因本身我們起步就晚,是后來者,好多的積累還是不夠;另外加上這些年我們發(fā)展的速度比較快,蘿卜快了不洗泥。對(duì)到底誰(shuí)做得好、誰(shuí)做得不好,有一些非常簡(jiǎn)單粗暴的人才評(píng)估體系,比如說就數(shù)你發(fā)了多少論文,拿了多少科研項(xiàng)目,對(duì)于那些長(zhǎng)期做基礎(chǔ)研究、肯坐冷板凳的人,客觀上是不鼓勵(lì)的?,F(xiàn)在這個(gè)情況正在改觀,一個(gè)是國(guó)家在加大投入,大學(xué)里面給年輕人的待遇越來越好;另外我們很多有實(shí)力的企業(yè)自己成立了研究院,在里面養(yǎng)了一批很強(qiáng)的年輕人,這些人工資給得很高。所以我相信再過五到十年,中國(guó)在人工智能方面的基礎(chǔ)理論和算法一點(diǎn)都不會(huì)弱。
第二個(gè)短板是在高端器件方面,比如說利用GPU(圖形處理器)做深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練的這個(gè)芯片GPU(圖形處理器)芯片,目前英偉達(dá)(NVIDIA)一家公司就占了70%的市場(chǎng)份額。中國(guó)真正自己的GPU(圖形處理器)的生產(chǎn)廠商占的份額,還是比較低的。
第三個(gè)短板就是我們?nèi)狈τ杏绊懙娜斯ぶ悄艿拈_源開放平臺(tái)。人工智能這幾年能夠發(fā)展這么快,和開源開放關(guān)系很密切?,F(xiàn)在最好的算法有很多都開放了,源程序都在網(wǎng)絡(luò)上,你從網(wǎng)上下載下來以后,根據(jù)你自己的應(yīng)用稍微修改一下,馬上你就可以做一個(gè)?,F(xiàn)在我們經(jīng)常講笑話說,高中生可以和教授做同樣水平的工作。但是最有影響的前五個(gè)平臺(tái),都是美國(guó)的企業(yè),包括谷歌、亞馬遜、微軟、國(guó)際商業(yè)機(jī)器公司、臉書,這是五個(gè)人工智能開源開放做得最好的平臺(tái)。
第四個(gè)短板是高端人才我們比較少。所以有統(tǒng)計(jì)說,中國(guó)最頂級(jí)的做人工智能的高端人才數(shù)量只相當(dāng)于美國(guó)的20%,什么時(shí)候我們的高端人才數(shù)量和他們差不多了,我們的人工智能發(fā)展就基本上到位了。
四、
第四次工業(yè)革命,我們?cè)撊绾尾季治磥恚?/strong>
未來已來,到底是哪一個(gè)未來到來了?我們來簡(jiǎn)單地預(yù)測(cè)一下。
先看過去三十年,這是一個(gè)變化非常大、非??斓娜?。第一個(gè)是計(jì)算機(jī)的算力,就是我們說的CPU,手機(jī)里核心處理器或者電腦里核心處理器,芯片的算力增強(qiáng)了一百萬(wàn)倍;第二個(gè)是存儲(chǔ),三十年前的臺(tái)式機(jī)和今天的臺(tái)式機(jī)里面的存儲(chǔ)器相差了差不多一百萬(wàn)倍;第三個(gè)就是通信的速度增加了一百萬(wàn)倍,這個(gè)我們得益于光纖通信,得益于無線通信的發(fā)展。這三個(gè)一百萬(wàn)倍,使得過去的三十年我們周圍的整個(gè)生活、社會(huì)、學(xué)習(xí)都發(fā)生了天翻地覆的變化。所以說下一次的工業(yè)革命將會(huì)在我們這些人的眼皮底下發(fā)生,那么大概是什么時(shí)間呢?在2030年到2040年之間會(huì)發(fā)生下一次工業(yè)革命。當(dāng)然正確的時(shí)間和定義,那時(shí)候說不出來,可能要等到2050年、2060年,才能回過頭說,那個(gè)時(shí)間點(diǎn)應(yīng)該是第四次工業(yè)革命的起點(diǎn)。那么題目是什么?我個(gè)人的猜測(cè),下一次工業(yè)革命的題目就是人工智能。人工智能將是未來一個(gè)世紀(jì)的核心技術(shù),要想把人工智能發(fā)展好,我們就需要在很多事上進(jìn)行一些好一點(diǎn)的布局。
1
國(guó)家戰(zhàn)略、人才高地、基礎(chǔ)建設(shè)、立法保障,一個(gè)都不能少
第一個(gè)是人工智能要作為一個(gè)全局的發(fā)展戰(zhàn)略來布局,不管是國(guó)家、地方、企業(yè),都應(yīng)該把人工智能放在最重要的一個(gè)戰(zhàn)略位置上。
第二個(gè)是怎么樣健全人工智能的國(guó)家研發(fā)體系,這是今后人工智能發(fā)展很重要的一個(gè)布局。
第三個(gè)就是人才培養(yǎng),必須要形成一些人工智能的人才高地。美國(guó)在人工智能發(fā)展的初期,其實(shí)它是有幾個(gè)高地的,比如說斯坦福大學(xué)是一個(gè)高地,卡耐基梅隆大學(xué)是一個(gè)高地,MIT(麻省理工學(xué)院)和貝爾實(shí)驗(yàn)室那一帶也是一個(gè)高地,這幾個(gè)高地的形成,最后帶動(dòng)整個(gè)美國(guó)的人工智能理論和算法的發(fā)展。中國(guó)也應(yīng)該形成幾個(gè)人工智能人才高地,這樣才有利于人工智能的發(fā)展。
第四個(gè)就是要加強(qiáng)智能化基礎(chǔ)設(shè)施的建設(shè),推動(dòng)公開數(shù)據(jù)的開放、共享,這個(gè)也非常關(guān)鍵。這一輪的人工智能,主要是弱人工智能,如果你沒有非常好的數(shù)據(jù),你就談不上人工智能,數(shù)據(jù)才是最核心的。但是為什么和政府相關(guān)的人工智能卻起不來呢?因?yàn)樗莻€(gè)數(shù)據(jù)要么不放出來,要么它只放出來非常窄的數(shù)據(jù)。怎么樣能讓做人工智能應(yīng)用的企業(yè)和團(tuán)隊(duì),既能用到這些數(shù)據(jù),同時(shí)這些數(shù)據(jù)又不失去它的隱私權(quán)、安全性等等,這就要平衡好這些東西。所以說,數(shù)據(jù)的開放共享,要制定出相應(yīng)的一些法律法規(guī),要有一些辦法、工具可以操作。在這個(gè)前提下,一定要把數(shù)據(jù)盡快放出來,讓相關(guān)企業(yè)用這些數(shù)據(jù)去做應(yīng)用。
第五個(gè)就是人工智能法律倫理問題的研究應(yīng)該要加強(qiáng),要引導(dǎo)人工智能安全可控發(fā)展。另外一個(gè),就是要深化國(guó)際開放合作,要主動(dòng)參與全球的人工智能的治理。
2
數(shù)據(jù)處理、開源平臺(tái)、應(yīng)用場(chǎng)景,三個(gè)抓手要記牢
怎么樣才能夠真正地把人工智能的這些應(yīng)用向各行各業(yè)賦能?抓手是什么?我覺得人工智能的抓手無非是三個(gè)方面:
一個(gè)是數(shù)據(jù)。沒有數(shù)據(jù),現(xiàn)在的弱人工智能都沒法做。你要怎么樣去把數(shù)據(jù)組織起來、清洗出來,另外再加上一些安全保護(hù)等等,所以數(shù)據(jù)是一個(gè)非常關(guān)鍵的抓手,我認(rèn)為是排在第一位的。
第二位就是開源平臺(tái)。作為一個(gè)人工智能大國(guó),你應(yīng)該要做出自己的貢獻(xiàn),所以基本上也會(huì)有一些有影響的平臺(tái)出來,那樣才能與你這個(gè)人工智能大國(guó)的身份相稱,就是開源平臺(tái)需要發(fā)展起來。
第三個(gè)就是應(yīng)用場(chǎng)景?,F(xiàn)在絕大多數(shù)都是投資驅(qū)動(dòng)的應(yīng)用場(chǎng)景,這個(gè)不夠,政府必須要把優(yōu)先發(fā)展的領(lǐng)域想清楚,通過市場(chǎng)經(jīng)濟(jì)就能做起來的事,那就交給市場(chǎng)去做;需要政府的手介入、干預(yù)才能做好的事,政府就要果斷地開始去培育、去干預(yù),而且要有手段。比如說網(wǎng)上有太多開源平臺(tái),到底哪個(gè)好用,針對(duì)哪個(gè)應(yīng)用最合適,其實(shí)你讓企業(yè)自己去做決定,他是不知道的。所以最好要有一些有經(jīng)驗(yàn)的人,帶著問題、技術(shù)和他們?nèi)ミM(jìn)行對(duì)話,一直給它扶上馬、送一程,然后這個(gè)應(yīng)用就算成了。所以必須要抓應(yīng)用場(chǎng)景,抓這種賦能,這是非常關(guān)鍵的一個(gè)步驟。我們需要做的就是要發(fā)揮各方的主觀能動(dòng)性,我們齊心協(xié)力把現(xiàn)在中國(guó)人工智能發(fā)展的短板補(bǔ)上,這個(gè)就是我們最需要采取的一個(gè)行動(dòng)。在這個(gè)基礎(chǔ)上,我們和全世界的人工智能同步推進(jìn),去迎接第四次工業(yè)革命、智能時(shí)代的工業(yè)革命曙光的到來。
聯(lián)系客服