人類的勝利
2016年3月9日,Google(或者叫Alphabet)公司開發(fā)的具有“深度思維”的下圍棋機(jī)器人AlphaGo在同世界著名選手李世石的對局中,中盤獲勝,成為第一個(gè)戰(zhàn)勝圍棋世界冠軍的機(jī)器人,這是繼1997年IBM深藍(lán)戰(zhàn)勝卡斯帕羅夫后,人類在機(jī)器智能領(lǐng)域取得的又一個(gè)里程碑性質(zhì)的勝利。至于為什么這兩件事情前后差了近20年的時(shí)間,因?yàn)閷C(jī)器來講,下圍棋要比下象棋難得多,如果從計(jì)算量上量化一下它們的差距,大約相差10的六次方到10的九次方倍,如果我們?nèi)∫粋€(gè)平均數(shù),大約是一億倍左右(至于怎樣確定是10的六次方到10的九次方,在我的新書里會講)。當(dāng)然,還有一個(gè)因素就是計(jì)算機(jī)科學(xué)家開始認(rèn)真研究圍棋算法要比研究國際象棋晚很多。這樣,計(jì)算機(jī)的兩次獲勝相差了20年。
從計(jì)算機(jī)發(fā)展的角度看,智能機(jī)器在所有棋類戰(zhàn)勝人類其實(shí)只是一個(gè)時(shí)間的問題,因?yàn)闄C(jī)器運(yùn)算能力的提升是指數(shù)增長的,而人類智力的提升能做到線性增長就不錯了,因此一定存在一個(gè)時(shí)間點(diǎn),很多人原先估計(jì)圍棋戰(zhàn)勝人類的職業(yè)棋手需要再等十年,但是去年底Google提前實(shí)現(xiàn)了這個(gè)目標(biāo),這有點(diǎn)出乎人的預(yù)料,當(dāng)然這次戰(zhàn)勝李世石更出乎人們的預(yù)料。
至于計(jì)算機(jī)是如何戰(zhàn)勝人類的,我其實(shí)在很多次公開的講座中已經(jīng)講到,機(jī)器獲得智能的方式和人類不同,它不是靠邏輯推理,而是靠計(jì)算。具體講這里面有兩個(gè)關(guān)鍵的技術(shù),首先是一整套把棋盤上當(dāng)前的狀態(tài)變成一個(gè)獲勝概率的數(shù)學(xué)模型,當(dāng)然,這件事沒有大數(shù)據(jù)是做不到的。AlphaGo在短短的時(shí)間里學(xué)習(xí)了幾十萬盤人類對弈,才訓(xùn)練出非常有效的數(shù)學(xué)模型。我的一位同事打開下棋的程序,想看看是否能通過研究那些程序提高棋藝,后來他發(fā)現(xiàn)完全沒有可能,里面是一堆莫名其妙的,被仔細(xì)調(diào)整的參數(shù)。第二個(gè)關(guān)鍵技術(shù)是一個(gè)被稱為beansearch的精準(zhǔn)搜索最佳走發(fā)的啟發(fā)式搜索算法。我們知道如果下國際象棋,在每種狀態(tài)下大約有5-10種左右合理的走法,如果計(jì)算機(jī)往前考慮十步,這個(gè)搜索空間是100億,大得不得了,因此計(jì)算機(jī)不能窮舉所有的可能性,而是要根據(jù)從以往對弈中學(xué)來的知識,比較準(zhǔn)確地聚焦在一個(gè)寬度有限的空閑,這就像光束一樣,因此叫做BeamSearch。圍棋的走法每一步都多出大約一個(gè)數(shù)量級,如果往后看個(gè)十幾步,狀態(tài)的數(shù)量是呈指數(shù)爆炸式的增長的。盡管今天的計(jì)算機(jī)比20年前能力提升了上萬倍,而且Google數(shù)據(jù)中心的服務(wù)器數(shù)量遠(yuǎn)比當(dāng)年IBM深藍(lán)里面的處理器多得多,但是如果沒有好的搜索算法,是無法在很短的時(shí)間里算出最佳行棋步驟的。因此,下圍棋既可以說是一個(gè)機(jī)器智能的問題,也可以說是一個(gè)大數(shù)據(jù)和算法的問題。至于Google深度學(xué)習(xí)和深度思維的原理,大家可以閱讀拙作《數(shù)學(xué)之美》。
AlphaGo第一場勝利的意義非常大,它標(biāo)志著機(jī)器智能得到了一個(gè)新的水平。盡管有人認(rèn)為李世石有希望反敗為勝,或者有人酸溜溜地講我們還有更好的選手可以戰(zhàn)勝AlphaGo。但是按照它的在過去幾個(gè)月里的進(jìn)步速度,只要Google愿意繼續(xù)投入,估計(jì)一年內(nèi)任何人類的圍棋高手都無法和它過招了。從此,計(jì)算機(jī)實(shí)際上完成了在一個(gè)新的領(lǐng)域全面超越人類。在這個(gè)過程中,很多計(jì)算機(jī)科學(xué)家和工程師為此做出了巨大的貢獻(xiàn),他們是我們文明的締造者。因此AlphaGo的勝利,實(shí)際上是計(jì)算機(jī)科學(xué)家的勝利,也是人類的勝利,在這場勝利中,李世石其實(shí)起到了一個(gè)Beta測試者的作用,他其實(shí)是AlphaGo這個(gè)版本的試用者。因此,Google的成功里面也有李世石的功勞。
AlphaGo的獲勝讓一些對機(jī)器智能不了解的人開始杞人憂天,擔(dān)心機(jī)器在未來能夠控制人類。這種擔(dān)心是不必要的,事實(shí)上AlphaGo的靈魂是計(jì)算機(jī)科學(xué)家為它編寫的程序。我在很多次演講中一種強(qiáng)調(diào)一個(gè)觀點(diǎn),機(jī)器是不會控制人類的,但是制造智能機(jī)器的人是可以的。而科技在人類的進(jìn)步中總是扮演著最活躍最革命的角色,它的發(fā)展不是什么人,什么國家能阻止的,我們所能夠做的就是面對現(xiàn)實(shí),抓住智能革命的機(jī)遇,而不是回避它、否定它和阻止它。未來的社會,一定屬于那些具有創(chuàng)意的人,包括計(jì)算機(jī)科學(xué)家,而不屬于掌握一個(gè)技能做重復(fù)性工作的人。
最后需要指出的是,在朝鮮半島上我們最近看到兩種趨勢,一種是進(jìn)步的力量,他們在幫助科技發(fā)展,弘揚(yáng)東方古老的文化,我由衷地對李世石和很多韓國朋友表示敬意;另一種力量是專制而近乎瘋狂的行為,這就不多說了,這種邪惡的力量即使看上去強(qiáng)大,在歷史的長河中,無非是徒增笑耳罷了。
本站僅提供存儲服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請
點(diǎn)擊舉報(bào)。