3月9日,李世石會(huì)輸給AlphaGo。
AlphaGo橫空出世的時(shí)候,我寫(xiě)過(guò)一篇文章《我們押寶阿爾法圍棋》發(fā)在BetterRead,講它為什么會(huì)贏。這次講李世石為什么會(huì)輸。
李世石不是此刻的世界最強(qiáng)者。算上剛剛結(jié)束的農(nóng)心杯三國(guó)圍棋擂臺(tái)賽最終局,他已經(jīng)連續(xù)輸給中國(guó)的柯潔好多盤(pán),輸?shù)袅私鼇?lái)兩人相爭(zhēng)的所有重大比賽。
不過(guò),我要講的不是這個(gè)。李世石是不是最強(qiáng)者沒(méi)有什么關(guān)系,他已經(jīng)夠強(qiáng)了。
接著看。
幾個(gè)月前,在兩人爭(zhēng)奪世界冠軍頭銜之前,被問(wèn)及與李世石之戰(zhàn)勝率如何時(shí),柯潔說(shuō):李世石有5成,如果總共有100成的話。
棋盤(pán)如戰(zhàn)場(chǎng),不許人間見(jiàn)白頭。十余年前,李世石像柯潔這般如日中天的時(shí)候,也是一樣地盛氣凌人,不給別人留路走。
不過(guò),我要講的也不是一個(gè)李世石遭報(bào)應(yīng)的故事。
接著看。
后來(lái)有人問(wèn)李世石,你當(dāng)初那么目無(wú)余子,是真的認(rèn)為自己最強(qiáng)嗎?
李世石說(shuō),不是的,是因?yàn)楫?dāng)時(shí)李昌鎬太強(qiáng)大了,又沒(méi)有任何破綻,我覺(jué)得自己模仿他的平衡風(fēng)格毫無(wú)勝算,只有盡力張揚(yáng)自己的性格才有可能破局(李昌鎬是1990年代中期到本世紀(jì)第一個(gè)10年中期無(wú)爭(zhēng)議的圍棋統(tǒng)治者。今天圍棋總共產(chǎn)生了100個(gè)世界冠軍,其中他拿的最多,17個(gè))。
少年的心事與心機(jī)啊。
李世石及其發(fā)揚(yáng)光大至今仍統(tǒng)治職業(yè)棋界的棋風(fēng),極度重視氣勢(shì):你要戰(zhàn),我便戰(zhàn);你不要戰(zhàn),我更要戰(zhàn),追求從一開(kāi)始便將對(duì)手拉入不到終局不休的無(wú)數(shù)場(chǎng)戰(zhàn)斗之中。
為什么這個(gè)策略可行?
第一,戰(zhàn)斗中,雙方下錯(cuò)的概率顯著增加。你會(huì)犯錯(cuò),我也會(huì)犯錯(cuò)。棋手不再不切實(shí)際地寄希望于不犯錯(cuò)誤,而是爭(zhēng)取自己的錯(cuò)誤犯得較小,避免自己成為犯最后那個(gè)錯(cuò)誤的一方。
第二,主動(dòng)將局面導(dǎo)向這種博弈的一方,在心理上、棋風(fēng)上乃至體力上更有準(zhǔn)備。
第三,一戰(zhàn)定局這種事變得越來(lái)越少,一局棋變得很漫長(zhǎng),在可能多達(dá)幾十場(chǎng)戰(zhàn)斗中,如果你擅于捕捉機(jī)會(huì),機(jī)會(huì)多很多。
全力張揚(yáng)桀傲個(gè)性,不求平衡,從開(kāi)局戰(zhàn)斗到終局,李世石創(chuàng)造了自己的時(shí)代,引領(lǐng)了一代圍棋風(fēng)格,其間收獲了十多個(gè)世界冠軍頭銜,也埋下了今天面對(duì)AI的尷尬。
為什么?
與投資界里常說(shuō)的贏虧同源相似,李世石的長(zhǎng)處明顯,短板也明顯,都是一個(gè):在戰(zhàn)斗中尋找對(duì)手的破綻,自己的破綻也會(huì)增多,為將局面引入亂戰(zhàn),甚至不惜故意露出破綻,開(kāi)局即崩。
李世石雄踞世界棋壇多年,但沒(méi)有留下傳統(tǒng)意義上的名局,就是那種棋:雙方落子都甄于完美,沒(méi)有惡手,一方取勝是因?yàn)橄碌酶?,而不是另一方下得不好。李世石固然?huì)下出絕妙手段,但也會(huì)露出不少破綻,下出不少惡手,一盤(pán)棋贏下來(lái)是因?yàn)閷?duì)手的破綻和惡手更多。李世石拿到世界冠軍的不少?zèng)Q勝譜很難看,對(duì)手在懊惱自己犯下錯(cuò)誤之余,更有許多郁結(jié)。不信請(qǐng)問(wèn)同為世界冠軍級(jí)棋手但被李世石多次碾壓的常昊、孔杰。李世石棋風(fēng)有惡名“僵尸流”,就是這樣來(lái)的。
這樣說(shuō)對(duì)李世石并不公平。旁觀李世石下棋,會(huì)覺(jué)得李世石的棋風(fēng)很脆,常常在開(kāi)局用壓迫式的布子求戰(zhàn),結(jié)果露出破綻,一舉落入下風(fēng);然而那些坐到李世石對(duì)面的高手,會(huì)覺(jué)得李世石的棋強(qiáng)韌之極,他們常常贏得每場(chǎng)戰(zhàn)斗,直到輸?shù)糇詈笠粓?chǎng)戰(zhàn)斗。
可是,李世石這樣下,用自己的不穩(wěn)定賭對(duì)手的更不穩(wěn)定,對(duì)AI會(huì)有效嗎?
點(diǎn)到即止。
最后,再來(lái)看一下AlphaGo。
上周,研發(fā)AlphaGo的Goolge Deepmind創(chuàng)始人Demis Hassabis在牛津大學(xué)發(fā)表演講,介紹人工智能進(jìn)展,其中大部分內(nèi)容介紹AlphaGo(https://www.youtube.com/watch?v=4fjmnOQuqao )。
面對(duì)當(dāng)前局面,AlphaGo不是作窮舉計(jì)算,兩個(gè)深度學(xué)習(xí)算法極大地減少了計(jì)算量?!安呗跃W(wǎng)絡(luò)”算法負(fù)責(zé)下一步的落子選擇,從理論上存在的平均200種可能選擇,縮小到三四種得分最高的選擇;“價(jià)值網(wǎng)絡(luò)”算法負(fù)責(zé)評(píng)估落子后的局面與最終勝負(fù)的概率關(guān)系,就是判斷局面是否處于優(yōu)勢(shì),優(yōu)勢(shì)多大。
前者減少計(jì)算的寬度——不用去計(jì)算所有落子的可能;后者減少計(jì)算的深度,不用徒勞地去嘗試算到底。
這確實(shí)就是人類棋手在面對(duì)棋局時(shí)的思維方式。沒(méi)有人能算到終局,也無(wú)須如此,只要算到下一步棋能導(dǎo)向優(yōu)勢(shì)就足夠了。用諾獎(jiǎng)得主、經(jīng)濟(jì)學(xué)家、政治學(xué)家、人工智能專家司馬賀(Herbert Simon)的話說(shuō),人做不到完美(optimal)計(jì)算,做夠用就行(satisficing)的算計(jì)。AlphaGo下棋看來(lái)也是如此。可是,AlphaGo有擬人的圍棋思維,但它不會(huì)有人的波動(dòng)。與人下,你露出破綻,還有無(wú)數(shù)機(jī)會(huì);與它下,就結(jié)束了。
從誕生以來(lái),AlphaGo主要是自己的許多個(gè)分身之間下棋,多到每天下幾十萬(wàn)盤(pán)。武俠小說(shuō)中左腳踩右腳越升越高的輕功是亂蓋的,但AlphaGo跟自己下棋卻真能漲棋,Hassabis稱之為內(nèi)部測(cè)試。每隔一段時(shí)間,AlphaGo會(huì)跟外部棋手下,以作校準(zhǔn),這叫外部測(cè)試。前兩次外部測(cè)試,2015年4月跟同為AI的crazystone下,2015年10月跟樊麾下,結(jié)果大家都知道了。
Hassabis最后說(shuō),跟李世石對(duì)戰(zhàn),絕大多數(shù)職業(yè)棋手認(rèn)為AlphaGo會(huì)輸,但我們的內(nèi)部測(cè)試結(jié)果可不是這樣。
走著看。
你還想看
聯(lián)系客服