李世石對戰(zhàn)AlphaGo
鳳凰科技訊 北京時間3月10日消息,據(jù)科技網(wǎng)站The Verge報道,隨著人工智能技術(shù)的進步,各種棋類高手一一被電腦斬落馬下,圍棋是人類碩果僅存的驕傲,但在昨天的一場世紀之戰(zhàn)中,谷歌旗下的AlphaGo電腦卻成功擊敗韓國九段棋手李世石,引起了全世界的關(guān)注。李世石也在賽后表示:“我非常吃驚,沒想到真的會輸,AlphaGo的實力居然如此強悍?!敝皇窍卤P棋而已,為什么AlphaGo的勝利如此引人注目呢?想要真正理解該問題,就要先了解圍棋的特性和DeepMind團隊如何去破解圍棋中的各個難點。
以下為文章全文:
昨天DeepMind的AlphaGo戰(zhàn)勝傳奇圍棋選手李世石的消息成了全世界各家媒體的頭條,同時,這也是人工智能(AI)歷史上最重要的時刻之一?!拔曳浅3泽@,”李世石說道?!拔覜]想到會輸,AlphaGo的實力居然如此強悍。”
不過就是下個棋而已,為什么AlphaGo的勝利如此引人關(guān)注呢?想要真正理解該問題,就要先了解圍棋的特性和DeepMind團隊如何去破解圍棋中的各個難點。
圍棋發(fā)源于中國,是一項擁有3000年歷史的古老游戲。它非常抽象,所有的戰(zhàn)斗都發(fā)生在19 x 19的格子棋盤上,棋手通過落子圍住對手的棋子來獲勝。雖然規(guī)則不多,但變化多端的棋路讓其變得非常深奧,因為任何細微的變化都有可能引起戰(zhàn)局的突變。
韓國圍棋協(xié)會高級秘書長
英國圍棋聯(lián)盟裁判托比表示:“圍棋是世界上最為復(fù)雜的智力游戲,它簡單的規(guī)則加深了棋局的復(fù)雜性。”托比還引用了20世紀傳奇圍棋選手愛德華·拉斯克(Edward Lasker)的話,后者表示:“國際象棋中有許多巴洛克式規(guī)則(意為華而不實),它們都是人們故意添加的,而圍棋則不同,它的規(guī)則是如此優(yōu)雅自然,有著嚴格的邏輯,如果宇宙中還有其他智慧生物,我想他們也會愛上圍棋?!?/p>
正是因為圍棋超凡的復(fù)雜性,想要成為傳奇選手,你需要經(jīng)過多年的訓(xùn)練。棋手需要磨練自己的直覺并學(xué)習(xí)識破各種棋路?!皠倓偵鲜謺r,你會覺得圍棋的規(guī)則簡單易懂,但在長期的練習(xí)中你會發(fā)現(xiàn)這項運動深不可測,”韓國圍棋協(xié)會高級秘書長Lee Ha-jin說道?!凹词鼓阋呀?jīng)在圍棋界浸淫幾十年,你依然會發(fā)現(xiàn)自己還有許多東西可學(xué),圍棋棋藝是沒有天花板的。”
五歲時Lee Ha-jin就表現(xiàn)出極強的圍棋天賦,因此她的父母將她送去首爾的私立圍棋學(xué)校學(xué)習(xí),她跟老師同吃同住,平日上學(xué),晚上回來后還要練習(xí)幾小時的圍棋。經(jīng)過11年的訓(xùn)練,她最終成為了一名職業(yè)棋手。
小小棋盤中蘊藏著無數(shù)奧秘
我采訪過的每個圍棋選手對這項運動的評價都如出一轍:圍棋的魅力就在于簡單規(guī)則后無數(shù)的變化。這些復(fù)雜的變化正是電腦難以捉摸并真正掌握的地方,畢竟機器沒有人的直覺。
“國際象棋和西洋棋與圍棋不同,它們不需要選手對棋局做復(fù)雜的形勢評估,”喬納森·謝弗(Jonathan Schaeffer)說道,他是加拿大阿爾伯塔大學(xué)的計算機科學(xué)家,此前他的Chinook程序曾戰(zhàn)勝過頂級的西洋棋選手。“在國際象棋和西洋棋中,只需簡單的啟發(fā),你就知道下一步該怎么走,衡量各個棋子的價值是選手最重要的任務(wù)——如果在國際象棋中多一個車的棋子,那你已經(jīng)基本勝券在握了。但這些方式在圍棋中都行不通,從人類的角度來看,圍棋的棋路過于復(fù)雜,電腦很難學(xué)會。不過AlphaGo做到了,它擁有世界上首個有效的評估函數(shù)系統(tǒng)。
那么DeepMind是如何做到的呢?其實解決這個問題的關(guān)鍵是深度學(xué)習(xí)和類神經(jīng)網(wǎng)絡(luò)技術(shù),有了它們,研究人員就能教AlphaGo下棋。就像Google Photos能幫你從無數(shù)圖片中找出貓咪一樣,其背后是該應(yīng)用對超大量級的貓咪圖片做分析后的結(jié)果,這些分析處理甚至細化到了像素級別。而AlphaGo能有如此成績,則得益于對數(shù)百萬項圍棋數(shù)據(jù)的學(xué)習(xí),包括各種棋路和棋手的比賽。
眼下,AlphaGo還在不斷學(xué)習(xí),其能力也在不斷增強。起初,它還是靠學(xué)習(xí)套路(策略網(wǎng)絡(luò))來預(yù)測對手的落子方式,不過隨著價值網(wǎng)絡(luò)訓(xùn)練的深入,AlphaGo已經(jīng)有了那么點“直覺”,它可以分析出比賽的態(tài)勢了。在棋局中,AlphaGo已經(jīng)可以通過快速對各種可能性做分析,提前考慮后面幾步的落子和排兵布陣了。其實AlphaGo擁有的各項技術(shù)都是相互輔助的,類神經(jīng)網(wǎng)絡(luò)可以降低電腦的負載,提高工作效率;套路學(xué)習(xí)則可以減小其搜索范圍,而價值網(wǎng)絡(luò)則可讓它從每次的比賽中總結(jié)出自己的經(jīng)驗。
AlphaGo擁有自己的“思考”能力
這一增強版的學(xué)習(xí)系統(tǒng)讓AlphaGo變得更像人類,而不是靠驚人計算能力戰(zhàn)勝國際象棋大師的IBM深藍電腦,畢竟圍棋和國際象棋在復(fù)雜程度上不屬于一個量級,用深藍電腦的方法是無法在圍棋上戰(zhàn)勝人類的。在五場比賽的間歇,DeepMind都不會對AlphaGo做調(diào)整,因此電腦只能靠自己來學(xué)習(xí),但每天一場比賽的量確實有些少。此外,DeepMind公司創(chuàng)始人杰米斯·哈薩比斯(Demis Hassabis)稱AlphaGo的計算能力在去年十月的比賽后一直都沒有得到增強,因此現(xiàn)在它的能力已經(jīng)達到現(xiàn)有硬件條件下的頂峰。
不過深藍電腦的開發(fā)人員認為AlphaGo在國際象棋上并不一定是世界最強。“我相信DeepMind可以開發(fā)出戰(zhàn)勝所有國際象棋大師的程序,”IBM研發(fā)工程師坎貝爾說道(他認為AlphaGo是一個令人印象深刻的程序)?!安贿^我不認為AlphaGo可以在所有棋類比賽中站上世界之巔。為什么這么說呢?因為國際象棋在搜索能力的要求上與圍棋有著本質(zhì)上的不同,而該能力是電腦戰(zhàn)勝國際象棋大師最為關(guān)鍵的一環(huán)。雖說圍棋上電腦也需要深度搜索來輔助,但圍棋更重視直覺和對棋局形勢的判斷與預(yù)估,而在國際象棋比賽中,搜索能力就是唯一,這正是AlphaGo最為缺乏的?!?/p>
不過DeepMind公司可不這么想,它們認為在AlphaGo上取得的經(jīng)驗可以在多個領(lǐng)域中得到應(yīng)用。哈薩比斯曾講述過深藍電腦上的AI與AlphaGo的不同,他認為后者更加靈活,適應(yīng)性也更強,而深藍電腦的應(yīng)用范圍則較窄。未來,DeepMind的人工智能技術(shù)將用在機器人,智能手機語音助手和醫(yī)療保健等領(lǐng)域。
AlphaGo有可能改變圍棋運動未來的走向
其實無論隨后四場比賽結(jié)果如何,AlphaGo都已經(jīng)創(chuàng)造了歷史。上周在接受采訪時李世石曾表示:“圍棋很有可能在此次比賽中走下神壇,此前我們一直將該運動視為驕傲,因為它是唯一未被電腦戰(zhàn)勝的棋類運動,如果這一紀錄作古,確實會讓人有些失望?!?/p>
不過AlphaGo的勝利也會從另一個角度推動該項運動的發(fā)展。圍棋協(xié)會成員都對AlphaGo的能力感到十分震驚,他們認為AlphaGo有時落子的方式有些一反常規(guī),如果自己這樣下棋,肯定會被老師罵的。
“我們當(dāng)然非常震驚,”圍棋選手杰克遜表示?!皹I(yè)內(nèi)一直有所謂正統(tǒng)的落子套路,AlphaGo這樣不按套路出牌能給我們帶來什么啟示呢?難道它要引發(fā)業(yè)界大地震?難道我們此前辛苦訓(xùn)練學(xué)會的那些技能都是錯誤的嗎?”(編譯/呂佳輝)