国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費(fèi)電子書(shū)等14項(xiàng)超值服

開(kāi)通VIP
帶著公關(guān)任務(wù)的 AlphaGo,混江湖的面子與里子
腦極體
2017-05-27 07:25

徐浩峰導(dǎo)演的《師父》,描述的是這樣一個(gè)故事:詠春拳的唯一傳人陳識(shí)來(lái)到北方武林中心天津,希望在天津開(kāi)一家武館把詠春這門(mén)絕學(xué)發(fā)揚(yáng)光大。天津武林卻容不下他,擺下橫豎規(guī)矩的同時(shí),還想讓陳識(shí)把真功夫交出來(lái)。


忍無(wú)可忍的拳師最后表示,那我干脆把你們都打趴下唄。


雖然劇情邏輯完全不一樣,但這幾天打敗柯潔和各路圍棋高手的AlphaGo,總讓我想起《師父》的這段故事。區(qū)別在于電影里拳師是處處留面子,最后忍不下去才打敗所有高手;而AlphaGo是一開(kāi)始就注定要打敗高手們,但同時(shí)要處處留面子……或許僅此而已。



同樣的高手挑戰(zhàn),同樣的按規(guī)矩拜碼頭,同樣的內(nèi)藏錦繡和心照不宣——


在極其和諧且去商業(yè)化的對(duì)抗賽+表演賽+演講+論壇+媒體報(bào)道里,AlphaGo在其樂(lè)融融的氣氛里完成了對(duì)中國(guó)市場(chǎng)以及中國(guó)網(wǎng)民的一次大公關(guān),同時(shí)宣告基本完成了AI+棋牌領(lǐng)域的基礎(chǔ)探索。


更加巧妙的是,DeepMind和谷歌團(tuán)隊(duì)還順勢(shì)玩了一回“內(nèi)容電商”,把幾個(gè)剛剛在谷歌開(kāi)發(fā)者大會(huì)上重點(diǎn)布局的產(chǎn)品做了次順勢(shì)推銷(xiāo)。實(shí)力是真的,一舉三得也是真的。


《一代宗師》里說(shuō),有人活成了面子,有人活成了里子,面子敬人一支煙,里子可能就要除掉一個(gè)人。這次AlphaGo的立館之戰(zhàn),恐怕也有面子與里子的分別。


當(dāng)然,這里并沒(méi)有反對(duì)這次人機(jī)賽盛宴的意思,相反,這樣的比賽和套路恐怕越多越好。但是太多的套路確實(shí)讓我們很難看清AlphaGo帶來(lái)的最珍貴價(jià)值。畢竟求棋道是少數(shù)人的事,AlphaGo的核心卻可能關(guān)乎更多。


AI+圍棋的公關(guān)任務(wù):精準(zhǔn)、厚道、有套路的拜碼頭


不妨先來(lái)聊聊這次AlphaGo中國(guó)之行的實(shí)質(zhì)。開(kāi)賽前,我們就被關(guān)于限制報(bào)道此次比賽的新聞刷了屏。但是圍觀幾天之后會(huì)發(fā)現(xiàn),谷歌和DeepMind團(tuán)隊(duì)這些人尖子何嘗不了解官方的要求和立場(chǎng)?


甚至比想象中更多,AlphaGo團(tuán)隊(duì)在一言一行上仿佛都受過(guò)某種訓(xùn)練,不僅照顧了官方情感,還對(duì)中國(guó)網(wǎng)民的喜好了若指掌。



比如DeepMind創(chuàng)始人Demis Hassabis就在接受采訪和主題演講中,反復(fù)提及圍棋這門(mén)運(yùn)動(dòng)本身的偉大和藝術(shù)性,談?wù)撈淙缤剿饔钪嬉粯拥膬r(jià)值與魅力。并且還不忘記借助圍棋贊美中國(guó)本身的偉大和歷史悠久。當(dāng)然了,表示未來(lái)愿意在華開(kāi)展更多合作也是必須的。


除了情商在線的發(fā)言外,AlphaGo團(tuán)隊(duì)的陣容齊整,誠(chéng)意拳拳也令人感嘆。要知道,DeepMind是家以高冷著稱(chēng)的科技公司。三位創(chuàng)始人基本不同時(shí)露面,而這次不僅三人同時(shí)到場(chǎng),還拉上谷歌高管一起,想聊未來(lái)聊未來(lái),想說(shuō)技術(shù)說(shuō)技術(shù),說(shuō)市場(chǎng)說(shuō)營(yíng)銷(xiāo)也有人陪著你??傊菍?shí)力拒絕一切暴力挑事兒。


此外,對(duì)柯潔與AlphaGo之戰(zhàn)的態(tài)度也耐人尋味。第一局柯潔半目惜敗,AlphaGo團(tuán)隊(duì)還馬上澄清沒(méi)有讓棋,第二局Demis Hassabis直接表示柯潔表現(xiàn)幾乎完美,想來(lái)第三局即使不是柯潔勝,也應(yīng)該會(huì)有更加“厚道”的贏棋方式。



這個(gè)劇情不由得聯(lián)想到《師父》里的天津比武:你贏不了就不能開(kāi)武館,但你贏的不給面子,抱歉,那還是不能開(kāi)……


谷歌的面子:TPU、谷歌云和 TensorFlow


在非常給中國(guó),甚至可以說(shuō)給人類(lèi)面子的前提下,谷歌也一舉滿足了自己的面子。


我們可以整體看一下這幾天科技媒體刷屏報(bào)道的人機(jī)大戰(zhàn)關(guān)鍵詞。會(huì)發(fā)現(xiàn)一些邏輯上可能不應(yīng)該出現(xiàn)的高頻詞匯出現(xiàn)了。


比如說(shuō):TPU。



作為谷歌專(zhuān)門(mén)為機(jī)器學(xué)習(xí)量身定制的處理器,Tensor Processing Unit,簡(jiǎn)稱(chēng)TPU,自打誕生之日起就是谷歌的掌上明珠。在剛剛結(jié)束的谷歌開(kāi)發(fā)者大會(huì)上,還重點(diǎn)披露了二代TPU的情報(bào)和數(shù)值。雖然僅有照片,但還是作為了大量發(fā)布產(chǎn)品與項(xiàng)目中的核心拿來(lái)展示。


要知道,TPU在戰(zhàn)略意義上彰顯了谷歌從產(chǎn)品與計(jì)算服務(wù)為主導(dǎo)的公司,向著硬件+計(jì)算+產(chǎn)品的全流程邁進(jìn)。谷歌幾次明確了AI first戰(zhàn)略,而專(zhuān)為AI提供的芯片處理器,價(jià)值不言自明。


按理說(shuō),與李世乭對(duì)弈的AlphaGo當(dāng)中就已經(jīng)使用了TPU驅(qū)動(dòng)計(jì)算,而在這次與柯潔對(duì)弈版本中,TPU的使用只是數(shù)量上減少了,并沒(méi)有在硬件計(jì)算能力上得到何種改變。應(yīng)該不能算作AlphaGo升級(jí)的重大變化。


但在DeepMind創(chuàng)始人與谷歌相關(guān)負(fù)責(zé)人分享的演講,以及回答記者提問(wèn)過(guò)程中。TPU卻被仿佛提及,描繪成AlphaGo計(jì)算力的核心。按理說(shuō),這次的AlphaGo特征是對(duì)計(jì)算的需求量大大減少,玩命吹應(yīng)用的處理器仿佛有哪里不對(duì)….但他們就是這么干了。這就是面子。谷歌的面子。


人在屋檐下,自然要低頭。無(wú)論你是技術(shù)天才還是理想主義者,拿了谷歌的收購(gòu)款自然要為谷歌服務(wù)。


事實(shí)上,目前TPU的市場(chǎng)應(yīng)用價(jià)值還有待考量。首先這是個(gè)不外售產(chǎn)品,只能通過(guò)購(gòu)買(mǎi)谷歌云的服務(wù)來(lái)獲得TPU的計(jì)算能力。而另一方面,作為專(zhuān)門(mén)為旗下機(jī)器學(xué)習(xí)平臺(tái)TensorFlow量身打造的芯片,TPU在處理其他平臺(tái)算法以及其他機(jī)器學(xué)習(xí)計(jì)算網(wǎng)絡(luò)時(shí)展現(xiàn)的效率還在經(jīng)受質(zhì)疑。


這次烏鎮(zhèn)峰會(huì)上,DeepMind聯(lián)合創(chuàng)始人之一David Silver在演講中特意強(qiáng)調(diào)“TPU 像 CPU 或 GPU一樣都是可編程的。它并不專(zhuān)為某個(gè)神經(jīng)網(wǎng)絡(luò)模型設(shè)計(jì),可以在多種網(wǎng)絡(luò)上執(zhí)行 CISC 指令,比如卷積神經(jīng)網(wǎng)絡(luò)、LSTM 模型、大型全連接模型等”。


但事實(shí)上,針對(duì)一代TPU的測(cè)試數(shù)值來(lái)看,LSTM模型的運(yùn)轉(zhuǎn)效率還相當(dāng)?shù)停h(yuǎn)比不上卷積神經(jīng)網(wǎng)絡(luò)的運(yùn)算速度。這也是為什么以機(jī)器學(xué)習(xí)硬件為核心的英偉達(dá)似乎始終對(duì)TPU有著某種不屑:畢竟AI之路千萬(wàn)條,大家不可能都在TensorFlow上走。




但是顯然,谷歌是希望將TensorFlow的平臺(tái)、谷歌云的云服務(wù)和TPU的運(yùn)算能力打包給更多企業(yè)的。這樣近乎于整個(gè)AI應(yīng)用產(chǎn)業(yè)的命脈都在谷歌手里。


這種想法目前有些不現(xiàn)實(shí),畢竟TPU的適應(yīng)度還太狹窄,創(chuàng)業(yè)公司選擇GPU就夠了。而大公司怎么可能把身家性命都交給谷歌?


所以說(shuō),人機(jī)大戰(zhàn)中谷歌賺足的“面子”,其實(shí)是由各種各樣的“里子”撐起來(lái)的。


AlphaGo 的里子:半掩半遮的低耗高擬態(tài)算法


那么,到底什么是撐著谷歌面子的、AlphaGo真正的“里子”呢?


從邏輯上講,這個(gè)里子就是能夠讓新版本的AlphaGo毫不留情的秒殺舊版本,輕松寫(xiě)意戰(zhàn)勝人類(lèi)的深層原因。


這幾天比賽中,有個(gè)概念突然火起來(lái)了,就是圍棋當(dāng)中的“讓子”。非常詭異的是,大家仿佛都認(rèn)為讓幾子對(duì)應(yīng)著實(shí)力高出幾個(gè)等級(jí)。事實(shí)上,圍棋當(dāng)中的“讓子勝”絕不是以數(shù)字來(lái)計(jì)算棋力的。


每多讓一子,被讓子者將會(huì)獲得巨大的優(yōu)勢(shì)。一般來(lái)說(shuō)最多能讓四子,而讓四子基本就是專(zhuān)業(yè)棋手跟入門(mén)棋手的教學(xué)賽了。這次出戰(zhàn)的AlphaGo能不能對(duì)人類(lèi)選手讓子勝不得而知,但如果它能夠?qū)εf版的AlphaGo讓三子,那說(shuō)明棋力已經(jīng)有了等級(jí)上的進(jìn)化。



這個(gè)進(jìn)化的核心實(shí)力來(lái)自什么呢?顯然不是來(lái)自運(yùn)算速度的加快和數(shù)據(jù)處理量的加大。根據(jù)

Demis Hassabis的說(shuō)明,“本次對(duì)弈的新版 AlphaGo計(jì)算量小了十倍,自我對(duì)弈能力更強(qiáng),運(yùn)行起來(lái)更簡(jiǎn)單,更好,功耗也更小?!?/p>


而這個(gè)神秘效果或許來(lái)源于幾個(gè)能力。最核心的就是AlphaGo改良了蒙特卡洛樹(shù)搜索算法。這種算法的本質(zhì),是在完全信息博弈的情況下采用不斷窮舉極大值與極小值,在根據(jù)數(shù)據(jù)結(jié)果來(lái)匹配能達(dá)成玩家目標(biāo)的搜索結(jié)果。順著搜索樹(shù)上升,最終達(dá)到最優(yōu)結(jié)果。


這個(gè)算法是AlphaGo初代時(shí)就開(kāi)始采用的機(jī)器學(xué)習(xí)算法。但這個(gè)算法的缺點(diǎn)在于對(duì)于博弈目標(biāo)需要的運(yùn)算量會(huì)非常龐大,如果不加以限制,很可能出現(xiàn)暴力窮舉的運(yùn)算方式。這對(duì)于圍棋顯然是不智的。




而解決運(yùn)算量問(wèn)題的方式就是通過(guò)卷積神經(jīng)網(wǎng)絡(luò),使用策略網(wǎng)絡(luò)與價(jià)值網(wǎng)絡(luò)對(duì)舉的方式來(lái)確定運(yùn)動(dòng)方向,這樣就幾大減少了搜索樹(shù)的運(yùn)算量與運(yùn)算時(shí)間。據(jù)說(shuō),這一版本的AlphaGo策略網(wǎng)絡(luò)/價(jià)值網(wǎng)絡(luò)構(gòu)成的精神網(wǎng)絡(luò)由12層增加到了40層,這其中蘊(yùn)含的也絕不僅僅是數(shù)量上的增加,而應(yīng)該是更復(fù)雜的算法邏輯在起作用。


初代AlphaGo對(duì)人類(lèi)棋譜的大量學(xué)習(xí)完畢,也給版本進(jìn)化提供了有力基礎(chǔ)。這一版本的AlphaGo更多采取自我對(duì)弈的方式來(lái)完成強(qiáng)化學(xué)習(xí),輔助以少量人類(lèi)棋譜。顯然會(huì)在優(yōu)質(zhì)數(shù)據(jù)搜索上更上一層樓,也更加無(wú)法被人類(lèi)預(yù)判。


同時(shí)這次的AlphaGo雖然依舊是使用監(jiān)督學(xué)習(xí)與增強(qiáng)學(xué)習(xí)結(jié)合的訓(xùn)練手段,但應(yīng)該已經(jīng)達(dá)成了部分無(wú)監(jiān)督學(xué)習(xí)。這很可能是master連勝60局時(shí)很多奇招和布局感的來(lái)源。


簡(jiǎn)單來(lái)說(shuō)吧,AlphaGo的“里子”在于它使用了全面改進(jìn)的算法和優(yōu)質(zhì)數(shù)據(jù)源,雖然目前資料甚少,我們還無(wú)法窺探其究竟。但AlphaGo通過(guò)多種算法邏輯、訓(xùn)練邏輯與學(xué)習(xí)資源相結(jié)合,讓機(jī)器獲得了近乎于直覺(jué)和創(chuàng)造力的東西,恐怕才是它傳達(dá)出的最重要信息。



雖然這個(gè)信息包裹在層層商業(yè)目的和新聞噱頭的背后,但還是有必要把它找出來(lái)……因?yàn)椤乙膊恢酪驗(yàn)槭裁?,但這里似乎可以再引用一句《一代宗師》:功夫只有兩個(gè)字,一橫一豎,對(duì)的站著,錯(cuò)的躺下。


——AI也是如此。

本站僅提供存儲(chǔ)服務(wù),所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊舉報(bào)。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
完爆阿爾法狗元,DeepMind用5000臺(tái)TPU訓(xùn)練出新算法,1天內(nèi)稱(chēng)霸3種棋類(lèi)
AlphaGo重出江湖,又發(fā)了一篇Nature
新AlphaGo這么強(qiáng)!36小時(shí)從0自學(xué)成大師,100:0把李世乭版秒成渣渣 | Nature論文
新AlphaGo首度揭秘:?jiǎn)螜C(jī)運(yùn)行,4個(gè)TPU,算法更強(qiáng)
史上最強(qiáng)棋類(lèi)AI降臨:谷歌公布AlphaGo升級(jí)版
「阿爾法狗」再進(jìn)化!通用算法 AlphaZero 再攻克幾種棋又有何難
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導(dǎo)長(zhǎng)圖 關(guān)注 下載文章
綁定賬號(hào)成功
后續(xù)可登錄賬號(hào)暢享VIP特權(quán)!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服