David Z. Morris | 2017-02-14 21:30
谷歌旗下DeepMind團(tuán)隊(duì)已經(jīng)開發(fā)出橫掃人類的圍棋軟件,現(xiàn)在正著力研究機(jī)器人之間的合作問題。

技術(shù)人員仍然在努力完善人工智能和自動(dòng)化技術(shù),讓它們可以在復(fù)雜世界完成一兩個(gè)簡單的任務(wù),例如駕駛或測(cè)謊。但我們很容易設(shè)想在未來,許多機(jī)器人可以互相合作,解決更大的問題。在最近的試驗(yàn)中,Alphabet Inc的DeepMind團(tuán)隊(duì)就開始著手搞清學(xué)習(xí)機(jī)器如何合作——以及實(shí)際情況顯示的,為何經(jīng)常不合作。
這個(gè)團(tuán)隊(duì)設(shè)計(jì)了兩個(gè)簡單的游戲,重復(fù)運(yùn)行了它們幾千次,讓控制游戲的程序?qū)W習(xí)最有效的游戲策略。在某個(gè)游戲中,兩個(gè)人工智能要相互競(jìng)爭,收集最多的資源(綠色“蘋果”),它們也可以選擇使用視頻下方的黃色光速射擊對(duì)手。
他們的發(fā)現(xiàn),使得人們對(duì)于由人工智能驅(qū)動(dòng)的不久未來,產(chǎn)生了一些擔(dān)憂。正如團(tuán)隊(duì)在博文中所言,蘋果收集游戲中的人工智能會(huì)在資源豐富時(shí)和平共存。不過如果蘋果數(shù)量不夠,它們就會(huì)迅速開始射擊對(duì)方來取得優(yōu)勢(shì)。
更令人關(guān)注的是,無論周圍有多少資源,“有能力采用更復(fù)雜戰(zhàn)術(shù)的人工智能,都會(huì)更頻繁地攻擊對(duì)手,也就是表現(xiàn)得更不具合作性?!睋Q句話說,人工智能為了達(dá)成目標(biāo),會(huì)毫不猶豫地妨害對(duì)手——以此類推,對(duì)于阻礙的人類也可能采取類似手段。
不過在另一個(gè)游戲里,這些程序有了更多的合作理由。如果人工智能“收集資源”所得的獎(jiǎng)勵(lì)是共享的,那么它們就會(huì)設(shè)法合作——實(shí)際上也會(huì)表現(xiàn)得更加聰明。
這些試驗(yàn)的推論值得密切關(guān)注。研究人員把這些的高度理性的人工智能機(jī)器人比作“經(jīng)濟(jì)人”(homo economicus)——一種完全以自身利益最大化為目的的假想人類,這也是20世紀(jì)經(jīng)濟(jì)學(xué)中存有瑕疵卻很關(guān)鍵的假設(shè)之一。然而現(xiàn)實(shí)世界里,人類不是完全理性的。因此,對(duì)于研究人員聲稱他們的游戲設(shè)定能幫助我們理解經(jīng)濟(jì)、交通等人類系統(tǒng),也有人提出懷疑。
未來的機(jī)器人本身,注定要成為追求利益最大化的純粹存在。而在人們?cè)O(shè)計(jì)能夠?qū)W習(xí)和進(jìn)化的人工智能時(shí),甚至可以采用取代最狹隘的命令,如艾薩克·阿西莫夫的“機(jī)器人三定律”的行為準(zhǔn)則。這其中當(dāng)然存在著挑戰(zhàn),不過DeepMind競(jìng)爭算法導(dǎo)致的不平衡行為表明,在程序員至少還需要給機(jī)器人賦予某種形式的同情心。(財(cái)富中文網(wǎng))
作者:David Z. Morris
譯者:嚴(yán)匡正