[摘要]納什在與命運的博弈中找到均衡,紀(jì)念大師最好的方式就是嘗試了解博弈論。
騰訊財經(jīng)綜合報道(風(fēng)生)奧斯卡獲獎電影《美麗心靈》主角原型、諾貝爾獎得主、美國數(shù)學(xué)家約翰-納什日前與妻子在美國新澤西州乘搭的士時遇上車禍,兩人均不幸遇難。事發(fā)當(dāng)時,這輛出租車失控撞向欄桿,兩人均被拋出車外。
約翰-納什因發(fā)表兩篇關(guān)于非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。
不均衡人生中孕育出均衡論
納什于1928年在美國西弗吉尼亞州出生,曾在麻省理工學(xué)院任教,晚年為普林斯頓大學(xué)擔(dān)任數(shù)學(xué)系教授,死前與82歲妻子艾麗西亞在普林斯頓居住。納什以研究博弈論聞名,1994年獲頒諾貝爾經(jīng)濟學(xué)獎。他的理論被運用在市場經(jīng)濟、計算、演化生物學(xué)、人工智能、會計、政策和軍事理論等多個領(lǐng)域。
納什在數(shù)學(xué)領(lǐng)域上取得多項突破,但他同時深受精神分裂癥困擾,其生平故事在2001年被改編成電影《美麗心靈》,贏得包括最佳電影在內(nèi)的4項奧斯卡獎項。
盡管西維亞-納薩斯(Sylvia Nasars)廣為人知的小說《美麗心靈》(A Beautiful Mind)和改編自該書的、由拉塞爾-克羅(Russell Crowe)主演的同名奧斯卡電影探究了納什錯綜復(fù)雜的生平,但都沒有深入挖掘他的數(shù)學(xué)思想。他的數(shù)學(xué)成果依然不被大眾所熟知。在當(dāng)今科學(xué)界,人們普遍認為,與牛頓和愛因斯坦的數(shù)學(xué)理論相比,納什的數(shù)學(xué)理論觸及到的學(xué)科更多。牛頓和愛因斯坦的數(shù)學(xué)旨在處理物理問題,而納什的數(shù)學(xué)卻可以應(yīng)用在生物學(xué)和社會學(xué)領(lǐng)域。
如若不是精神疾病的困擾,納什今天可能已與那些科學(xué)偉人齊名。盡管如此,他在幾個數(shù)學(xué)領(lǐng)域的重要貢獻大家有目共睹。他最大的成就來自于經(jīng)濟學(xué)方面。由于他在博弈論上的開創(chuàng)性成就,他與約翰海薩尼(John Harsanyi)和萊茵哈德-澤爾騰(Reinhard Selten)一起獲得了1994年諾貝爾經(jīng)濟學(xué)獎。
什么是博弈論與納什均衡
博弈論 :亦名“對策論”、“賽局理論”,屬應(yīng)用數(shù)學(xué)的一個分支,主要研究公式化了的激勵結(jié)構(gòu)間的相互作用。是研究決策主體的行為發(fā)生直接相互作用時候的決策以及這種決策的均衡問題,具有斗爭或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。也是運籌學(xué)的一個重要學(xué)科。博弈論考慮游戲中的個體的預(yù)測行為和實際行為,并研究它們的優(yōu)化策略。
納什均衡:又稱為非合作博弈均衡,是博弈論的一個重要術(shù)語,以約翰-納什命名。假設(shè)有n人局中人參與博弈,給定其他人策略的條件下,每個局中人選擇自己的最優(yōu)策略(個人最優(yōu)策略可能依賴于也可能不依賴于他人的戰(zhàn)略),從而使自己利益最大化。所有局中人策略構(gòu)成一個策略組合。納什均衡指的是這樣一種戰(zhàn)略組合,這種策略組合由所有參與人最優(yōu)策略組成。即在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。納什均衡,從實質(zhì)上說,是一種非合作博弈狀態(tài)。
近代對于博弈論的研究,開始于策墨咯,波雷爾及馮-諾伊曼。1928年,馮-諾依曼證明了博弈論的基本原理,從而宣告了博弈論的正式誕生。1944年,馮-諾依曼和摩根斯坦共著的劃時代巨著《博弈論與經(jīng)濟行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)的應(yīng)用于經(jīng)濟領(lǐng)域,從而奠定了這一學(xué)科的基礎(chǔ)和理論體系。1950~1951年,約翰-福布斯-納什利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅實的基礎(chǔ)。納什的開創(chuàng)性論文《n人博弈的均衡點》(1950),《非合作博弈》(1951)等等,給出了納什均衡的概念和均衡存在定理。
此外,塞爾頓、哈桑尼的研究也對博弈論發(fā)展起到推動作用。今天博弈論已發(fā)展成一門較完善的學(xué)科。博弈論起源于研究人們玩撲克(poker)、象棋(chess)等室內(nèi)游戲時的行為決策,后來作為一種研究人類經(jīng)濟行為的數(shù)學(xué)工具得到了充分的發(fā)展。從根本上講,博弈論涉及到從打網(wǎng)球到指揮戰(zhàn)爭的任何牽扯策略的情景。博弈論提供了一種計算各種可能決策所產(chǎn)生效益的數(shù)學(xué)方法,該理論為在各種競賽性場合做出最佳決定建立了一套具體的數(shù)學(xué)公式。正如經(jīng)濟學(xué)家赫伯特-金迪斯(Herbert Gintis)所說,博弈論是我們“研究世界的一種工具”。但它不僅僅是一種工具,“它不僅研究人們?nèi)绾魏献?,而且研究人們?nèi)绾胃偁帯薄M瑫r,“博弈論還研究行為方式的產(chǎn)生、轉(zhuǎn)變、散播和穩(wěn)定。”
博弈論與納什均衡的發(fā)展和應(yīng)用
博弈論不是納什發(fā)明的,但他擴大了該理論的范圍,為之提供了解決實際問題的更有力工具。在一開始,他的研究成果并沒有受到人們的重視。他的文章發(fā)表在20世紀(jì)50年代,在當(dāng)時博弈論僅在冷戰(zhàn)分析家之間流傳,這些分析家認為國際侵略和利益最大化之間有一些相似之處。在經(jīng)濟學(xué)界,博弈論還被視為一種新奇事物。經(jīng)濟學(xué)家薩繆-鮑爾斯(Samuel Bowles)告訴我說:“在當(dāng)時博弈論羽翼未豐,如同經(jīng)濟學(xué)中其它許多優(yōu)秀的思想一樣,它還沒有受到人們的關(guān)注。”
然而在20世紀(jì)70年代時情況發(fā)生了改變,進化論學(xué)派的生物學(xué)家開始采用博弈論研究動植物中的生存競爭現(xiàn)象。緊接著在20世紀(jì)80年代,經(jīng)濟學(xué)家終于開始以各種不同方式將博弈論應(yīng)用于經(jīng)濟學(xué)中,尤其是將它用在設(shè)計真實試驗以驗證經(jīng)濟學(xué)理論方面。到80年代末博弈論在經(jīng)濟學(xué)領(lǐng)域已經(jīng)充分顯示了它的作用, 這最終促成了納什等1994年諾貝爾經(jīng)濟學(xué)獎的獲得。
早在此之前,博弈論就已經(jīng)出現(xiàn)在許多學(xué)科的課程中。數(shù)學(xué)系、經(jīng)濟學(xué)系、生物學(xué)系、還有政治科學(xué)系、心理學(xué)系和社會科學(xué)系的課程中都含有博弈論的內(nèi)容。到了21世紀(jì)初,博弈論的應(yīng)用更為廣泛,涉及到從人類學(xué)到神經(jīng)生物學(xué)等 多個領(lǐng)域。
現(xiàn)今,經(jīng)濟學(xué)家繼續(xù)使用博弈論分析人們?nèi)绾巫龀鲇嘘P(guān)金錢的決策;生物學(xué)家用它來建立假說以解釋適者生存原理和利他主義的起源;人類學(xué)家使用它來研究原始文化,從而說明人性的多樣化;神經(jīng)科學(xué)者也加入了博弈論研究的行列,通過研究博弈者的大腦,試圖發(fā)現(xiàn)決策如何反映人們的動機和情感。
簡言之,納什的數(shù)學(xué)理論連同在其在其基礎(chǔ)上建立起來的現(xiàn)代博弈論已經(jīng)成為科學(xué)家研究眾多與人類行為相關(guān)課題時的首選方法。
博弈論和納什均衡的幾個經(jīng)典案例
【智豬博弈(Pigs’payoffs)】豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,每踩一下踏板,在遠離踏板的豬圈的另一邊的投食口就會落下少量的食物。如果有一只豬去踩踏板,另一只豬就有機會搶先吃到另一邊落下的食物。當(dāng)小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光所有的食物;若是大豬踩動了踏板,則還有機會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。
那么,兩只豬各會采取什么策略?答案是:小豬將選擇“搭便車”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點殘羹不知疲倦地奔忙于踏板和食槽之間。
原因何在?因為,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強吧,所以只好親力親為了。
【槍手博弈】王者的悲哀。三人對槍自決,甲乙丙槍法優(yōu)劣遞減。最后無奈而神奇的結(jié)局,將不取決于同時開槍還是先后開槍,最優(yōu)良的槍手,倒下的概率將最高;而最蹩腳的槍手,存活的希望卻最大。因為沒有人會把威脅最小的槍手列為一號清楚目標(biāo)。在這里,后發(fā)制人的弱勢者將勝出。以弱勝強,絕不是神話。
【囚徒困境】假設(shè)有兩個小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內(nèi)進行審訊,對每一個犯罪嫌疑人,警方給出的政策是:如果一個犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。
關(guān)于這個案例,顯然最好的策略是雙方都抵賴,結(jié)果是大家都只被判1年。但是由于兩人處于隔離的情況,首先應(yīng)該是從心理學(xué)的角度來看,當(dāng)事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當(dāng)-斯密的理論,假設(shè)每個人都是“理性的經(jīng)濟人”,都會從利己的目的出發(fā)進行選擇。這兩個人都會有這樣一個盤算過程:假如A坦白,B抵賴,B得坐10年監(jiān)獄,B坦白最多才8年;B要是抵賴,A就可以被釋放,而B會坐10年牢。綜合以上幾種情況考慮,不管A坦白與否,對B而言都是坦白了劃算。兩個人都會動這樣的腦筋,最終,兩個人都選擇了坦白,結(jié)果都被判8年刑期。
博弈論和納什均衡的重要影響
博弈論所研究的是理性的決策者之間沖突及合作的理論,可以為實際決策提供理論基礎(chǔ)和方向指導(dǎo)。其最終追求結(jié)果是使博弈方達到利益最大化的均衡。在生活中,博弈仍然無處不在。博弈論代表著一種全新的分析方法和全新的思想。諾貝爾經(jīng)濟學(xué)獎獲得者保羅-薩繆爾遜如是說:要想在現(xiàn)代社會做個有價值的人,你就必須對博弈論有個大致的了解也可以這樣說,要想贏得生意,不可不學(xué)博弈論;要想贏得生活,同樣不可不學(xué)博弈論。
納什均衡理論奠定了現(xiàn)代主流博弈理論和經(jīng)濟理論的根本基礎(chǔ),正如克瑞普斯(Kreps,1990)在《博弈論和經(jīng)濟建?!芬粫囊灾兴f,“在過去的一二十年內(nèi),經(jīng)濟學(xué)在方法論以及語言、概念等方面,經(jīng)歷了一場溫和的革命,非合作博弈理論已經(jīng)成為范式的中心,在經(jīng)濟學(xué)或者與經(jīng)濟學(xué)原理相關(guān)的
金融、會計、營銷和政治科學(xué)等學(xué)科中,現(xiàn)在人們已經(jīng)很難找到不懂納什均衡能夠‘
消費’近期文獻的領(lǐng)域?!?(騰訊財經(jīng)綜合)
返回騰訊網(wǎng)首頁>>