美女视频黄频大全图,美女视频真写,叉美女视频

博弈論資料

(一)：基本知識

1.1定義:博弈論，又稱對策論，是使用嚴謹?shù)臄?shù)學模型研究沖突對抗條件下最優(yōu)決策問題的理論，是研究競爭的邏輯和規(guī)律的數(shù)學分支。即，博弈論是研究決策主體在給定信息結(jié)構(gòu)下如何決策以最大化自己的效用，以及不同決策主體之間的均衡。

1.2基本要素：參與人、各參與人的策略集、各參與人的收益函數(shù)，是博弈最重要的基本要素。

1.3博弈的分類：博弈論根據(jù)其所采用的假設不同而分為合作博弈理論和非合作博弈理論。兩者的區(qū)別在于參與人在博弈過程中是否能夠達成一個具有約束力的協(xié)議（bindingagreement）。倘若不能，則稱非合作博弈（Non1968）d、不完全信息動態(tài)博弈，精煉貝葉斯納什均衡，澤XX（1975）Kreps,Wilson（1982）Fudenberg,Tirole（1991）

1.4課程主要內(nèi)容：完全信息靜態(tài)博弈完全信息動態(tài)博弈不完全信息靜態(tài)博弈機制設計合作博弈

1.5博弈模型的兩種表示形式：策略式表述（Strategicform）,擴展式表述（Etensiveform）

1.6占優(yōu)均衡：a、占優(yōu)策略：在博弈中如果不管其他參與人選擇什么策略，一個參與人的某個策略給他帶來的支付值始終高于其他策略，或至少不劣于其他策略，則稱該策略為該參與人的嚴格占優(yōu)策略或占優(yōu)策略。對于所有的si）ui（si,si,sii,均成立Ui（si,si）,則說策略si嚴劣于策*略si。上面式子中，若將“Ui（Si,sNNNi）的期望支付一樣大換句話說，稱混合策略組合a*是一個納什均衡，如果沒有一個參與人通過偏離策略a*i實現(xiàn)支付的增加均衡，則該納什均衡是帕XX占優(yōu)納什均

3.6一個定理對于Ni形成的局勢的收益值,等于納什均衡混合策略組合（i,T）的收益值。即ui（sk,i）成立，k=1,,L3.7方法：a、求解混合策略均衡可以用期望收益等值法b、22雙矩陣博弈的圖解法：反應函數(shù)的三個交點即是納什均衡

(四)：多重納什均衡解及其分析

4.1帕XX占優(yōu)均衡XX托占優(yōu)均衡的含義是：在多個納什均衡中，若存在一個納什均衡，其支付結(jié)果針對每個參與人而言都嚴格優(yōu)于其它納什衡。

4.2風險占優(yōu)均衡（riskproofequilibrium）定義：如果一個博弈的某個策略組合滿足a、沒有任何單個參與人的“串通”會改變博弈的結(jié)果，即單獨改變策略無利可圖（該策略組合是納什均衡）。b、給定選擇偏離的參與人有再次偏離的自由時，沒有任何兩個參與人通過“串通”改變博弈的結(jié)果。的串通也不會改變博弈的結(jié)果。滿足上述要求的均衡策略組合稱為“防共謀均衡”在有多個參與人的博弈中，若部分參與人通過某種形式的默契或串通形成小團體，可能得到比不串通個大的支付。這就是多人博弈的共謀問題。防共謀均衡是指這樣的一個納什均衡，在該均衡局勢下，少數(shù)參與人集合不能通過均衡策略的偏離，實現(xiàn)更好的局部利益。防共謀均衡是兩個以上參與人參加的博弈中，參與人在帕雷托占優(yōu)均衡中進行合作思想的擴展。

(五)：動態(tài)博弈

5.1特點一類博弈行為通常需要參與人多步?jīng)Q策才能完成，具有明顯的階段性。博弈的結(jié)局、各參與人的收益由多階段決策結(jié)果確定。各參與人的決策有一定的順序。由于動態(tài)博弈各參與人進行決策具有明顯的階段性、行動次序性，通常用擴展

5.2博弈的擴展式表示參與人集合：i=1,，N。用N表示虛擬參與人“自然”；自然的含義是某些外生的客觀概率分布事件參與人的行動順序（theorderofmoves）:描述各參與人在什么時候行動；參與人的行動空間（actionset）：在每次行動時，參與人可選擇的行動集合；參與人的信息集（informationset）：每次行動時參與人知道什么；參與人的收益函數(shù)：在行動結(jié)束之后，每個參與人得到些什么。自然選擇的概率分布（假定自然狀態(tài)是共同知識）。對于有限博弈，博弈樹是常用的表述方式。

5.3博弈樹a若動態(tài)博弈是有限博弈，則可用博c、依此類推，直到所有參與人都參加式（etensiveform）表述法描述這些信息。弈樹表示該博弈。這里有限的含義是：各階段各參與人的行動數(shù)目有限；博弈的階段數(shù)有限。b博弈樹的基本結(jié)構(gòu)為結(jié)點（nodes）。包括決策結(jié)及終點結(jié)。決策結(jié)是參與人采取行動的時點；終點結(jié)是博弈行動路徑的終點。枝（branches）。從一個決策結(jié)到它的直接后續(xù)結(jié)的連線，每一個枝代表參與人的一個行動選擇。信息集。是決策結(jié)集合的一個子集。將博弈樹中某一決策者在某一行動階段具有相同信息的所有決策結(jié)稱為一個信息集。注：每個決策結(jié)都是同一個參與人的決策結(jié)。該參與人知道博弈進入該集合的某個決策結(jié)，但不知道自己究竟出于哪一個決策結(jié)（若該信息集有兩個或兩個以上元素）。

5.4對于有限動態(tài)博弈，若參與人對彼此在各決策結(jié)點的行動集合，彼此的效用函數(shù)，歷史的行動有著完全的了解，則稱這樣的博弈為完全信息動態(tài)博弈。如果博弈樹的所有信息集都是單元素集，稱該博弈為完美信息博弈（gameofperfectinformation）。上述兩個定義的差別在于對自然行動信息的描述。

5.5動態(tài)博弈的策略式表述a相機選擇（contingentplay）動態(tài)博弈中參與人的策略是各自預先設定的，在博弈的各階段，針對各種情況做出相應決策。即“等待”博弈到達自己的信息集（包含一個或多個決策結(jié)）后再決定如何行動。在策略式表述博弈中，參與人似乎是博弈開始之前就制定出了一個完全的相機選擇，即“如果發(fā)生，我將選擇”。b從擴展式表述構(gòu)造戰(zhàn)略式表述若把B的信息集從左到右排列，上述四個純策略可以簡單記為開發(fā)，開發(fā)開發(fā)，不開發(fā)不開發(fā)，開發(fā)不開發(fā)，不開發(fā)。上面四個純策略含義：當A選擇開發(fā)時，B發(fā)B不開發(fā)（1,0）選擇大括號中前面的策略；當A選擇不開發(fā)時，B選擇大括號中后面的策略。B的純策略為：開發(fā)，開發(fā)開發(fā)，不開發(fā)不開發(fā)，開發(fā)不開發(fā)，不開發(fā)A的純策略為：Sa=（開發(fā)，不開發(fā)）于是可以寫成策略式表述形式，為開發(fā)，開發(fā)開發(fā)，不開發(fā)不開發(fā)，開發(fā)不開發(fā)，不開發(fā)31,01,0不開發(fā)0,10,00,10,0在擴展式表述博弈中，所有n個參與人的一個純戰(zhàn)略組合S=（S1,Sn）決定了博弈樹上的一個路徑。比如（開發(fā)，不開發(fā)，開發(fā)）決定了博弈的路徑為A開

5.6完全信息動態(tài)博弈納什均衡存在性定理如果有限博弈是完美信息博弈，他還有一個純戰(zhàn)略納XX（Zermelo,1913）。

5.7逆向歸納法：a逆向歸納法求解策略：從動態(tài)博弈的最后一個階段出發(fā)，對該參與人采用經(jīng)濟理性原則進行分析，逐步到推回前一個階段相應參與人的行動選擇，一直到第一階段的分析方法。b逆向歸納法是求解完美信息動態(tài)博弈的經(jīng)典方法。逆推歸納法是完美信息動態(tài)博弈分析中使用最普遍的方法。c與策略式分析比較：如果A選擇U,那么B的信息集不能達到，我們說B的信息集不在均衡路徑上（oibriumpath）。此種情況下，B的選擇對A沒有什么影響。因此，納XX對一個參與人在非均衡信息集上的選擇沒有限制。但是，一個參與人在非均衡信息集上的戰(zhàn)略可以影響其他參與人在均衡信息集上的選擇。d逆向歸納法實質(zhì)上是重復剔除劣戰(zhàn)略法在擴展式博弈中的應用。逆向歸納法適不用于無限博弈和不完美信息博弈。逆向歸納法剔除了“非理性”的均衡策略

5.8子博弈完美均衡（子博弈精煉納XX）子博弈概念：一個擴展式博弈的子博弈G由一個決策結(jié)和所有該決策結(jié)的后續(xù)結(jié)T組成，它滿足下列條件：是一個單結(jié)信息集,即h=;對于所有的T中的，如果與同屬于一個信息集，則也在T中。需要說明的是，G本身是自己的一個子博弈。子博弈完美納XX（子博弈精煉納XX）擴展式博弈的一個戰(zhàn)略組合S*=（S1*,si*,sn*）是一個子博弈完美納XX，如果它是原博弈的納XX。它在每一個子博弈上都是納XX納XX與子博弈精煉納XX的關(guān)系前面分析說明，一個特定的納XX決定了原博弈樹上唯一的一條路徑，這條路徑稱為“均衡路徑”（equilibriumpath）。相對該納XX，其他路徑稱為非均衡路徑（oibriumpath）。在每一個子博弈上給出納XX意味著，構(gòu)成子博弈納XX的戰(zhàn)略不僅在均衡路徑的決策結(jié)上是最優(yōu)的，同時在非均衡路徑的決策結(jié)上也是最優(yōu)的。對于有限完美信息博弈，前面介紹的逆推歸納法得出的納XX即是子博弈精煉納XX。

(六)多階段靜態(tài)博弈

6.1該類模型中至少在某個階段參與人同時選擇其決策。這類模型實質(zhì)上就是完美信息動態(tài)博弈，因此仍然可以采用逆推歸納法進行分析。因為存在同時選擇，因此每個階段不再是單人優(yōu)化問題，而是一個靜態(tài)博弈。

6.2前向歸納法：前面已經(jīng)說明，完美信息動態(tài)博弈的經(jīng)典求解方法為逆序歸納法。還有一種分析方式，就是前向歸納法（forwardinduction）。前向歸納法由科XX和莫XX（1986）提出。這里不進行嚴格的數(shù)學描述，僅通過一個例題進行說明。

6.3重復博弈重復博弈（repeatedgame）的定義指同樣結(jié)構(gòu)的博弈重復多次，其中的每次博弈稱為“階段博弈（stagegame）”。如兩個多次犯罪的“囚徒問題”。由于動態(tài)博弈是相機行動，反映到重復博弈中，就是可以使自己在某個階段的博弈選擇依賴于其他參與人過去的行動歷史。影響重復博弈均衡結(jié)果的主要因素是博弈重復次數(shù)和信息的完備性（completeness）。重復次數(shù)對參與人可能會有的影響是：參與人為了獲得長遠利益而犧牲眼前利益的策略成為可能。關(guān)于完備性，簡單地說，但一個參與人的支付函數(shù)不為其他參與人所知時，該參與人可能有積極性建立一個“好”的聲譽（reputation）以換取長遠利益。在社會行為中，經(jīng)常可以看到本質(zhì)不好的人在相當長的時期內(nèi)干好事的原因。定理：令G是階段博弈，G（T）是G重復T次的重復

(八)合作博弈博弈（T8）。那么，如果G有唯一的納什均衡，重復博弈G（T）的唯一子博弈精煉納什均衡結(jié)果是階段博弈G的納什均衡重復T次（即每個階段博弈出現(xiàn)的都是一次性博弈的均衡結(jié)果）。上述定理說明，只要博弈的重復次數(shù)是有限的，重復本身并不改變囚徒困境的均衡結(jié)果。上述定理中“唯一性”是一個重要條件。如果納什均衡不是唯一的，上述結(jié)論就不一定成立。當博弈有多個納什均衡時，參與人可以使用不同的納什均衡懲罰前面階段的不合作行為或獎勵第一階段的合作行為。不完全信息靜態(tài)博弈不完全信息靜態(tài)貝葉斯博弈貝葉斯納什均衡海XX轉(zhuǎn)換拍賣理論可傳遞效用（transferableutility）合作博弈的特征函數(shù)合作的分配可行分配核心的定義Shapley值

本站僅提供存儲服務，所有內(nèi)容均由用戶發(fā)布，如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容，請點擊舉報。

国产一级a片免费看高清,亚洲熟女中文字幕在线视频,黄三级高清在线播放,免费黄色视频在线看