博弈论-贝叶斯博弈与贝叶斯Nash均衡课件

上传人:re****.1 文档编号:568679224 上传时间:2024-07-26 格式:PPT 页数:160 大小:1.05MB
返回 下载 相关 举报
博弈论-贝叶斯博弈与贝叶斯Nash均衡课件_第1页
第1页 / 共160页
博弈论-贝叶斯博弈与贝叶斯Nash均衡课件_第2页
第2页 / 共160页
博弈论-贝叶斯博弈与贝叶斯Nash均衡课件_第3页
第3页 / 共160页
博弈论-贝叶斯博弈与贝叶斯Nash均衡课件_第4页
第4页 / 共160页
博弈论-贝叶斯博弈与贝叶斯Nash均衡课件_第5页
第5页 / 共160页
点击查看更多>>
资源描述

《博弈论-贝叶斯博弈与贝叶斯Nash均衡课件》由会员分享,可在线阅读,更多相关《博弈论-贝叶斯博弈与贝叶斯Nash均衡课件(160页珍藏版)》请在金锄头文库上搜索。

1、第三部分: 不完全信息静态博弈主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释第十章贝叶斯博弈与贝叶斯第十章贝叶斯博弈与贝叶斯Nash均衡均衡Department of Mathematics Northwest University一、贝叶斯博弈前面两部分我们讨论了完全信息博弈问题,但在现实生活中我们遇到更多的可能是不完全信息博弈问题。 Department of Mathematics Northwest University例如在“新产品开发”博弈中,企业对市场的需求可能并不清楚;在连锁店博弈中,潜在的进入者可能并不知道连锁

2、店在市场上的盈利情况,等等。 Department of Mathematics Northwest University 新产品开发博弈:新产品开发博弈:考察一种新产品开发:两个企业准备各自 开发同一种新产品,并投放市场。开发中企业的投入、产出如图 企业企业1开发(开发(a):):投资投资2000不开发(不开发(b)需求大需求大需求小需求小企业企业2不开发,获利不开发,获利800企业企业2开发,获利开发,获利300企业企业2不开发,获利不开发,获利200企业企业2开发,赔开发,赔400Department of Mathematics Northwest University 某著名品牌的连

3、锁店(不妨称为参与人A)在K个城市中有分店,城市标号为1,K。在每个城市k(k=1,K)有惟一一个潜在竞争者(称为参与人k),该竞争者决定是否与参与人A竞争进入(用I表示)和不进入(用O表示)。如果参与人k决定去竞争,那么参与人A可以抵制(用F表示)也可以不抵制(用C表示)。 连锁店博弈连锁店博弈Department of Mathematics Northwest University不完全信息博弈问题不完全信息博弈问题 将博弈开始时就存在事前不确定性的博弈问题称为不完全信息博弈问题。Department of Mathematics Northwest University例子:斗鸡博弈

4、两个所谓的勇士举着长枪,准备从独木桥的两端冲上桥中央进行决斗。每位勇士都有两种选择:冲上去(用U表示),或退下来(用D表示)。若两人都冲上去,则两败俱伤;若一方上去而另一方退下来,冲上去者取得胜利(至少心理上是这样的),退下来的丢了面子;若两人都退下来,两人都丢面子。 Department of Mathematics Northwest University考察这样的情形:假设参与人可能有这样的两种性格特征(类型)“强硬”(用s表示)或“软弱”(用w表示)。 所谓“强硬”的参与人是指那些喜欢争强好胜、不达目的誓不罢休的决斗者;而“软弱”的参与人是指那些胆小怕事、遇事希望息事宁人的决斗者。 D

5、epartment of Mathematics Northwest University显然,当具有不同性格特征的决斗者相遇时,所表现出来的博弈情形是不同的。令U表示冲上去;D表示退下去,则每种情况下博弈情形如下图所示。Department of Mathematics Northwest University当参与人都为强硬者时博弈存在两个纯战略Nash均衡 (U,D)和(D,U)。解释:双方都争强好胜,但都不愿意发生直接冲突,都希望在自己冲上去时,对方退下来。Department of Mathematics Northwest University当参与人1为强硬者参与人2为软弱者时博

6、弈存在唯一的Nash均衡(U, D)。 软弱的决斗者胆小怕事,总是退下来,因此,强硬的决斗者选择冲上去。Department of Mathematics Northwest University当参与人1为软弱者参与人2为强硬者时博弈存在唯一的Nash均衡(D, U)。Department of Mathematics Northwest University当参与人都为软弱者时博弈存在唯一的Nash均衡(D, D)。双方都息事宁人,希望和平共处,因此双方都选择退下来。Department of Mathematics Northwest University(1) 参与人都为强硬者(2)

7、参与人1为强硬者参与人2为软弱者(3) 参与人1为软弱者参与人2为强硬者(4) 参与人都为软弱者Department of Mathematics Northwest University在“斗鸡博弈”中,虽然在博弈开始之前每位决斗者都了解(知道)自己的性格特征,但对对手的性格特征往往不甚了解或了解不全。在这种情况下即使所有的决斗者都看到了上面的四个战略式博弈 ,但对决斗者来讲,仍存在着所谓的事前不确定性即博弈开始之前就不知道的信息。 Department of Mathematics Northwest University对于“强硬”的参与人1来讲,虽然他看到了上面的战略式博弈,但他不知道

8、对手是“强硬”的还是“软弱”的,所以博弈开始之前他无法确定博弈是根据(1)还是(2)进行。 这意味着“强硬”的参与人1面临着事前无法确定的信息。Department of Mathematics Northwest University同样,“软弱”的参与人1也会面临类似的问题。此时,“斗鸡博弈”就是一个不完全信息博弈问题。Department of Mathematics Northwest University对于不完全信息博弈问题,是不可能应用前面两部分介绍的方法进行求解的。Department of Mathematics Northwest University这是因为给定参与人1为

9、“强硬”的决斗者,如果对手是“软弱”的,那么博弈就只存在惟一的Nash均衡(U, D),参与人1有惟一的最优选择“冲上去”;如果对手是“强硬”的,则博弈就会出现两个Nash均衡(U,D)和(D,U),参与人1的最优选择取决于对手的选择。Department of Mathematics Northwest University但由于参与人1不知道对手究竟是“强硬”的还是“软弱”的,因此,此时的参与人1就觉得自己似乎是在与两个决斗者进行决斗,一个是“强硬”的,另一个是“软弱”的。当一个参与人并不知道在与谁博弈时,博弈的规则是没有意义的。Department of Mathematics Nort

10、hwest University如何处理不完全信息博弈如何处理不完全信息博弈问题?问题?Department of Mathematics Northwest UniversityExample: Scalping TicketsFor example, consider a scenario in which you and the Cavalier are each scalping tickets for beer money before the UVa-Miami football gameFor every discrete round of the game, each play

11、er assumes one of two types and can take one of two actions (stand in one of two locations)Types: Buyer or SellerLocations: in front of Durty Nellies Pub or at the Frys Spring GarageYou know that you are either buying or selling and you know with probability p that the Cavalier is buying, and sellin

12、g otherwiseFour payoff matrices for the four possible type match-upsChoose a spot to maximize profit (Durty Nellies or Frys Spring Garage) based on your type and your best guess of the Cavs typeDepartment of Mathematics Northwest UniversityA Better Example from HarsanyiConsider two Generals A and BA

13、 seeks to maximize (maxmin) payoff and B seeks to minimize (minmax) payoffFixed action profiles: (a1, a2) and (b1, b2) Each leads an army which assumes one of two states: Strong or WeakThis yields four possible match-ups (AS, BS), (AS, BW), (AW, BS), (AW, BW) with corresponding payoff matrices, each

14、 having its own Nash equilibrium:25-120b1b2a1a2(AS, BS)-24-36024b1b2a1a2(AS, BW)2815404b1b2a1a2(AW, BS)1220213b1b2a1a2(AW, BW)Harsanyi= (.4)(-1) + (.1)(0) + (.2)(28) + (.3)(12) = 8.8 AS a2, AW a1 BS b1, BW b14/101/102/103/10BSBWASAWDepartment of Mathematics Northwest UniversityBayesian PlayersEach p

15、layer knows his own state and estimates his opponents stateEach player has a pure strategy for every possible match-upEach player forms a strategy based on the expected payoffTo continue the example given by Harsanyi, consider the following probabilities of occurrence for the four possible match-ups

16、:4/101/102/103/10BSBWASAWDepartment of Mathematics Northwest UniversityBayesian Nash EquilibriumThis yields the following payoff matrix and a single pure strategy Nash equilibrium:AS a1, AW a1 BS b1, BW b1 7.67.08.88.28.89.113.613.96.21.014.69.47.43.119.415.1BS b1, BW b2 BS b2, BW b1 BS b2, BW b2 AS

17、 a1, AW a2 AS a2, AW a1 AS a2, AW a2 Example calculation: Bayesian Nash Equilibrium payoff = (.4)(-1) + (.1)(0) + (.2)(28) + (.3)(12) = 8.8 Department of Mathematics Northwest UniversityInterpretation of Bayesian Nash EquilibriumIf Player A is Strong, he takes action a2 and a1 if Weak. Player B take

18、s action b2 irrespective of state. Emerged from the known probabilities of each possible match-upNash optimal : Best response (in a Bayesian sense) on the part of each player to the actions available to his opponentNote that each player has a pure state-dependent strategy(However, an outside observe

19、r could interpret it as a mixed strategy, with Nature playing the part of a third indifferent player who randomly chooses states for players A and B according to fixed probability distributions) Department of Mathematics Northwest UniversityStatic Bayesian Game #2: Cournot ModelConsider a Cournot mo

20、del comprising two firms A and B producing the same commodity to satisfy market demand, D. The commodity price on the market is given by Firm As cost of producing the commodity is cAqAcAis the marginal costqA is the quantity that Firm A produces.Firm Bs cost of producing the commodity is cB1qB, with

21、 probability p cB2qB with probability (1-p).Player state defined by its marginal costEach firm seeks to maximize its profit by anticipating the market priceDepartment of Mathematics Northwest UniversityCournot Model and Asymmetric InformationFirm B knows its state and Firm As stateFirm A knows its o

22、wn marginal cost but can only estimate Firm Bs stateEach firm knows of the others degree of knowledgeGibbons calls this a Bayesian game with asymmetric informationFirm A chooses the optimal quantity qA to produce:Firm B chooses the optimal quantity qB to produce For cB1:For cB2Department of Mathemat

23、ics Northwest UniversityAnalytical Solution: Bayesian Nash EquilibriumSystem of Equations:Solutions: Department of Mathematics Northwest UniversityBayesian Game with Continuous Type Space: AuctionConsider an auction comprising two bidders and one itemPlayers offer bids, b1 or b2, for the itemb1 & b2

24、 0, 1Each bidder values the item at v1 or v2 with payoff v1 p or v2 p, respectyivelyv1 & v2 0, 1Note: The latter term in this utility function applies only when bids are offered in fixed increments. For bids from the continuous set 0,1, this term is zero.Department of Mathematics Northwest Universit

25、yHarsanyi转换转换为了方便分析,对“斗鸡博弈”进行简化。假设参与人1是“强硬”的决斗者,参与人2可能是“强硬”的也可能是“软弱”的,参与人1不知道但参与人2清楚参与人2的性格,而且这一假设为所有的参与人所知道。 Department of Mathematics Northwest UniversityHarsanyi转换:在原博弈中引入一个“虚拟”参与人“自然”(nature,用N表示),构造一个参与人为两个决斗者和“自然”的三人博弈。 Department of Mathematics Northwest UniversityHarsanyi转换“自然”首先行动决定参与人2的性格特

26、征(即选择参与人2是“强硬”的还是“软弱”的),“自然”的选择参与人1不知道,但参与人2知道。Department of Mathematics Northwest University在“自然”选择后,参与人1和2再进行“斗鸡博弈”。 Department of Mathematics Northwest University在新构造的三人博弈中,“自然”的支付不必考虑。参与人1和2的支付由“斗鸡博弈”决定。Department of Mathematics Northwest University如果“自然”选择参与人2的性格特征是“强硬”的,则意味着参与人1与“强硬”的参与人2进行决斗,

27、博弈进入决策结x1,其支付(1)决定;Department of Mathematics Northwest University如果“自然”选择参与人2的性格特征是“软弱”的,则意味着参与人1与“软弱”的参与人2进行决斗,博弈进入决策结x2,其支付由(2)决定。Department of Mathematics Northwest UniversityHarsanyi通过引入“虚拟”参与人,将博弈的起始点由x1(或x2)提前至x0 ,从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性(即参与人1不知道“自然”的选择)。这种通过引入“虚拟”参与人来处理不完全信息博弈问题的方法亦称Ha

28、rsanyi转换。Department of Mathematics Northwest University注意:注意:尽管通过Harsanyi转换可将不完全信息博弈转换为完全信息博弈,但是,此时仍然不能利用前面的完全信息博弈问题的处理方法求解。原因在于,虚拟的参与人没有支付,因而其选择是随机的。Department of Mathematics Northwest University考察不完全信息博弈问题参与人的决策用p1表示参与人1认为“自然”选择参与人2为“强硬”的概率;用x表示“强硬”的决斗者2选择行动U的概率。v1(U)和v1(D)分别表示参与人1认为自己选择行动U和D时所能得到

29、的期望收益;Department of Mathematics Northwest UniversityDepartment of Mathematics Northwest Universityv1(U)的的计算:算:强硬的强硬的参与参与人人2: (p1)策略-概率: (U,U)-x (U,D)-1-x 支付: -4,-4 2,-2参与人1期望支付: -4x+2(1-x) 软弱的弱的参与参与人人2: (1-p1) 由于参与人1为强硬,而当他预感到参与人2为软弱时,参与人只会选择退缩,即策略: (U,D) 支付: 2,0期望支付: 2Department of Mathematics Nort

30、hwest Universityv1(D)的的计算:算:强硬的强硬的参与参与人人2: (p1)策略-概率: (D,U)-x (D,D)-1-x 支付: -2,2 0,0参与人1期望支付: -2x+0(1-x) 软弱的弱的参与参与人人2: (1-p1) 由于参与人1为强硬,而当他预感到参与人2为软弱时,参与人2只会退缩,即策略: (D,D) 支付: 0,1期望支付: 0Department of Mathematics Northwest University当 即 时,对参与人1来讲,其最优选择是U(即“冲上去”)。解释:由于 ,所以要保证 取到所有可能概率值,需 ,即 ,也就是说,当参与人1

31、认为参与人2是“强硬”决斗者的可能性不超过1/2时,就会选择“冲上去”。 Department of Mathematics Northwest University考察参与人2的选择软弱的参与人2只会选择行动D;强硬的参与人2的最优选择与参与人1的选择有关:一方面与参与人1关于“自然”选择的推断有关,另一方面,还与自己关于“参与人1关于“自然”的推断p1”的推断有关。用q1表示参与人2关于“参与人1关于自然选择的推断”的推断,即q1表示参与人2认为“参与人1认为参与人2是强硬的”概率。Department of Mathematics Northwest University类似前面的分析:

32、如果 ,则参与人2认为“U(即冲上去)是参与人1的最优选择”;与此同时,如果 ,则参与人1的最优选择与参与人2的预测一致。但是,如果 而 ,则参与人1的最优选择就可能与参与人2的预测不一致,此时,就无法对问题进行分析。Department of Mathematics Northwest University在在Harsanyi转换中规定:转换中规定:参与人关于“自然”选择的推断为共同知识。也就是说,两个决斗者不仅同时一起看到了“自然”随机选择参与人2的性格特征,而且同时一起看到了“自然”以何种概率分布随机选择参与人2的性格特征。Department of Mathematics Northw

33、est University不完全信息博弈经Harsanyi转换之后得到的完全但不完美信息博弈。(x, y)表示参与人1的性格特征为x,参与人2的性格特征为y;pxy表示“自然”选择(x, y)的概率,这里pxy为共同知识。 Department of Mathematics Northwest University在应用Harsanyi转换时,需要注意以下问题: (1) “自然”的选择。在一般的不完全信息博弈问题中,Harsanyi转换规定“自然”选择的是参与人的类型(type)。除了根据参与人的支付来划分参与人的类型以外,还可以根据参与人的行动空间,甚至根据参与人掌握信息的多少(或程度)来

34、来划分参与人的类型。 但是,需要注意的是,参与人的类型必须是其个人特征的一个完备描述,这种描述只有自己才能够观测到,其他的参与人观测不到。 Department of Mathematics Northwest University用ti表示参与人i的一个特定的类型,Ti表示参与人i所有类型的集合(亦称类型空间,type space),即 ,t=(t1,tn)表示一个所有参与人的类型组合, t-i=(t1,ti-1,tn)表示除参与人i之外其他参与人的类型组合。所以,t=(ti, t-i)。Department of Mathematics Northwest University2) 参与人

35、关于“自然”选择的推断。用p(t1,tn)表示定义在参与人类型组合上的一个联合分布密度函数,Harsanyi转换假定:对于一个给定的不完全信息博弈问题,存在一个参与人关于“自然”选择的推断p(t1,tn),且p(t1,tn)为共同知识。也就是说,Harsanyi转换假定所有参与人关于“自然”行动的信念(belief)是相同的,并且为共同知识。Department of Mathematics Northwest University用 表示参与人i在知道自己类型为ti的情况下,关于其他参与人类型的推断(即条件概率),则有(贝叶斯公式)其中, 为边缘密度函数。Department of Math

36、ematics Northwest University假设pss=0.2,psw=0.3,pws=0.25,pww=0.25。虽然决斗者1不知道决斗者2 的类型,但由于决斗者1知道自己的类型,因此他可以根据贝叶斯公式推知决斗者2的类型分布。Department of Mathematics Northwest University例如根据贝叶斯规则,“强硬”的决斗者1可以推知:决斗者2是“强硬”的概率为决斗者2是“软弱”的概率为“软弱”的决斗者1可以推知:决斗者2是“强硬”的概率为决斗者2是“软弱”的概率为 Department of Mathematics Northwest Univer

37、sity这里不同类型的决斗者1所形成的关于“自然”选择的推断是不同的,究其原因,Harsanyi认为:虽然理性的参与人在掌握同样的信息时对同一事件会形成相同的概率推断,但参与人各自掌握的信息不同时对同一事件就会形成不同的概率推断。Department of Mathematics Northwest University这说明在Harsanyi转换中,尽管参与人对包括自己在内的所有参与人的类型的联合概率推断(分布)都是一样的,但由于参与人掌握的私人信息不同,使得各自对其他参与人的类型的概率分布的推断不同。Department of Mathematics Northwest Universit

38、y贝叶斯博弈(the static Bayesian game)是关于不完全信息静态博弈的一种建模方式,也是不完全信息静态博弈的标准式描述。 Department of Mathematics Northwest University贝叶斯博弈的定义贝叶斯博弈包含以下五个要素:(1)参与人集合 ;(2)参与人的类型集T1,T2;(3)参与人关于其他参与人类型的推断 , ;(4) 参与人类型相依的行动集A(t1), A(tn);(5) 参与人类型相依的支付函数 , 。Department of Mathematics Northwest University参与人的推断 来源于一个共同的参与人关

39、于“自然”选择的推断 p(t1,tn),且p(t1,tn)为共同知识。所以,贝叶斯博弈中参与人所具有的关于其他参与人的类型的推断是一致的。如果 ,即所有参与人的类型只有一个,那么不完全信息静态博弈就退化为完全信息静态博弈。Department of Mathematics Northwest University规定贝叶斯博弈的时间顺序如下:(1)“自然”选择参与人的类型组合t=(t1,tn);(2)参与人i观测到“自然”关于自己类型ti的选择;虽然参与人i观测不到“自然”关于其他参与人类型t-i的选择,但参与人i具有关于其他参与人类型的推断 ;(3)参与人同时选择行动,每个参与人i从行动集A

40、i(ti)中选择行动ai(ti) ;(4)参与人i得到 。Department of Mathematics Northwest University贝叶斯博弈中的战略在贝叶斯博弈 中,参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti),它包含了当自然赋予i的类型为ti时,i将从可行的行动集Ai(ti)中选择的行动。Department of Mathematics Northwest University“斗鸡博弈”的贝叶斯模型参与人为决斗者1和2;用s表示决斗者是“强硬”的,w表示决斗者是“软弱”的,所以T1=T2=s,w。用pxy表示“自然”选择类型组合(x,y)的

41、概率,并假设pxy为共同知识,则每位决斗者i关于其对手类型的推断pi(x|y)可利用贝叶斯公式计算。每位决斗者i关于类型相依的行动空间Ai(x)=U,D。每位决斗者i的支付由前面的图决定。Department of Mathematics Northwest University在贝叶斯博弈中参与人的战略可定义为(1)战略 “强硬”的决斗者i选择行动U,“软弱”的决斗者选择行动U ,即(U,U);(2)战略 “强硬”的决斗者选择行动U ,“软弱”的决斗者选择行动D,即(U,D);(3)战略 “强硬”的决斗者选择行动D,“软弱”的决斗者选择行动U ,即(D,U);(4)战略 “强硬”的决斗者选择

42、行动D,“软弱”的决斗者选择行动D,即(D,D)。Department of Mathematics Northwest University问题:问题: 1. 如何定义贝叶斯博弈的解: 2. 如何求解贝叶斯博弈?Department of Mathematics Northwest University主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释第十章贝叶斯博弈与贝叶斯第十章贝叶斯博弈与贝叶斯Nash均衡均衡Department of Mathematics Northwest University以斗鸡博弈为例:用x表示“

43、强硬”的决斗者2选择行动U的概率,y表示决斗者1选择行动U的概率。决斗者1选择行动U和D的期望收益分别为 : , 这里p为“自然”选择决斗者2为“强硬”的概率。决斗者1的最优战略为: 如果 ,则选择y=1(即选择行动U); 如果 ,则选择y=0(即选择行动D); 如果 ,则选择 (即选择任一混合战略)。 Department of Mathematics Northwest University考察“强硬”决斗者2的选择。“强硬”决斗者2选择行动U和D的期望收益分别为 , “强硬”决斗者2的最优战略为: 如果y1/2,则选择x=0(即选择行动D); 如果y=1/2,则选择 (即选择任一混合战略

44、)。Department of Mathematics Northwest University不完美信息博弈存在如下两个纯战略Nash均衡(1)决斗者1选择行动U,“强硬”决斗者2选择行动D,“软弱”决斗者2选择行动D;(2)决斗者1选择行动D,“强硬”决斗者2选择行动U,“软弱”决斗者2选择行动D。此外,博弈还存在一个混合战略Nash均衡,即决斗者1以1/2的概率选择行动U,“强硬”决斗者2以的概率1/(2p)选择行动U,“软弱”决斗者2选择行动D。 Department of Mathematics Northwest University用 表示给定其他参与人的战略 ,类型为ti的参与

45、人i选择行动ai时的期望效用,则其中,对 , 为给定t-i时由s-i所确定的其他参与人的行动组合Department of Mathematics Northwest University“斗鸡博弈”中,“强硬”的决斗者1关于对手类型的推断为Department of Mathematics Northwest University所以,当决斗者2的战略为 (即(U,U),则“强硬”的决斗者1选择行动U和D时的期望效用分别为Department of Mathematics Northwest University当决斗者2的战略为 (即(U,D),则“强硬”的决斗者1选择行动U和D时的期望效

46、用分别为Department of Mathematics Northwest University在贝叶斯博弈中,对于一个理性的参与人i,当他只知道自己的类型ti而不知道其他参与人的类型时,给定其他参与人的战略s-i ,他将选择使自己期望效用(支付)最大化的行动 ,其中Department of Mathematics Northwest University纯战略贝叶斯Nash均衡 贝叶斯博弈 的纯战略贝叶斯Nash均衡是一个类型相依的行动组合 ,其中每个参与人在给定自己的类型ti和其他参与人的类型相依行动 的情况下最大化自己的期望效用。也就是,行动组合 是一个纯战略贝叶斯Nash均衡,如

47、果对 ,Department of Mathematics Northwest University存在性结论定理 一个有限的贝叶斯博弈一定存在贝叶斯Nash均衡。Department of Mathematics Northwest University贝叶斯Nash均衡的求解先以简化的“斗鸡博弈”为例。用p表示决斗者1关于决斗者2的类型的推断。 Department of Mathematics Northwest University(x,(y,z):x表示当决斗者2选择该方格所对应的战略时,决斗者1选择该方格所对应的战略规定的行动所得到的期望支付;y和z分别表示当决斗者1选择该方格所对

48、应的战略时,“强硬”决斗者2和“软弱”决斗者2选择该方格所对应的战略规定的行动所得到的期望支付。 Department of Mathematics Northwest University给定决斗者1选择战略U,“软弱”决斗者2选择行动D的期望支付为0,选择行动U的期望支付为-4,行动D优于行动U;给定决斗者1选择战略D,“软弱”决斗者2选择行动D的期望支付为1,选择行动U的期望支付为0,所以,行动D优于行动U。这意味着战略(U,U)和(D,U)为决斗者2的劣战略。Department of Mathematics Northwest University剔除劣战略后,有Department

49、 of Mathematics Northwest University 下面根据p的大小,求解博弈的纯战略贝叶斯 Nash均衡。若 ,无论决斗者2选择战略(U,D)还是(D,D),决斗者1的最优行动都是U。因此,D是决斗者1的劣战略。显然此时,决斗者2选择(D,D)占优。给定决斗者1的选择U ,“强硬”决斗者2的最优行动为D。所以,博弈存在惟一的纯战博弈存在惟一的纯战略贝叶斯略贝叶斯NashNash均衡均衡决斗者1选择行动U,“强硬”决斗者2选择行动D,“软弱”决斗者2选择行动D。Department of Mathematics Northwest University若 ,博弈存在如下两

50、个纯战略贝叶斯Nash均衡: (1) 决斗者1选择行动U,“强硬”决斗者2选择行动D,“软弱”决斗者2选择行动D; (2) 决斗者1选择行动D,“强硬”决斗者2选择行动U,“软弱”决斗者2选择行动D。Department of Mathematics Northwest University求解“斗鸡博弈”的贝叶斯Nash均衡假设“强硬”决斗者1关于决斗者2的类型推断 ;“软弱”决斗者1关于决斗者2的类型推断 ;“强硬”决斗者2关于决斗者1的类型推断 ; “软弱”决斗者2关于决斗者1的类型推断 ;Department of Mathematics Northwest University 的含

51、义是:x1和x2分别表示当决斗者2选择该方格所对应的战略时,“强硬”决斗者1和“软弱”决斗者1选择该方格所对应的战略规定的行动所得到的期望支付;y1和y2分别表示当决斗者1选择该方格所对应的战略时,“强硬”决斗者2和“软弱”决斗者2选择该方格所对应的战略规定的行动所得到的期望支付。Department of Mathematics Northwest UniversityDepartment of Mathematics Northwest University对于“软弱”决斗者1,无论决斗者2选择什么战略,其最优行动都是D。所以,战略(U,U)和(D,U)为决斗者1的劣战略。基于同样的原因,

52、战略(U,U)和(D,U)为决斗者2的劣战略。Department of Mathematics Northwest UniversityDepartment of Mathematics Northwest University对于“强硬”决斗者1,无论决斗者2选择什么战略,其最优行动都是U。所以,战略(D,D)为决斗者1的劣战略。给定决斗者1选择战略(U,D),对于决斗者2战略(D,U)和(D,D)是无差异的。Department of Mathematics Northwest University所以,博弈存在如下两个纯战略Nash均衡:(1)“强硬”的决斗者1和2选择行动U,“软弱”

53、的决斗者1和2选择行动D;(2)“强硬”的决斗者1选择行动U,“软弱”的决斗者1选择行动D;“强硬”的决斗者2和“软弱”的决斗者2选择行动D。Department of Mathematics Northwest University贝叶斯Nash均衡定义的另一种表示方式在静态贝叶斯博弈 中,战略组合 是一个纯战略贝叶斯Nash均衡,如果对 及 ,满足即没有参与人愿意改变自己的战略,即使这种改变只涉及一种类型下的一个行动。Department of Mathematics Northwest University简化的“斗鸡博弈”的纯战略贝叶斯Nash均衡为:如果p1/2 ,博弈的纯战略贝叶斯

54、Nash均衡为(U,(D,D)和(D,(U,D)。Department of Mathematics Northwest University “斗鸡博弈”的纯战略贝叶斯Nash均衡为: (U,D),(U,D)和(U,D),(D,D)。Department of Mathematics Northwest University主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释第十章贝叶斯博弈与贝叶斯第十章贝叶斯博弈与贝叶斯Nash均衡均衡Department of Mathematics Northwest University1.

55、不完全信息古诺模型在Cournot模型中,每一个企业对其他企业的成本和自己的成本是已知的,因而信息是完全的。然而在实际中,企业往往很难知道其他企业的成本。当Cournot模型中至少有一个企业不知道其他企业的成本时所对应的模型即为不完全信息的Cournot模型。 参与人类型成本函数。Department of Mathematics Northwest University假设:企业1的成本函数为共同知识:企业2的成本函数为私人信息: 其中,企业1知道企业2是 的概率为p,是 的的概率是1-p,p和1-p为共同知识。Department of Mathematics Northwest Univ

56、ersity市场需求:Department of Mathematics Northwest University进一步假设:Department of Mathematics Northwest University企业2:Department of Mathematics Northwest University令 则Department of Mathematics Northwest University企业2的反应函数Department of Mathematics Northwest University 不仅与企业1的产量有关,而且与自己的成本有关。Department of

57、Mathematics Northwest UniversityDepartment of Mathematics Northwest University企业1: 企业1不知道企业2的真实成本,因而也不知道企业2的最优反应是 企业将选择使期望利润最大化的产量。Department of Mathematics Northwest UniversityDepartment of Mathematics Northwest University由最优化一阶条件得:即企业1的反应函数。Department of Mathematics Northwest University联立求解两个反应函数,

58、得贝叶斯Nash均衡为:Department of Mathematics Northwest University两种均衡的比较:企业2为低成本:Department of Mathematics Northwest University企业2为高成本:Department of Mathematics Northwest University均衡比较示意图NEBNE1/3q1 q2 企业1的反应函数低成本的企业2的反应函数高成本的企业2的反应函数Department of Mathematics Northwest University假设:共同知识共同知识Department of Ma

59、thematics Northwest University企业1低成本类型(l )Department of Mathematics Northwest University企业1低成本类型(l )的反应函数Department of Mathematics Northwest University企业1高成本类型(H)Department of Mathematics Northwest University企业2低成本类型(l )Department of Mathematics Northwest University企业2 高成本类型(H)Department of Mathemat

60、ics Northwest University联立求解(1.1)(1.4),即可得贝叶斯Nash均衡。Department of Mathematics Northwest University2.不完全信息下的公共产品提供参与人类型成本函数。两个参与人1、2同时决定是否提供公共产品,每个参与人面临的是一个 01决策问题,即提供或不提供。Department of Mathematics Northwest University公共产品博弈Department of Mathematics Northwest University假设:1.公共产品的好处(每人一个单位)为共同知识,但每人的成

61、本只有自己知道;2.c1和c2具有相同的、独立定义在 上的分布函数P(),其中 , P()为共同知识。Department of Mathematics Northwest University参与人的纯战略a(ci)定义为其中,0表示不提供,1表示提供。参与人的支付为:Department of Mathematics Northwest University两个参与人1、2同时决定是否提供公共产品,每个参与人面临的是一个 01决策问题,即提供或不提供。Department of Mathematics Northwest UniversityDepartment of Mathematic

62、s Northwest University令 表示均衡状态下参与人j提供的概率。Department of Mathematics Northwest University参与人i的反应函数应是: 对方提供,则不提供;对方不提供则考虑提供。Department of Mathematics Northwest University参与人i的提供的预期收益为:因此,只有当 时,参与人i才会提供。Department of Mathematics Northwest UniversityDepartment of Mathematics Northwest University因此,存在 使得只

63、有当 时,参与人i才会提供。同理,存在 使得只有当 时,参与人j才会提供。Department of Mathematics Northwest University由于Department of Mathematics Northwest University所以同理Department of Mathematics Northwest University由于以上两式可知, 都必须满足具体的均衡取决与分布函数P()的形式。Department of Mathematics Northwest UniversityDepartment of Mathematics Northwest Uni

64、versity11222/32/3公共产品提供区域完全信息下新增区域公共产品提供:完全信息与不完全信息的比较Department of Mathematics Northwest University3.一级价格密封拍卖 参与人投标人1、2; 战略报价 ; 支付净收益Department of Mathematics Northwest UniversityDepartment of Mathematics Northwest University博弈规则:两人同时报价(报价需大于 0),报价高的一方得到标的物,并支付所报价格;报价低的一方的收益和支付都为0。Department of Mat

65、hematics Northwest University在一级价格密封拍卖中,Department of Mathematics Northwest UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Nort

66、hwest University主要内容:一、贝叶斯博弈二、贝叶斯Nash均衡三、贝叶斯Nash均衡的应用四、关于混合战略Nash均衡的一个解释第十章贝叶斯博弈与贝叶斯第十章贝叶斯博弈与贝叶斯Nash均衡均衡Department of Mathematics Northwest University四、关于混合战略Nash均衡的一个解释性别战博弈Department of Mathematics Northwest University上述博弈除了存在两个纯战略Nash均衡外,还有以下混合战略均衡:Department of Mathematics Northwest UniversityHa

67、rsanyi认为: 参与人i对参与人j的混合战略表示了参与人i对参与人j所选择的纯战略的不确定性,而j的选择又依赖于他(她)的一点私人信息。Department of Mathematics Northwest University不完全信息的性别战博弈Department of Mathematics Northwest UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Northwest

68、 UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Northwest UniversityDepartment of Mathematics Northwest University 完全信息博弈的混合战略 Nash 均衡可以解释为与之密切相关、存在一小点非完全信息的博弈的纯战略贝叶斯 Nash 均衡。Department of Mathematics Northwest UniversityDepartment of Mathematics Northwest University

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号