博弈论_贝叶斯博弈与贝叶斯nash均衡

上传人:小** 文档编号:84759825 上传时间:2019-03-04 格式:PPT 页数:160 大小:1.05MB
返回 下载 相关 举报
博弈论_贝叶斯博弈与贝叶斯nash均衡_第1页
第1页 / 共160页
博弈论_贝叶斯博弈与贝叶斯nash均衡_第2页
第2页 / 共160页
博弈论_贝叶斯博弈与贝叶斯nash均衡_第3页
第3页 / 共160页
博弈论_贝叶斯博弈与贝叶斯nash均衡_第4页
第4页 / 共160页
博弈论_贝叶斯博弈与贝叶斯nash均衡_第5页
第5页 / 共160页
点击查看更多>>
资源描述

《博弈论_贝叶斯博弈与贝叶斯nash均衡》由会员分享,可在线阅读,更多相关《博弈论_贝叶斯博弈与贝叶斯nash均衡(160页珍藏版)》请在金锄头文库上搜索。

1、第三部分: 不完全信息静态博弈,Department of Mathematics Northwest University,主要内容: 一、贝叶斯博弈 二、贝叶斯Nash均衡 三、贝叶斯Nash均衡的应用 四、关于混合战略Nash均衡的一个解释,第十章贝叶斯博弈与贝叶斯Nash均衡,Department of Mathematics Northwest University,一、贝叶斯博弈,前面两部分我们讨论了完全信息博弈问题,但在现实生活中我们遇到更多的可能是不完全信息博弈问题。,Department of Mathematics Northwest University,例如,在“新产品

2、开发”博弈中,企业对市场的需求可能并不清楚; 在连锁店博弈中,潜在的进入者可能并不知道连锁店在市场上的盈利情况,等等。,Department of Mathematics Northwest University,新产品开发博弈:考察一种新产品开发:两个企业准备各自 开发同一种新产品,并投放市场。开发中企业的投入、产出如图,企业1,开发(a):投资2000,不开发(b),需求大,需求小,企业2不开发,获利800 企业2开发,获利300,企业2不开发,获利200 企业2开发,赔400,Department of Mathematics Northwest University,某著名品牌的连锁店

3、(不妨称为参与人A)在K个城市中有分店,城市标号为1,K。在每个城市k(k=1,K)有惟一一个潜在竞争者(称为参与人k),该竞争者决定是否与参与人A竞争进入(用I表示)和不进入(用O表示)。如果参与人k决定去竞争,那么参与人A可以抵制(用F表示)也可以不抵制(用C表示)。,连锁店博弈,Department of Mathematics Northwest University,不完全信息博弈问题,将博弈开始时就存在事前不确定性的博弈问题称为不完全信息博弈问题。,Department of Mathematics Northwest University,例子:斗鸡博弈,两个所谓的勇士举着长枪,

4、准备从独木桥的两端冲上桥中央进行决斗。每位勇士都有两种选择:冲上去(用U表示),或退下来(用D表示)。若两人都冲上去,则两败俱伤;若一方上去而另一方退下来,冲上去者取得胜利(至少心理上是这样的),退下来的丢了面子;若两人都退下来,两人都丢面子。,Department of Mathematics Northwest University,考察这样的情形:假设参与人可能有这样的两种性格特征(类型)“强硬”(用s表示)或“软弱”(用w表示)。 所谓“强硬”的参与人是指那些喜欢争强好胜、不达目的誓不罢休的决斗者; 而“软弱”的参与人是指那些胆小怕事、遇事希望息事宁人的决斗者。,Department

5、of Mathematics Northwest University,显然,当具有不同性格特征的决斗者相遇时,所表现出来的博弈情形是不同的。 令U表示冲上去;D表示退下去,则每种情况下博弈情形如下图所示。,Department of Mathematics Northwest University,当参与人都为强硬者时,博弈存在两个纯战略Nash均衡 (U,D)和(D,U)。 解释:双方都争强好胜,但都不愿意发生直接冲突,都希望在自己冲上去时,对方退下来。,Department of Mathematics Northwest University,当参与人1为强硬者参与人2为软弱者时,博弈

6、存在唯一的Nash均衡(U, D)。 软弱的决斗者胆小怕事,总是退下来,因此,强硬的决斗者选择冲上去。,Department of Mathematics Northwest University,当参与人1为软弱者参与人2为强硬者时,博弈存在唯一的Nash均衡(D, U)。,Department of Mathematics Northwest University,当参与人都为软弱者时,博弈存在唯一的Nash均衡(D, D)。 双方都息事宁人,希望和平共处,因此双方都选择退下来。,Department of Mathematics Northwest University,(1) 参与人都

7、为强硬者,(2) 参与人1为强硬者参与人2为软弱者,(3) 参与人1为软弱者参与人2为强硬者,(4) 参与人都为软弱者,Department of Mathematics Northwest University,在“斗鸡博弈”中,虽然在博弈开始之前每位决斗者都了解(知道)自己的性格特征,但对对手的性格特征往往不甚了解或了解不全。 在这种情况下即使所有的决斗者都看到了上面的四个战略式博弈 ,但对决斗者来讲,仍存在着所谓的事前不确定性即博弈开始之前就不知道的信息。,Department of Mathematics Northwest University,对于“强硬”的参与人1来讲,虽然他看到

8、了上面的战略式博弈,但他不知道对手是“强硬”的还是“软弱”的,所以博弈开始之前他无法确定博弈是根据(1)还是(2)进行。 这意味着“强硬”的参与人1面临着事前无法确定的信息。,Department of Mathematics Northwest University,同样,“软弱”的参与人1也会面临类似的问题。此时,“斗鸡博弈”就是一个不完全信息博弈问题。,Department of Mathematics Northwest University,对于不完全信息博弈问题,是不可能应用前面两部分介绍的方法进行求解的。,Department of Mathematics Northwest U

9、niversity,这是因为给定参与人1为“强硬”的决斗者,如果对手是“软弱”的,那么博弈就只存在惟一的Nash均衡(U, D),参与人1有惟一的最优选择“冲上去”;如果对手是“强硬”的,则博弈就会出现两个Nash均衡(U,D)和(D,U),参与人1的最优选择取决于对手的选择。,Department of Mathematics Northwest University,但由于参与人1不知道对手究竟是“强硬”的还是“软弱”的,因此,此时的参与人1就觉得自己似乎是在与两个决斗者进行决斗,一个是“强硬”的,另一个是“软弱”的。 当一个参与人并不知道在与谁博弈时,博弈的规则是没有意义的。,Depar

10、tment of Mathematics Northwest University,如何处理不完全信息博弈问题?,Department of Mathematics Northwest University,Example: Scalping Tickets,For example, consider a scenario in which you and the Cavalier are each scalping tickets for beer money before the UVa-Miami football game For every discrete round of the

11、 game, each player assumes one of two types and can take one of two actions (stand in one of two locations) Types: Buyer or Seller Locations: in front of Durty Nellies Pub or at the Frys Spring Garage You know that you are either buying or selling and you know with probability p that the Cavalier is

12、 buying, and selling otherwise Four payoff matrices for the four possible type match-ups Choose a spot to maximize profit (Durty Nellies or Frys Spring Garage) based on your type and your best guess of the Cavs type,Department of Mathematics Northwest University,A Better Example from Harsanyi,Consid

13、er two Generals A and B A seeks to maximize (maxmin) payoff and B seeks to minimize (minmax) payoff Fixed action profiles: (a1, a2) and (b1, b2) Each leads an army which assumes one of two states: Strong or Weak This yields four possible match-ups (AS, BS), (AS, BW), (AW, BS), (AW, BW) with corresponding payoff matrices, each having its own Nash equilibrium:,Harsanyi,= (.4)(-1) + (.1)(0) + (.2)(28) + (.3)(12) = 8.8,AS a2, AW a1,BS b

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 商业/管理/HR > 管理学资料

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号