不完全信息博弈和贝叶斯均衡

资源描述

《不完全信息博弈和贝叶斯均衡》由会员分享，可在线阅读，更多相关《不完全信息博弈和贝叶斯均衡（57页珍藏版）》请在金锄头文库上搜索。

1、第三章：不完全信息静态博弈主要内容：一、不完全信息博弈和贝叶斯纳什均衡二、贝叶斯均衡的应用三、贝叶斯博弈与混合战略均衡四、机制设计理论与显示原理思考：一、选课的问题二、看电影的问题三、制度和习俗的作用第一节第一节不完全信息博弈不完全信息博弈和贝叶斯均衡和贝叶斯均衡一、贝叶斯博弈二、海萨尼转换三、贝叶斯博弈的战略式描述四、贝叶斯纳什均衡一、贝叶斯博弈一、贝叶斯博弈完全信息complete information：不存在事前的不对称信息，每个参与人对其他参与人的支付函数有准确的了解；完美信息perfect information：在博弈过程的任何时点，每个参与人都能观察到并记忆之前各参

2、与人所选择的行动。前面两章我们讨论了完全信息博弈问题，但在现实生活中我们遇到更多的可能是不完全信息博弈问题。例如：在企业的新产品开发过程中，企业对市场的需求可能并不清楚；在连锁店博弈中，潜在的进入者可能并不知道在位者在市场上的盈利情况。40，50 -10，030，80-10，1000，300 0，3000，400 0，400 高本钱高本钱低本钱低本钱默许默许斗争斗争默许默许斗争斗争进入进入不进入不进入进进入入者者在位者在位者市场进入博弈：不完全信息市场进入博弈：不完全信息在位者的本钱有两种类型，而进入者并不知道在位者的本钱类型。在这种情形下，进入者有关在位者的本钱信息是不完全的

3、。当在位者具有不同的本钱时，所表现出来的博弈情形是不一样的，对应的均衡也是不一样的。高本钱情形：进入，默许不进入，斗争低本钱情形：不进入，斗争斗鸡博弈斗鸡博弈两个所谓的勇士举着长枪，准备从独木桥的两端冲上桥中央进行决斗。每位勇士都有两种选择：冲上去(用U表示)，或退下来(用D表示)。假设两人都冲上去，那么两败俱伤；假设一方上去而另一方退下来，冲上去者取得胜利，退下来的丢了面子(至少心理上是这样的)；假设两人都退下来，两人都丢面子。存在两个纯战略Nash均衡(U，D)和(D，U)，也就是一个人冲上去，另一个就必须退下来。当一个理性的参与人预测到对方将会冲上去时，明智的选择就是退下来；而当

4、预测到对方将会选择退却时，就应该大胆地冲上去。-4, -42, -2-2, 20, 0UD21UD现在考虑这样的情形：假设参与人可能有这样的两种性格特征(类型)“强硬(用s表示)或“软弱(用w表示)。 “强硬的参与人：争强好胜、不达目的誓不罢休的决斗者；“软弱的参与人：胆小怕事、遇事希望息事宁人的决斗者。斗鸡博弈：不完全信息斗鸡博弈：不完全信息强硬强硬软弱软弱 U D U DU D U D1 2 1，1 0，0 1，0 0，2 0，0 -4，-4 0，-2 -4，-4 0，1 -2，0 0，0 -2，2 2，0 -4，-4 2，-2 -4，-4 U D U U D D强硬强硬软弱软弱斗

5、鸡博弈：不完全信息斗鸡博弈：不完全信息(1) 参与人都为强硬者(2) 参与人1为强硬者参与人2为软弱者(3) 参与人1为软弱者参与人2为强硬者(4) 参与人都为软弱者在“斗鸡博弈中，虽然在博弈开始之前每位决斗者都知道自己的性格特征，但对对手的性格特征往往不甚了解。这意味着，当博弈真正开始的时候，双方对到底表达为哪一种博弈情形并不清楚。在这种情况下，对每位决斗者而言，存在事先的不确定性，即博弈开始之前就不知道的信息。例如，对于“强硬的参与人1来讲，虽然他知道自己的类型，但他不知道对手是“强硬的还是“软弱的，所以博弈开始之前他无法确定博弈是根据(1)还是(2)进行，这意味着“强硬的参与人1面临着

6、事前无法确定的信息。同样，“软弱的参与人1也会面临类似的问题。此时，“斗鸡博弈就是一个不完全信息博弈问题。从这一例子来看，博弈的参与人均存在两种不同的类型，即强硬和软弱；由于参与人1不知道对手究竟是“强硬的还是“软弱的，因此，此时参与人1就好似在与两个决斗者进行决斗一样，一个是“强硬的，另一个是“软弱的；当一个参与人并不知道在与谁博弈时，博弈的规那么是无法定义的，如何处理不完全信息导致的这一问题？为了解决该问题，海萨尼提出了Harsanyi转换。海萨尼提出的解决方法：引入虚拟参与人自然，由自然首先决定参与人的不同类型，从而将不完全信息博弈转换为不完美信息博弈。二、海萨尼二、海萨尼Harsany

7、i转换转换为了解释Harsanyi转换的具体含义，我们对“斗鸡博弈进行简化。假设参与人1是“强硬的决斗者，参与人2可能是“强硬的也可能是“软弱的，参与人1不知道参与人2的类型，但参与人2知道自己的类型，而且这一假设为所有的参与人所知道。 Harsanyi转换对于简化的“斗鸡博弈，Harsanyi转换是这样处理的：在原博弈中引入一个“虚拟的参与人“自然(nature，用N表示)，构造一个参与人为两个决斗者和“自然的三人博弈。 Harsanyi转换“自然首先行动决定参与人2的性格特征(即选择参与人2是“强硬的还是“软弱的)，“自然的选择参与人1不知道，但参与人2知道。参与人2的特征在“自然选择后，

8、参与人1和2再进行“斗鸡博弈。在新构造的三人博弈中，“自然的支付不必考虑。参与人1和2的支付由“斗鸡博弈决定。如果“自然选择参与人2的性格特征是“强硬的，那么意味着参与人1与“强硬的参与人2进行决斗，博弈进入决策结x1；如果“自然选择参与人2的性格特征是“软弱的，那么意味着参与人1与“软弱的参与人2进行决斗，博弈进入决策结x2。海萨尼通过引入“虚拟参与人，将博弈的起始点由x1或x2提前至x0 ，从而将原博弈中参与人的事前不确定性转变为博弈开始后的不确定性。这种通过引入“虚拟参与人，来处理不完全信息博弈问题的方法称为 Harsanyi转换。在Harsanyi转换中规定：参与人关于“自然选择的推

9、断为共同知识。也就是说，两个决斗者不仅同时一起看到了“自然随机选择参与人2的性格特征，而且同时一起看到了“自然以一定的概率分布随机选择参与人2的性格特征。在应用Harsanyi转换时，需要注意以下问题： 1) “自然的选择。在一般的不完全信息博弈问题中，Harsanyi转换规定“自然选择的是参与人的类型(type)。除了根据参与人的支付来划分参与人的类型以外，还可以根据参与人的行动空间，甚至根据参与人掌握信息的多少(或对信息的了解程度)来划分参与人的类型。用ti表示参与人i的一个特定的类型，Ti表示参与人i所有类型的集合(亦称类型空间，type space)，即，t=(t1,tn)表示所有参

10、与人的类型组合， t-i=(t1,ti-1,tn)表示除参与人i之外其他参与人的类型组合。所以，t=(ti, t-i)。用表示参与人i在知道自己类型为ti的情况下，关于其他参与人类型的推断(即条件概率)，那么2) 参与人关于“自然选择的推断。用p(t1,tn)表示定义在参与人类型组合上的一个联合分布概率函数。假设pss=0.2，psw=0.3，pws=0.25，pww=0.25。其中， pss：决斗者1和决斗者2同时强硬的概率； psw：决斗者1强硬、决斗者2软弱的概率； pws：决斗者1软弱、决斗者2强硬的概率； pww：决斗者1软弱、决斗者2软弱的概率；虽然决斗者1不知道决斗者2 的类型

11、，但由于决斗者1知道自己的类型，因此他可以根据贝叶斯公式推知决斗者2的类型分布。例如根据贝叶斯规那么，“强硬的决斗者1可以推知：决斗者2是“强硬的概率为决斗者2是“软弱的概率为“软弱的决斗者1可以推知：决斗者2是“强硬的概率为决斗者2是“软弱的概率为不完全信息博弈：完全信息博弈在不完全信息上的拓展，我们又将其称为贝叶斯博弈；贝叶斯博弈：静态贝叶斯博弈和动态贝叶斯博弈；三、贝叶斯博弈的战略式描述贝叶斯博弈的定义贝叶斯博弈包含以下五个要素：(1)参与人集合；(2)参与人的类型集合T1,T2；(3)参与人关于其他参与人类型的推断 , ；(4) 参与人类型相依的行动集A(t1), A(t

12、n)；(5) 参与人类型相依的支付函数 , 。贝叶斯博弈中的战略在贝叶斯博弈中，参与人i的一个战略是从参与人的类型集Ti到其行动集的一个函数si(ti)；它包含了当自然赋予i的类型为ti时，i将从可行的行动集Ai(ti)中选择的行动。用表示给定其他参与人的战略，类型为ti的参与人i选择行动ai时的期望效用，那么其中，对，为给定t-i时由s-i所确定的其他参与人的行动组合贝叶斯博弈的时间顺序如下：(1)“自然选择参与人的类型组合t=(t1,tn)，其中，参与人i观测到“自然关于自己类型ti的选择；虽然参与人i观测不到“自然关于其他参与人类型t-i的选择，但参与人i具有关于其他参与人类

13、型的推断；(2)参与人同时选择行动，每个参与人i从行动集Ai(ti)中选择行动ai(ti) ；(3)参与人i得到。“斗鸡博弈的贝叶斯模型参与人为决斗者1和2；用s表示决斗者是“强硬的，w表示决斗者是“软弱的，所以T1=T2=s,w。用pxy表示“自然选择类型组合(x,y)的概率，并假设pxy为共同知识，那么决斗者1关于其对手类型的推断为p1(y|x)。决斗者1类型相依的行动空间A1(x)=U,D，决斗者2类型相依的行动空间A2(y)=U,D。每位决斗者i的支付由前面的图决定。在贝叶斯博弈中，对于一个理性的参与人i，当他只知道自己的类型ti而不知道其他参与人的类型时，给定其他参与人的战略s-

14、i ，他将选择使自己期望效用(支付)最大化的行动，其中四、贝叶斯纳什均衡纯战略贝叶斯Nash均衡贝叶斯博弈的纯战略贝叶斯Nash均衡是一个类型相依的行动组合，其中每个参与人在给定自己的类型ti和其他参与人类型相依的行动的情况下，最大化其期望效用。也就是，行动组合是一个纯战略贝叶斯Nash均衡，如果对，贝叶斯博弈纳什均衡的存在性定理一个有限的贝叶斯博弈一定存在贝叶斯Nash均衡。类型1类型2左右左右3，12，03，02，10，14，00，04，1上下甲乙静态贝叶斯博弈均衡举例：表中甲、乙同时行动，甲只有一种类型，但乙有两种类型：2=1，2；甲不了解对方是哪一种类型，但他

15、相信对方为1、2的概率各为1/2。求解均衡。乙：如果为1，有占优战略为“左；如果为2，有占优战略为“右甲：由于甲相信对方为两种类型的可能性各为1/2，故甲考虑选“上和“下分别给他带来的期望收益；结果选“上，期望支付为5/2，选“下，期望支付为2，因而甲的最优选择是“上。纳什均衡为s1*=上；s2*(1)=左，s2*(2)=右。贝叶斯Nash均衡的求解：简化的“斗鸡博弈：强硬强硬软弱软弱 U D U DU D U D1 2 0，1 -2，0 0，0 -2，2 2，0 -4，-4 2，-2 -4，-4 U D 强硬强硬-4, -42 , -2-2, 20, 0 U21UD 2，0 D D0，1

16、在上述博弈中参与人2的战略可定义为战略 “强硬的决斗者选择行动U，“软弱的决斗者选择行动U ，即(U,U)；战略 “强硬的决斗者选择行动U ，“软弱的决斗者选择行动D，即(U,D)；战略 “强硬的决斗者选择行动D，“软弱的决斗者选择行动U ，即(D,U)；战略 “强硬的决斗者选择行动D，“软弱的决斗者选择行动D，即(D,D)。用p表示决斗者1关于决斗者2的类型的推断，即决斗者1认为决斗者2为强硬的概率为p。 (x,(y,z)：x表示当决斗者2选择该方格所对应的战略时，决斗者1选择该方格所对应的战略规定的行动所得到的期望支付；y和z分别表示当决斗者1选择该方格所对应的战略时，“强硬决斗者2和“软

17、弱决斗者2选择该方格所对应的战略规定的行动所得到的期望支付。 -4, -42 , -2-2, 20, 0 U21UD 2，0 D D0，1下面根据p的大小，求解博弈的纯战略贝叶斯 Nash均衡。情形1：，无论决斗者2选择战略(U,D)还是(D,D)，决斗者1的最优行动都是U。给定决斗者1的选择U ，“强硬决斗者2的最优行动为D。所以，博弈存在惟一的纯战略贝叶斯Nash均衡决斗者1选择行动U，“强硬决斗者2选择行动D，“软弱决斗者2选择行动D。情形2：：博弈存在如下两个纯战略贝叶斯Nash均衡：(1) 决斗者1选择行动U，“强硬决斗者2选择行动D，“软弱决斗者2选择行动D；(2) 决斗者1选

18、择行动D，“强硬决斗者2选择行动U，“软弱决斗者2选择行动D。求解另一种情形下“斗鸡博弈的贝叶斯Nash均衡强硬强硬软弱软弱 U D U DU D U D 1，1 0，0 1，0 0，2 0，0 -4，-4 0，-2 -4，-4 0，1 -2，0 0，0 -2，2 2，0 -4，-4 2，-2 -4，-4 U D U U D D强硬强硬软弱软弱求解另一种情形下“斗鸡博弈的贝叶斯Nash均衡假设“强硬决斗者1关于决斗者2的类型推断；“软弱决斗者1关于决斗者2的类型推断；“强硬决斗者2关于决斗者1的类型推断； “软弱决斗者2关于决斗者1的类型推断；强硬强硬软弱软弱 U D U

19、 DU D U D 1，1 0，0 1，0 0，2 0，0 -4，-4 0，-2 -4，-4 0，1 -2，0 0，0 -2，2 2，0 -4，-4 2，-2 -4，-4 U U D D U U D D强硬强硬软弱软弱强硬强硬软弱软弱 U D U DU D U D 1，1 0，0 1，0 0，2 0，1 -2，0 0，0 -2，2 2，0 -4，-4 2，-2 -4，-4 U U D D D D 强硬强硬软弱软弱强硬强硬软弱软弱 U D U DU D U D 1，1 0，0 1，0 0，2 0，1 -2，0 0，0 -2，2 2，0 -4，-4 2，-2 -4，-4 U U D D

20、 D D 强硬强硬软弱软弱强硬强硬软弱软弱 U D D U D D 1，1 1，0 0，2 0，1 0，0 -2，2 2，0 2，-2 -4，-4 U U D D D D 强硬强硬软弱软弱强硬强硬软弱软弱 U D D U D D 1，1 1，0 0，2 0，1 0，0 -2，2 2，0 2，-2 -4，-4 U U D D D D 强硬强硬软弱软弱强硬强硬软弱软弱 U D D U D D 1，1 1，0 0，2 2，0 2，-2 -4，-4 U U D D 强硬强硬软弱软弱以上推导说明，以上推导说明，U是强硬的决斗者是强硬的决斗者1的占优的占优策略，为什么？策略，为什么？

21、强硬强硬软弱软弱 U D D U D D 1，1 1，0 0，2 0，1 0，0 -2，2 2，0 2，-2 -4，-4 U U D D D D 强硬强硬软弱软弱对于强硬的决斗者1而言，有因此，因此，U是强硬的是强硬的决斗者决斗者1的占优策的占优策略。略。强硬强硬软弱软弱 U D D U D D 1，1 1，0 0，2 2，0 2，-2 -4，-4 U U D D 强硬强硬软弱软弱因此，强硬的决斗者因此，强硬的决斗者2选择选择U和和D无差异。无差异。对于强硬的决斗者2而言，有所以，该博弈存在如下两个纯战略Nash均衡： 1“强硬的决斗者1选择行动U，“软弱的决斗者1选择行动D；“强硬的决斗者2选择行动U，“软弱的决斗者2选择行动D。 2“强硬的决斗者1选择行动U，“软弱的决斗者1选择行动D；“强硬的决斗者2和“软弱的决斗者2选择行动D。

展开阅读全文

不完全信息博弈和贝叶斯均衡

最新文档