完全且完美信息动态博弈

资源描述

《完全且完美信息动态博弈》由会员分享，可在线阅读，更多相关《完全且完美信息动态博弈（38页珍藏版）》请在金锄头文库上搜索。

1、第三章完全且完美信息动态博弈 3.1 动态博弈的扩展形表示及特征3.2 相机选择现象与逆推归纳法3.3 子博弈和子博弈完美纳什均衡分析3.4 几个经典动态博弈模型3.5 有同时选择的动态博弈模型3.6 动态博弈分析的问题和扩展讨论完全且完美信息动态博弈的特征 p博弈方依次选择行为博弈方依次选择行为；p博弈方相互了解得益情况博弈方相互了解得益情况；p后选择行为者在看到先选择行为者的选择后选择行为者在看到先选择行为者的选择后再选择后再选择。3.1.1 动态博弈的扩展形表示p“仿冒和反仿冒仿冒和反仿冒”博弈博弈设有一家企业的产品被另一家企业仿冒，如果被设有一家企业的产品被另一家企业仿冒，如果被仿

2、冒企业采取措施制止，那么仿冒企业就会停止仿冒；仿冒企业采取措施制止，那么仿冒企业就会停止仿冒；如果被仿冒企业不采取措施制止，那么仿冒企业就会如果被仿冒企业不采取措施制止，那么仿冒企业就会继续仿冒。对被仿冒企业来说，被仿冒会造成经济损继续仿冒。对被仿冒企业来说，被仿冒会造成经济损失，因此采取措施制止仿冒是符合自身利益的，但问失，因此采取措施制止仿冒是符合自身利益的，但问题是制止仿冒是有成本（代价）的，因此在遭遇仿冒题是制止仿冒是有成本（代价）的，因此在遭遇仿冒时是否应该制止是需要研究的问题。对于仿冒企业来时是否应该制止是需要研究的问题。对于仿冒企业来说，仿冒不被制止就能够获得很大利益，但如果被制

3、说，仿冒不被制止就能够获得很大利益，但如果被制止就会止就会“偷鸡不成反蚀一把米偷鸡不成反蚀一把米”，因此是否仿冒也要，因此是否仿冒也要仔细推敲。仔细推敲。3.1.1 动态博弈的扩展形表示法p“仿冒与反仿冒问题仿冒与反仿冒问题”的假设的假设（1）仿冒最多进行两次；仿冒最多进行两次；（2）第一次不仿冒时，仿冒企业和被仿冒企业的得益组合分第一次不仿冒时，仿冒企业和被仿冒企业的得益组合分别为别为（0，10）；（3）第一次仿冒被制止时，仿冒企业和被仿冒企业的得益组第一次仿冒被制止时，仿冒企业和被仿冒企业的得益组合分别为合分别为（2，5）；（4）在第一次仿冒未被制止情况下，第二次不仿冒时，仿冒在第

4、一次仿冒未被制止情况下，第二次不仿冒时，仿冒企业和被仿冒企业的得益组合分别为企业和被仿冒企业的得益组合分别为（5，5）；（5）在第一次仿冒未被制止情况下，第二次仿冒被制止时，在第一次仿冒未被制止情况下，第二次仿冒被制止时，仿冒企业和被仿冒企业的得益组合分别为仿冒企业和被仿冒企业的得益组合分别为（2，2）；（6）在第一次仿冒未被制止情况下，第二次仿冒不被制止时，在第一次仿冒未被制止情况下，第二次仿冒不被制止时，仿冒企业和被仿冒企业的得益组合分别为仿冒企业和被仿冒企业的得益组合分别为（10，4）。3.1.1 动态博弈的扩展形表示法p“仿冒与反仿冒问题仿冒与反仿冒问题”的扩展形表示的扩展形表示n

5、用用A表示仿冒企业，表示仿冒企业，用用B表示被仿冒企业。表示被仿冒企业。n 图图右右中得益数组中得益数组的第一个数字表示的第一个数字表示仿冒企业仿冒企业(A)(A)的得益，的得益，第二个数字表示被第二个数字表示被仿冒企业仿冒企业(B)(B)的得益。的得益。 n 图右称为图右称为“扩展形扩展形” （Extensive FormExtensive Form），），它特别适合于表示它特别适合于表示动态博弈动态博弈ABAB仿冒不仿冒仿冒不仿冒制止制止不制止不制止（2,5）（0,10）（2,2）（10,4）（5,5）“仿冒和反仿冒”博弈的扩展形表示3.1.1 动态博弈的扩展形表示法p扩展

6、形表示中各符号的含义扩展形表示中各符号的含义n圆圈圆圈称为称为“选择节点选择节点”或或“节点节点(Nodes)” ；n圆圈中的圆圈中的A、B分别表示节点对应的博弈方。其中，分别表示节点对应的博弈方。其中，A表示仿冒企业，表示仿冒企业，B表示被仿冒企业；表示被仿冒企业；n从节点引出的线条代表博弈方在该处可选择的各种从节点引出的线条代表博弈方在该处可选择的各种行为或方向；行为或方向；n黑圈黑圈表示博弈的终端；表示博弈的终端；n括号中的数字表示博弈方选择相应的括号中的数字表示博弈方选择相应的“行动路径行动路径”到达终端时所得到的得益组合。到达终端时所得到的得益组合。 3.1 .1动态博弈的扩展形表示

7、法p注解注解n扩展形表示法形象的体现了动态博弈的扩展形表示法形象的体现了动态博弈的“阶段阶段” ；n不是所有动态博弈都可以用扩展形表示。不是所有动态博弈都可以用扩展形表示。比如：下象棋、双寡头先头决策产量等比如：下象棋、双寡头先头决策产量等3.1.2 动态博弈(DG)的特征 p基本特征基本特征博弈方依次选择行为博弈方依次选择行为(有时也称为序列博弈有时也称为序列博弈,Sequential Games)；每个博弈方的一次选择常称为一个阶段，动态博弈每个博弈方的一次选择常称为一个阶段，动态博弈至少有两个阶段，所以也称为多阶段博弈至少有两个阶段，所以也称为多阶段博弈(Multistage Games

8、);在某个阶段，可能存在几个博弈方同时选择的情况在某个阶段，可能存在几个博弈方同时选择的情况p动态博弈的策略及结果动态博弈的策略及结果策略策略：各博弈方在整个博弈中轮到选择的每个阶段，：各博弈方在整个博弈中轮到选择的每个阶段，针对前面阶段的各种情况做作相应选择和行为的针对前面阶段的各种情况做作相应选择和行为的完完整计划整计划。例如：例如：“仿冒企业仿冒企业A在第一阶段选择仿冒，如果第在第一阶段选择仿冒，如果第二阶段二阶段B制止，第三阶段就不仿冒，否则第三阶段制止，第三阶段就不仿冒，否则第三阶段继续仿冒继续仿冒” “被仿冒企业被仿冒企业B，当第一阶段，当第一阶段A仿冒时仿冒时第二阶段不制止，第三

9、阶段第二阶段不制止，第三阶段A继续仿冒时第四阶段继续仿冒时第四阶段制止制止”3.1.2 动态博弈(DG)的特征 p动态博弈的策略及结果动态博弈的策略及结果策略组合策略组合：由不同博弈方的这种计划组成的组合。：由不同博弈方的这种计划组成的组合。各博弈方的策略组合可能会形成一条各博弈方的策略组合可能会形成一条联结各个阶联结各个阶段的路径。段的路径。动态博弈的结果动态博弈的结果：各个博弈方的策略及策略组合、：各个博弈方的策略及策略组合、实现的博弈路径和各博弈方的得益。实现的博弈路径和各博弈方的得益。3.1.2 动态博弈(DG)的特征 p动态博弈中博弈方地位的非对称性动态博弈中博弈方地位的非对称性后行

10、动者：后行动者： “有较多信息有较多信息,有后发优势？有后发优势？”先行动者可能有先发优势。先行动者可能有先发优势。3.1.2 动态博弈(DG)的特征 3.2.1相机选择现象p相机选择现象(contingent play ) 由于动态博弈中各博弈方的策略是多阶段的行动计划，实施起来有一个过程，而且，实际上并没有强制力，因此只要符合博弈方自己的利益，他们完全可以在博弈过程中改变计划。称这种现象为动态博弈中的“相机选择相机选择”现象。相机选择的存在使得动态博弈中，各博弈方设定的各个阶段、各种情况下会采取行为的“可信性可信性”(Credibility)有了疑问。p开金矿博弈甲在开采一价值4万元的金

11、矿时缺1万元资金，而乙正好有1万元资金可以投资。此时，假设甲想说服乙将这1万元资金借给自己开矿，并允诺在采到金子后与乙对半分成，乙是否该将钱借给甲呢？假设金矿的价值是经过权威部门探测认定的，没必要怀疑，那么乙最需要关心的就是甲采到金子后是否会履行诺言跟自己平分，因为万一甲采到金子后不但不跟乙平分，而且还赖帐或卷款潜逃，乙会连自己的本钱都收不回来。3.2.1相机选择现象p开金矿博弈的扩展形乙甲借不借分不分（2，2）（-1，4）（0，0）3.2.1相机选择现象p开金矿博弈分析发现对乙来说，在开金矿博弈的基本问题中甲“承诺在采到金子后与乙对半分成”是不可信的。正是因为该不可信的承诺，使得甲、乙的合

12、作最终成为不可能，这不是最佳结局。之所以甲的“在采到金子后与乙对半分成”承诺是不可信的，是因为甲可以在第二阶段临时改变自己的行动方案。能否使甲的承诺可行呢？3.2.1相机选择现象p有法律保障的开金矿博弈乙甲借不借分不分( 2 , 2 )( -1 , 4 )( 0 , 0 )乙打不打( 1 , 0 )3.2.1相机选择现象p有法律保障的开金矿博弈分析发现加不加第三阶段，博弈的结果大不一样。对甲而言，知道乙打官司是可信的威胁，如果第二阶段不分，必然招致官司和失去所有的收入。这告诉我们：在一个由都有私心、都更重视自身利益的成员组成的社会中，完善公正的法律制度不但能够保障社会的公平，而且还能提高社会

13、经济活动的效益，是实现最有效的社会分工合作的重要保障。反之，又如何？3.2.1相机选择现象p法律保障不足的开金矿博弈乙甲借不借分不分( 2 , 2 )( -1 , 4 )( 1 , 0 )乙打不打( -2 , 0 )3.2.1相机选择现象p法律保障不足的开金矿博弈分析发现乙打官司不再是可信的，是一种“不可信的” “空头威胁”(Empty Threats)。因为乙打官司会使自己的经济状况更加恶化。甲第二阶段选择不分，因为他清楚乙打官司的威胁不可信。3.2.1相机选择现象p总结在动态博弈问题中，各个博弈方的选择和博弈的结果，与各个博弈方在各个博弈阶段选择各种行为的可信程度有很大关系。有时候虽

14、然有些博弈方很想或会声称要采取特定的行动，以影响和制约对方的行为，但如果这些行动缺乏以经济利益为基础的可信性，那么这些想法或声明最终就不会有真正的效力。因此，相机选择现象引致的可信性问题是动态博弈分析的一个中心问题。 3.2.1相机选择现象p用静态博弈中纳什均衡方法分析 “法律保障不足的开金矿博弈”。甲：第二阶段无条件 “分”，乙：第一阶段“借”，第二阶段甲不分时，第三阶段“打”官司，为纳什均衡。p与前述直接分析的结果矛盾，该纳什均衡不稳定。甲会选择不分，而非分，乙策略中设定的第三阶段“打”不可信，不可能真正实施，因为乙是理性的。p缺乏稳定性的根源在于不能排除“不可信”行为设定，不能解决相机选

15、择引起的可信性问题。所以需要引入更强的均衡，除了满足纳什均衡，还要排除不可信设定。3.2.2纳什均衡的问题p逆推归纳法（Backwards Induction）逆推归纳法的一般步骤是这样的：从动态博弈的最后一个阶段开始分析，每一次确定出所分析阶段博弈方的选择和路径，然后再确定前一个阶段的博弈方选择和路径，这样一直逐步倒推到第一个阶段。3.2.3逆推归纳法n有法律保障的开金矿博弈乙甲借不借分不分( 2 , 2 )( -1 , 4 )( 0 , 0 )乙打不打( 1 , 0 )3.2.3逆推归纳法n有法律保障的开金矿博弈分析不借（0，0）（b）乙甲借分不分（2，2）（1，0）（c）乙借不借（2，

16、2）（0，0）乙甲借不借分不分（2，2）（ -1，4）（0，0）乙打不打（1，0）有法律保障的开金矿博弈分析过程 3.2.3逆推归纳法3.3 子博弈完美纳什均衡分析n法律保障不足的开金矿博弈乙甲借不借分不分( 2 , 2 )( -1 , 4 )( 0 , 0 )乙打不打( -2 , 0 )3.3 子博弈完美纳什均衡分析n子博弈的定义由一个动态博弈第一阶段以外的某阶段开始的后续博弈阶段构成的，有初始信息集和进行博弈所需要的全部信息，能够自成一个博弈的原博弈的一部分，称为原动态博弈的一个“子博弈”。3.3 子博弈完美纳什均衡分析n子博弈乙甲借不借分不分（2，2）（ -1，4）（0，0）乙打不打（

17、2，0）3.3 子博弈完美纳什均衡分析n子博弈概念的注解子博弈不能包括原博弈的第一个阶段子博弈很普遍，完美信息动态博弈基本都有一级或多级子博弈。但并不是动态博弈的任何部分都构成子博弈，也不是所有多阶段动态博弈都有子博弈。3.3 子博弈完美纳什均衡分析n子博弈完美纳什均衡如果在一个完全且完美信息动态博弈中，各博弈方的策略构成的一个策略组合满足，在整个动态博弈及它的所有子博弈中都构成纳什均衡，那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。3.3 子博弈完美纳什均衡分析n子博弈完美纳什均衡的注解子博弈完美纳什均衡本身也是纳什均衡，只不过是比纳什均衡更强的一个均衡概念子博弈完美纳什

18、均衡在动态博弈分析中的地位与纳什均衡在静态博弈分析中一样，是最核心的分析概念和基本着眼点求完美信息动态博弈的子博弈完美纳什均衡最基本的方法就是逆推归纳法3.3 子博弈完美纳什均衡分析n利用逆推归纳法求解法律保障不足开金矿博弈，考察是否为子博弈完美纳什均衡不借(0,0)(b)乙甲借分不分(2,2)(-1,4)(c)乙借不借(0,4)(0,0)乙甲借不借分不分（2,2）(-1,4)（0,0）乙打不打(2,0)3.3 子博弈完美纳什均衡分析n一个值得关注的地方开金矿博弈中，子博弈完美纳什均衡组合包含第二、三阶段的选择，而实际上博弈不会进行到第二、第三阶段，这称为“不在均衡路径上的选择”子博弈完美纳什

19、均衡必须对所有节点处的选择作出规定，包括最终不再均衡路径上的节点，而且不论是否在均衡路径上，都必须在相应的子博弈中构成纳什均衡，否在不能排除不可信3.4 子博弈完美纳什均衡分析的应用n寡占的斯塔克博格（Stackelberg）模型寡占的斯塔克博格模型是一种动态的寡头市场产量决策。该模型假设寡头市场上有两个厂商，与古诺模型一样，这两个厂商的决策内容也是产量。但是，在这两个厂商中，一方较强一方较弱，因此他们的产量决策是由较强的一方（称为领头企业，Leader）先进行选择，较弱的一方（称为追随企业，Follower）则根据较强一方的产量选择自己的产量。其他信息与古诺模型相同。寡占的斯塔克博格(St

20、ackelberg)模型由于这两个厂商的选择不仅有先后之分，而且后选择的厂商在选择时已经知道前一个厂商的选择，因此,这是一个动态博弈问题。而这个博弈的其他方面，如策略空间、得益函数和信息结构等，与上章介绍的古诺模型一样，因此斯塔克博格模型是一个完全且完美信息的动态博弈。但由于每个厂商的行动(产量选择)有无限多个，因此为无限多种可选策略的无限策略动态博弈，无法用扩展形表示，只能用得益函数来描述表示。寡占的斯塔克博格（Stackelberg）模型设一市场有设一市场有1、2两家厂商生产同样的产品。如果两家厂商生产同样的产品。如果厂商厂商1的产量为的产量为，厂商厂商2的产量为的产量为，则市场总

21、量为，则市场总量为，还有如下一些假设，还有如下一些假设: : (1) 设市场设市场出清价格出清价格是市场总量的递减函数是市场总量的递减函数: : (2) 设两厂商的生产都无设两厂商的生产都无固定成本固定成本，且每增加一单位，且每增加一单位产量的产量的边际成本边际成本相等，相等，，即它们分别生产，即它们分别生产和和单位产量的总成本分别为单位产量的总成本分别为和和 (3)厂商厂商1先进行产量决策先进行产量决策，厂商，厂商2则根据厂商则根据厂商1的产的产量选择自己的产量量选择自己的产量 n博弈方。厂商1和厂商2n策略(行为)。如果假设各厂商的产量是连续可分的，那么两厂商将都有无限多种可

22、选策略 n博弈的过程。厂商1先进行产量决策，厂商2则根据厂商1的产量选择自己的产量，所以该问题为一动态博弈。n博弈中的得益:寡占的斯塔克博格(Stackelberg)模型古诺模型与斯塔克伯格模型结果比较古诺模型斯塔克伯格模型两厂商选择的产量两厂商选择的产量最终市场总产量最终市场总产量市场出清价格市场出清价格两厂商的利润两厂商的利润两厂商的利润总和两厂商的利润总和斯塔克博格模型揭示了一个事实信息不对称的博弈中，信息较多的一方不一定得到较多的收益。这是两人以上的博弈与单人博弈的区别。现实生活中，在机会面前，一拥而上会撞车吃亏，而不知利害，盲目冲上去的人得到利益，理智的人会犹豫考虑，从而丧失机会。

展开阅读全文

完全且完美信息动态博弈

最新文档