博弈论课件31－金锄头文库

资源描述

《博弈论课件31》由会员分享，可在线阅读，更多相关《博弈论课件31（130页珍藏版）》请在金锄头文库上搜索。

1、第三章完全且完美信息动态博弈,前言,现实生活中许多决策活动往往是依次选择行为而不是同时选择行为，而且后选择行为者能够看到先选择行为者的选择内容，如：打麻将，讨价还价、拍卖等。诸如此类博弈问题称为“动态博弈”(Dynamic Game)。本章讨论所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序，因此在表示方法、利益关系、分析方法和均衡概念等方面，都与静态博弈有很大区别。,前言,在动态博弈问题中，为了做出最优的行动选择，每个参与人都必须这样思考问题：如果我如此选择，对方将如何应对？如果我是他，我将会

2、如何行动？给定他的应对，什么是我的最优选择？本章对动态博弈分析的概念和方法，特别是子博弈完美均衡和逆推归纳法作系统介绍，并介绍各种经典的动态博弈模型。,本章主要内容,3.1 动态博弈的表示法和特点 3.2 可信性和纳什均衡的问题 3.3 子博弈和子博弈完美纳什均衡 3.4 几个经典动态博弈模型 3.5 有同时选择的动态博弈模型 3.6 动态博弈分析的问题和扩展讨论,3.1 动态博弈的表示法和特点,3.1.1 阶段和扩展形表示 3.1.2 动态博弈的基本特点,3.1.1 阶段和扩展形表示,3.1.1 阶段和扩展形表示阶段：动态博弈中一个博弈方的一次选择行为常称为一个“阶段”。动态博弈：至少有两

3、个阶段，因此有时也被称为多阶段博弈。动态博弈中的次序特征使得其也被称为序列博弈。,3.1.1 阶段和扩展形表示,使用扩展形(博弈树)表示具有次序特征动态博弈:,1.8 单人迷宫,A左B左,A左B右,A右B左,A右B右,单人迷宫得益矩阵,游戏者,得益,终点结,枝: 行为选择,决策结,3.1.1 阶段和扩展形表示,先来后到博弈市场进入博弈,决策结,终点结,枝: 行为选择,结分割的信息集,1.12 先来后到,得益：一般来说，先行动的参与人的得益写在前面：（U(B),U(A)）,(1)A独占市场，10的得益; (2)B不进入，则仍然是A独占; (3)B进入，A若和B平分市场，A、B各得到5的得益;

4、 (4)B进入，A实行打击，B亏损2，A得益减低到3.,(0,10),3.1.1 阶段和扩展形表示,博弈的扩展形表述中的要素参与人集合:谁参与博弈;用N表示虚拟参与人“自然”;参与人的行动顺序:谁在什么时候行动;参与人的行动空间:在每次行动时，参与人有些什么选择;参与人的信息集:每次行动时，参与人知道些什么;参与人的支付函数:每次行动时参与人得到些什么；外生事件（即自然的选择）的概率分布。,3.1.1 阶段和扩展形表示,扩展形（博弈树）的基本组成结：包括决策结和终点结;枝：是从一个决策结到它的直接后续结的连线，每一个枝代表参与人的一个行动选择;信息集：博弈树上的所有决策结分割成不同的信息集，每

5、个信息集是决策结集合的一个子集。引入信息集的目的是描述下列情况：当一个参与人要做出决策时他可能并不知道“之前”发生的所有事情。对于信息集，我们用到的时候再进行讨论。,3.1.1 阶段和扩展形表示,例子：仿冒和反仿冒博弈多(4)阶段动态博弈,A:仿冒企业； B:被仿冒企业。得益(A, B),A第一次仿冒,A第二次仿冒,最多进行两次仿冒的情形：,考虑更多次仿冒和不同反仿冒力度的话，博弈的扩展形就会复杂很多。,3.1.1 阶段和扩展形表示,并不是所有的动态博弈都可以用扩展形表示如：过多阶段；过多选择；有先后决策顺序的无限策略寡头定产问题。用文字或数学函数表示。,3.1.2 动态博弈的基本特点,1.

6、动态博弈的策略和结果策略是各个博弈方在整个博弈中轮到选择的每个阶段，针对前面阶段的各种情况作相应选择和行为的完整计划，以及由不同博弈方的这种计划构成的组合。不能孤立地研究某个阶段或者将各个阶段行为割裂开来进行研究。,3.1.2 动态博弈的基本特点,结果是各博弈方上述类型的策略构成的策略组合，构成联结各个阶段的一条路径，包括双方采用的策略组合、实现的博弈路径和各博弈方的得益得益对应每条路径，而不是对应每步选择、行为,对应于“红色路径”的得益(2,2),3.1.2 动态博弈的基本特点,2.动态博弈的非对称性动态博弈的非对称性动态博弈必然是非对称的。先后次序决定了后行为者可以观察到此前选择行为

7、博弈方的选择行为，因此动态博弈中各博弈方的地位是不对称的。先行优势与后动优势,3.2 可信性和纳什均衡的问题,静态博弈问题的纳什均衡分析在动态博弈中并不完全有效，这是因为动态博弈各博弈方的策略中选择行为的“可信性”问题。因此，首先就要讨论“可信性”。3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法,3.2.1 相机选择和策略中的可信性问题,相机选择：动态博弈的策略实施起来具有过程性，只要符合博弈方自己的利益，就可以在博弈过程中改变计划。随之而来的就是所谓的“可信性问题”。可信性问题：相机选择问题的存在使得博弈方的策略中各阶段、各情况下采取行为的“

8、可信性”有了疑问。各个博弈方是否会真正、始终按照自己的策略所设定的方案行为，还是可能临时改变自己的行动方案呢？,3.2.1 相机选择和策略中的可信性问题,私奔博弈汉时，司马相如不得志时，在临邛富户卓王孙家操琴。才貌双全的卓女文君17岁新寡，司马相如仰慕文君，借琴音倾诉心曲，二人订盟，因卓王孙不允，文君遂偕相如私逃，返回家乡当垆卖酒，卓王孙不得以相认。后来相如献子虚赋，汉武帝拜为中郎将。（孤本元明杂剧私奔相如，清袁于令肃霜裘传奇。）,3.2.1 相机选择和策略中的可信性问题,私奔博弈,不可置信的威胁,卓文君,父亲,与司马相如断绝关系,默认,断绝父女关系,结婚,（-1，1）,（0，-2）,（1，

9、-1）,3.2.1 相机选择和策略中的可信性,开金矿博弈分钱和打官司的可信性（承诺与威胁）(1)甲分钱的不可信,得益:(乙,甲),甲不会考虑道德因素，因此会选择使得自己得益最大化的策略，因此到甲行动，必选“不分”,因此，对乙来说，本博弈中甲有一个不可信的“分钱”许诺.,3.2.1 相机选择和策略中的可信性,（2）乙可以通过打官司保护自身利益甲分钱可信,第三阶段，甲知道乙一定会打官司,甲知道乙一定会打官司，所以一定会“分钱”,避免打官司的损失,在法律保证的情况下,甲的“分钱”许诺变得可信. 乙“借”成为合理的选择.,法律保障充分，保障社会公平。,3.2.1 相机选择和策略中的可信性,（3）乙不能

10、通过打官司保护自身利益甲分钱不可信,法律保障不充分，法律作用有限或完全无效。,第三阶段，由于乙打官司并不能收回本钱并要进一步承受1万的损失，甲知道乙一定不会打官司,甲知道乙一定不会打官司，所以一定会“不分”,最大化自己利润,在不完善法律保证的情况下,甲的“分钱”许诺仍不可信.“不借”是乙合理的选择。,3.2.1 相机选择和策略中的可信性,三个不同版本的金矿动态博弈中，各个博弈方的选择和博弈的结果，与各个博弈方在各个博弈阶段选择各种行为的可信程度有很大关系。威胁或承诺缺乏以经济利益（得益）为基础的可信性，这些威胁和承诺就没有真正的效力。可信性问题是动态博弈分析中的一个中心问题。,现实中的威胁

11、与承诺,爱的承诺有个小伙子在给心爱的姑娘的信中写道：“我爱你爱得如此之深，以至愿为你赴汤蹈火；我是那么地想见到你，任凭艰难险阻也挡不住我的脚步！本周六如不下雨，我一定去找你！” 为什么恋人会乐于把彼此介绍给自己的父母亲朋？为什么婚前要送昂贵的彩礼？为什么要举行高档的婚宴？,现实中的威胁与承诺,商业中的威胁与承诺过度投资和生产生产耐用品的企业推出最惠条款政府的烦恼招商引资，承诺税费减免法不容情截断退路，背水一战哀兵必胜置于死地而后生破釜沉舟,承诺行动的基本思想是通过承诺行动使自己的威胁变得可信。也就是说通过限制自己的某些策略选择，使其选择特定策略的宣称或意图变得可信。或者说，承诺行动是局

12、中人通过减少自己在博弈中的可选行动来迫使对手选择自己所希望的行动。其中的道理在于：既然对方的最优反应行动依赖于我的行动，那么限制我自己的某些行动实际上也就是限制了对方采取某些行动。行胜于言,3.2.2 纳什均衡的问题,前面的几个不同版本的开金矿博弈，说明了动态博弈问题的相机选择引出的可信性问题，以及可信性在动态分析中的关键意义。实际上，可信性问题最重要的意义，还在于它对纳什均衡在动态分析博弈中的有效性提出了质疑。,3.2.2 纳什均衡的问题,第三种开金矿博弈中法律保障不足的情况。 (1) (借-打，分) 是纳什均衡,第一阶段：乙“借”；第三阶段：如果甲在第二阶段“不分”，乙选择“打”;

13、第二阶段：甲“分”；,静态纳什均衡分析推断，如果给定了乙在第一、三阶段的选择，即“借”、“打”，甲在第二阶段选择“分”最好，因为这样可以免去法律纠纷。,如果给定了甲在第二阶段选择“分”，那么乙第一阶段选择“借”，第三阶段选择“打”也是最好的应对策略。乙第三阶段选择“打”，并不需要真正实施，这是保证甲“分”的一个“威慑”。,3.2.2 纳什均衡的问题,第三种开金矿博弈中法律保障不足的情况。 (2) (借-打，分) 不是稳定的纳什均衡但实际上，根据我们前面的分析，在法律保障不充分的情况下，(借-打，分)这个均衡结果是不能够实现或不稳定的，我们在前面分析的时候已经得出结论，那就是乙不会在第一阶段

14、选择“借”，甲在第二阶段也不会选择“分”，乙在第三阶段也不会选择“打”。即(不借-不打，不分)才是这个博弈问题的最终结果，是一个稳定的、可以实现的纳什均衡。,第一阶段：乙“不借”；第三阶段：乙“不打”; 第二阶段：甲“不分”；,3.2.2 纳什均衡的问题,(不借-不打，不分)是稳定的纳什均衡。,这种矛盾产生的根源在于：乙策略中设定的第三阶段“打”，是不可信的，不可能真正实施，这是因为该行为对乙也是不利的。,乙第三阶段不可置信的威慑使得甲“不分”，乙知道这个结果，所以第一阶段不会把钱借给甲，即“不借”。,3.2.2 纳什均衡的问题,结论：纳什均衡在动态博弈可能缺乏稳定性，也就是说，在完全信息

15、静态博弈中稳定的纳什均衡，在动态博弈中可能是不稳定的，不能作为预测的基础。根源：纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定，不能解决动态博弈的相机选择引起的可信性问题动态博弈的有效分析概念，除了要符合纳什均衡的基本要求外，还必须能够排除博弈方的策略中不可信的行为设定，也就是各种不可信的威胁和承诺。,3.2.3 逆推归纳法,之所以开金矿博弈能够得出正确的判断与结论，并且排除了博弈方不可信行为对博弈结果的干扰，是因为我们是从最后一个阶段向前推演地进行分析，实际上，这就是分析动态博弈的一种行之有效的方法。逆推归纳法(Backwards Induction)：从动态博弈的最后一个阶段

16、博弈方的行为开始分析，逐步倒推回前一个阶段相应博弈方的行为选择，一直到第一个阶段的分析方法。逆推归纳法的逻辑基础：动态博弈中先行为的理性的博弈方，在前面阶段选择行为时必然会先考虑后行为博弈方在后面阶段中将会怎样选择行为，只有在博弈的最后一个阶段选择的，不再有后续阶段牵制的博弈方，才能直接作出明确选择。,3.2.3 逆推归纳法,逆推归纳法的一般方法：从动态博弈的最后一个阶段开始分析，每一次确定出所分析阶段博弈方的选择和路径，然后再确定前一个阶段的博弈方选择和路径。逆推归纳到某个阶段，那么这个阶段及以后的博弈结果就可以确定下来。我们可以用不包括该阶段与其后所有阶段博弈的等价博弈来代替原来的博弈。,3.2.3 逆推归纳法,例子,对于法律保障不足的开金矿博弈来说，逆推归纳法的第一步是先分析第三阶段乙是否打官司的选择。,第三阶段，乙“不打”的得益0，大于“打”的得益-1，因此乙必然选择“不打”。双方得益为（0，4）,

展开阅读全文