第2章完全信息动态博弈

资源描述

《第2章完全信息动态博弈》由会员分享，可在线阅读，更多相关《第2章完全信息动态博弈（43页珍藏版）》请在金锄头文库上搜索。

1、2.完全信息动态博弈,2.1 博弈扩展式表述 2.2扩展式表述博弈的纳什均衡 2.3子博弈精炼纳什均衡 2.3.1 引言 2.3.2 子博弈精炼纳什均衡 2.3.3 用逆向归纳法求解子博弈精炼的纳什均衡 2.3.4 承诺行动与子博弈精炼纳什均衡 2.3.5 逆向归纳法与子博弈精炼均衡存在的问题 2.4 子博弈精炼纳什均衡应用举例 2.4.1 斯坦克尔伯格(Stackelberg)寡头竞争模型,2.4.2 宏观经济政策的动态一致性 2.4.3 中国过去的财政包干制度：中央与地方的关系 2.4.4 工会与雇主之间的博弈 2.4.5 轮流出价的讨价还价模型 2.5 重复博弈和无名氏定理 2.5.1

2、有限次重复博弈：连锁店悖论 2.5.2 无限次重复博弈和无名氏定理 2.5.3 参与人不固定时的重复博弈 2.5.4 不确定环境下的重复博弈,博弈论与信息经济学,回主目录,2.1 博弈扩展式表述,n人有限战略博弈的扩展式表述可以用博弈树来表示,参与人集合：i=1,n,此外，我们将用N代表虚拟参与人“自然”；参与人的行动顺序（the order of moves）：谁在什么时候行动；参与人的行动空间（action set）：在每次行动时，参与人有些什么选择；参与人的信息集（information set）：每次行动时，参与人知道些什么；参与人的支付函数：在行动结束之后，每个参与人得到些什

3、么（支付是所有行动的函数）；外生事件（即自然的选择）的概率分布。,博弈的扩展式表述包括以下要素：,博弈树的基本结构包括：枝(branches)和信息集(information sets),A,开发,不开发,N,N,B,B,B,B,开发,开发,开发,开发,开发,不开发,不开发,不开发,大,大,小,小,（1/2）,（1/2）,（1/2）,(0，0 ) (0，1) (0，0),(4，4),(8，0),(-3，-3,)(1，0)(0，8),图2.1 房地产开发博弈,1.结(nodes):包括决策结和终点结两类。一般用X表示所有结的集合，xX表示某个特定的结。用“ ”表示定义在X上的顺序关系（prec

4、edence relation）： x x意味着“x在x”之前”。假定“ ”满足传递性（transitive）和反对称性(asymmetric)。,图2.2 博弈树不允许的情况,(a),(b),2.枝(branches): 枝是一个决策结到它的直接后续结的连线(有时用箭头表述)，每一个枝代表参与人的一个行动选择。,3.信息集(information sets): 博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集，该子集包括所有满足下列的决策结： (1)每一个决策结都是同一参与人的决策结 (2)：该参与人知道博弈进入该集合的某个决策结，但不知道自己究竟处在哪一个决策结

5、。,A,开发,不开发,N,N,B,B,B,B,开发,开发,开发,开发,开发,不开发,不开发,不开发,大,大,小,小,（1/2）,（1/2）,（1/2）,(0，0 ) (0，1) (0，0),(4，4),(8，0),(-3，-3,)(1，0)(0，8),图2.3 房地产开发博弈,图2.1和2.3的区别在于B的信息集不同,房地产开发博弈的另一种可能情况是，B知道自然选择，但不知道A的选择,只包括一个决策信息集称为单结信息集博弈树所有的信息都是单结的，该博弈称为完美信息博弈,A,开发,不开发,N,N,B,B,B,B,开发,开发,开发,开发,开发,不开发,不开发,不开发,大,大,小,小,（1/2）

6、,（1/2）,（1/2）,(0，0 ) (0，1) (0，0),(4，4),(8，0),(-3，-3,)(1，0)(0，8),图2.4 房地产开发博弈,N,大,不开发,A,A,B,B,B,B,开发,开发,开发,开发,开发,不开发,不开发,不开发,开发,开发,不开发,（1/2）,不开发（1/2）,(0，0 ) (0，1) (0，0),(4，4),(8，0),(-3，-3,)(1，0)(0，8),图2.5 房地产开发博弈：另一种表述,不完美信息集,N,大,不开发,A,A,B,B,B,B,开发,开发,开发,开发,开发,不开发,不开发,不开发,开发,开发,不开发,小,（1/2）,不开发,(0，0 )

7、(0，1) (0，0),(4，4),(8，0),(-3，-3,)(1，0)(0，8),图2.6 房地产开发博弈：第二种表述,N,大,不开发,B,B,A,A,A,A,开发,开发,开发,开发,开发,不开发,不开发,不开发,开发,开发,不开发,不开发,(0，0 ) (0，1) (0，0),(4，4),(8，0),(-3，-3,)(1，0)(0，8),图2.7房地产开发博弈：第三种表述,有了信息集的概念，扩展式表述也可以用于表述表示静态博弈,一般假定博弈满足“完美回忆”(perfect recall)的要求。完美回忆是与信息集有关的一个概念，指的是没有参与人会忘记自己以前知道的事情，所有参与人都知道

8、自己以前的选择。,(-8，-8) (0，-10)(-10，0) (-1，-1),坦白抵赖,坦白抵赖,坦白抵赖,A,B,(-8，-8) (0，-10)(-10，0) (-1，-1),坦白抵赖,坦白抵赖,坦白抵赖,B,A,图2.8囚徒困境扩展式表述,图2.3 参与人不具完美记忆的两个例子,1,2,U,U,U,D,D,L,L,L,L,R,R,R,1,1,1,2,(a),(b),N,参与人1不能区别三个行动序列(U，R)，(D，L)和(D，R)参与人1不具有完美回忆,参与人1也不能满足有完美回忆的要求,1,如果 (1) ( 和属于同一信息集)， (2) xP(x1)(x是x1的前列集

9、) (3)i(x)=i(x1)(x和x1都是i的决策结)，那么，存在一个 (可能是X本身)，满足：，在x点为到达x1的行动与在点为到达x2的行动是一样的。,1,U,D,D,U,1,图2.10 完美记忆的要求,2.2扩展式表述博弈的纳什均衡,为了说明如何从扩展式表述构造战略式表述，考虑房地产开发博弈的例子。,为了排除上述两种情况以确保博弈具有完美回忆的特征，要求：,假定在博弈开始前自然就选择了“低需求”，并且已成为参与人的共同信息；开发商A先决策，开商B在观测到A的选择后决策。那么，博弈扩展式表述如图。这是一个完美信息博弈(每个人的信息集都是单结的。),A,B,B,开发,开发,开发,不开发

10、,不开发,不开发,(0，1) (0，0),(-3，-3 ) (1，0),图2.11 房地产开发博弈,表2.1是这个博弈的战略式表述,开发商B 开发，开发开发，不开发不开发，开发不开发，不开发,开发开发商A 不开发,令Hi为第i个参与人的信息集的集合，为其行动集合，其中A(hi)是在信息集hi 的行动集合。参与人i的一个纯战略是从信息集集合Hi到行动集合Ai的一个映射。一个参与人可选择的纯战略的总数#Si 等于：,在扩展式表述博弈，所有n个参与人的一个纯战略组合决定了博弈树上的一个路径。每一个战略组合决定了一个支付向量。战略组合是扩展式博弈的一个纳什均衡，如果对于所有的i, 最大化，

11、即,在扩展式表述博弈中，混合战略被称为“行为战略”。行为战略是指参与人在每一个信息集上随机地选择行动。,尽管扩展式博弈和战略式博弈有完全相同的纯战略空间，战略式博弈的混合战略集合不同于扩展式博弈的行为战略集合。,我们也可以从行为战略构造出混合战略,行为战略令混合战略为特别地，,1,2,2,L,L,U,R,R,D,图2.12，参与人2有四个纯战略：L，L，L，R，R，L和R,R.,对应于行为战略。,一个行为战略可能对应多个混合战略，反之不成立,如果一个扩展式博弈有有限个信息集，每个信息集上参与人有有限个行动选择，我们说这个博弈是有限博弈。,定理 (Zermelo,1913;Kuhn,19

12、83):一个有限完美信息博弈有一个纯战略纳什均衡。,可以使用动态规划的逆向归纳法(backward induction)证明上述定理。,上述归纳法过程不适用于无限博弈和不完美信息博弈。逆向归纳法的逻辑仍可用来找出不完美信息博弈的均衡解,2,1,L,U,R,D,(0，0),(2，2 ),(3，1),参与人2 L R,U 参与人1 D,图2.13,图2.13的战略式表述,我们可以用图2.13所示的扩展式博弈(表2.2是这个博弈的长表述)说明这个定理,2.3子博弈精炼纳什均衡,泽尔腾(Selten)的“子博弈精炼纳什均衡”是纳什均衡概念的第一个最重要的改进子博弈精炼纳什均衡是完全信息动态博弈解

13、的基本概念,2.3.1 引言,用上一节房地产开发博弈的例子来说明上述论点,A,B,B,开发,开发,开发,不开发,不开发,不开发,(0，1) (0，0),(-3，-3 ) (1，0),图2.14 房地产开发博弈,容易看出，只有(开发，不开发，开发)是一个合理的均衡，因为构成这个均衡的每个参与人的均衡战略都是合理的。,事实上，(开发，不开发，开发)是这个博弈的唯一的子博弈精炼纳什均衡。,2.3.2 子博弈精炼纳什均衡,定义：一个扩展式博弈的子博弈G由一个决策结x和所有该决策后续结T(x)(包括终点结)组成，它满足下列条件(1)x是一个单结信息集，即h(x)=x;(2)对于所有的x1 T(x),

14、如果xh(x1),那么xT(x)。,解释：条件(1)说的是一个子博弈必须从一个单结信息集开始。,A,B,B,开发,开发,开发,不开发,不开发,不开发,(0，1) (0，0),(-3，-3 ) (1，0),图2.15 房地产开发博弈,(-3，-3 ),(1，0),开发,不开发,开发,不开发,(0，1),(0，0),(b)子博弈,(b)子博弈,(a)原博弈,解释：条件(2)说的是，子博弈的信息集和支付向量都直接继承自原博弈。,1,2,2,L,L,U,R,R,D,Z4,Z1,Z2,Z3,1,2,2,L,L,U,R,R,D,3,l,r,l,l,l,r,r,r,3,图2.16 囚徒困境的扩展式表

15、述,图2.17,下面给出“子博弈精炼纳什均衡”的正式定义,定义：扩展式博弈的战略组合是一个子博弈精炼纳什均衡，如果：(1)它是原博弈的纳什均衡；(2)它在每一个子博弈上给出的纳什均衡。,2.3.3 用逆向归纳法求解子博弈精炼的纳什均衡,假定博弈有两个阶段，第一阶段参与人1行动，第二阶段参与人2行动，并且2在行动前观测到1的选择。当博弈进入第二阶段，给定参与人1在第一阶段的选择a1A1，参与人2面临的问题是：,参与人1在第一阶段面临的问题是：,令上述问题的最优解为。那么，这个博弈的子博弈精炼纳什均衡为，均衡结果为,图2.18是一个三阶段完美信息博弈均衡结果是参与人1在第一阶段选择U结束博弈，参与1得到2个单位的支付，参与人2得到0个单位的支付。,有些非完美信息博弈也可以运用逆向归纳法求解。,2,1,U,L,U,D,R,D,(2,0),(1,1),(3,0)

展开阅读全文

第2章完全信息动态博弈

最新文档