第2章完全信息动态博弈

上传人:我*** 文档编号:137839762 上传时间:2020-07-12 格式:PPT 页数:43 大小:612.50KB
返回 下载 相关 举报
第2章完全信息动态博弈_第1页
第1页 / 共43页
第2章完全信息动态博弈_第2页
第2页 / 共43页
第2章完全信息动态博弈_第3页
第3页 / 共43页
第2章完全信息动态博弈_第4页
第4页 / 共43页
第2章完全信息动态博弈_第5页
第5页 / 共43页
点击查看更多>>
资源描述

《第2章完全信息动态博弈》由会员分享,可在线阅读,更多相关《第2章完全信息动态博弈(43页珍藏版)》请在金锄头文库上搜索。

1、2.完全信息动态博弈,2.1 博弈扩展式表述 2.2扩展式表述博弈的纳什均衡 2.3子博弈精炼纳什均衡 2.3.1 引言 2.3.2 子博弈精炼纳什均衡 2.3.3 用逆向归纳法求解子博弈精炼的纳什均衡 2.3.4 承诺行动与子博弈精炼纳什均衡 2.3.5 逆向归纳法与子博弈精炼均衡存在的问题 2.4 子博弈精炼纳什均衡应用举例 2.4.1 斯坦克尔伯格(Stackelberg)寡头竞争模型,2.4.2 宏观经济政策的动态一致性 2.4.3 中国过去的财政包干制度:中央与地方的关系 2.4.4 工会与雇主之间的博弈 2.4.5 轮流出价的讨价还价模型 2.5 重复博弈和无名氏定理 2.5.1

2、有限次重复博弈:连锁店悖论 2.5.2 无限次重复博弈和无名氏定理 2.5.3 参与人不固定时的重复博弈 2.5.4 不确定环境下的重复博弈,博弈论与信息经济学,回主目录,2.1 博弈扩展式表述,n人有限战略博弈的扩展式表述可以用博弈树来表示,参与人集合:i=1,n,此外,我们将用N代表虚拟参与人“自然”; 参与人的行动顺序(the order of moves):谁在什么时候行动; 参与人的行动空间(action set):在每次行动时,参与人有些什么选择; 参与人的信息集(information set):每次行动时,参与人知道些什么; 参与人的支付函数:在行动结束之后,每个参与人得到些什

3、么(支付是所有行动的函数); 外生事件(即自然的选择)的概率分布。,博弈的扩展式表述包括以下要素:,博弈树的基本结构包括:枝(branches)和信息集(information sets),A,开发,不开发,N,N,B,B,B,B,开发,开发,开发,开发,开发,不开发,不开发,不开发,大,大,小,小,(1/2),(1/2),(1/2),(0,0 ) (0,1) (0,0),(4,4),(8,0),(-3,-3,)(1,0)(0,8),图2.1 房地产开发博弈,1.结(nodes):包括决策结和终点结两类。一般用X表示所有结的集合,xX表示某个特定的结。用“ ”表示定义在X上的顺序关系(prec

4、edence relation): x x意味着“x在x”之前”。 假定“ ”满足传递性(transitive)和反对称性(asymmetric)。,图2.2 博弈树不允许的情况,(a),(b),2.枝(branches): 枝是一个决策结到它的直接后续结的连线(有时用箭头表述),每一个枝代表参与人的一个行动选择。,3.信息集(information sets): 博弈树上的所有决策结分割成不同的信息集。每一个信息集是决策结集合的一个子集,该子集包括所有满足下列的决策结: (1)每一个决策结都是同一参与人的决策结 (2):该参与人知道博弈进入该集合的某个决策结,但不知道自己究竟处在哪一个决策结

5、。,A,开发,不开发,N,N,B,B,B,B,开发,开发,开发,开发,开发,不开发,不开发,不开发,大,大,小,小,(1/2),(1/2),(1/2),(0,0 ) (0,1) (0,0),(4,4),(8,0),(-3,-3,)(1,0)(0,8),图2.3 房地产开发博弈,图2.1和2.3的区别在于B的信息集不同,房地产开发博弈的另一种可能情况是,B知道自然选择,但不知道A的选择,只包括一个决策 信息集称为单结信息集 博弈树所有的信息都是单结的,该博弈称为完美信息博弈,A,开发,不开发,N,N,B,B,B,B,开发,开发,开发,开发,开发,不开发,不开发,不开发,大,大,小,小,(1/2)

6、,(1/2),(1/2),(0,0 ) (0,1) (0,0),(4,4),(8,0),(-3,-3,)(1,0)(0,8),图2.4 房地产开发博弈,N,大,不开发,A,A,B,B,B,B,开发,开发,开发,开发,开发,不开发,不开发,不开发,开发,开发,不开发,(1/2),不开发(1/2),(0,0 ) (0,1) (0,0),(4,4),(8,0),(-3,-3,)(1,0)(0,8),图2.5 房地产开发博弈:另一种表述,不完美信息集,N,大,不开发,A,A,B,B,B,B,开发,开发,开发,开发,开发,不开发,不开发,不开发,开发,开发,不开发,小,(1/2),不开发,(0,0 )

7、(0,1) (0,0),(4,4),(8,0),(-3,-3,)(1,0)(0,8),图2.6 房地产开发博弈:第二种表述,N,大,不开发,B,B,A,A,A,A,开发,开发,开发,开发,开发,不开发,不开发,不开发,开发,开发,不开发,不开发,(0,0 ) (0,1) (0,0),(4,4),(8,0),(-3,-3,)(1,0)(0,8),图2.7房地产开发博弈:第三种表述,有了信息集的概念,扩展式表述也可以用于表述表示静态博弈,一般假定博弈满足“完美回忆”(perfect recall)的要求。 完美回忆是与信息集有关的一个概念,指的是没有参与人会忘记自己以前知道的事情,所有参与人都知道

8、自己以前的选择。,(-8,-8) (0,-10)(-10,0) (-1,-1),坦白 抵赖,坦白 抵赖,坦白 抵赖,A,B,(-8,-8) (0,-10)(-10,0) (-1,-1),坦白 抵赖,坦白 抵赖,坦白 抵赖,B,A,图2.8囚徒困境 扩展式表述,图2.3 参与人不具完美记忆的两个例子,1,2,U,U,U,D,D,L,L,L,L,R,R,R,1,1,1,2,(a),(b),N,参与人1不能区别三个行动序列(U,R),(D,L)和(D,R)参与人1不具有完美回忆,参与人1也不能满足有完美回忆的要求,1,如果 (1) ( 和 属于同一 信息集), (2) xP(x1)(x是x1的前列集

9、) (3)i(x)=i(x1)(x和x1都是i的决策结),那么,存在一个 (可能是X本身),满足: , 在x点为到达x1的行动与在 点为到达x2的行动是一样的。,1,U,D,D,U,1,图2.10 完美记忆的要求,2.2扩展式表述博弈的纳什均衡,为了说明如何从扩展式表述构造战略式表述,考虑房地产开发博弈的例子。,为了排除上述两种情况以确保博弈具有完美回忆的特征,要求:,假定在博弈开始前自然就选择了“低需求”,并且已成为参与人的共同信息;开发商A先决策,开商B在观测到A的选择后决策。那么,博弈扩展式表述如图。这是一个完美信息博弈(每个人的信息集都是单结的。),A,B,B,开发,开发,开发,不开发

10、,不开发,不开发,(0,1) (0,0),(-3,-3 ) (1,0),图2.11 房地产开发博弈,表2.1是这个博弈的战略式表述,开发商B 开发,开发开发,不开发不开发,开发不开发,不开发,开发 开发商A 不开发,令Hi为第i个参与人的信息集的集合, 为其行动集合,其中A(hi)是在信息集hi 的行动集合。参与人i的一个纯战略是从信息集集合Hi到行动集合Ai的一个映射。 一个参与人可选择的纯战略的总数#Si 等于:,在扩展式表述博弈,所有n个参与人的一个纯战略组合决定了博弈树上的一个路径。每一个战略组合决定了一个支付向量 。战略组合 是扩展式博弈的一个纳什均衡,如果对于所有的i, 最大化,

11、即,在扩展式表述博弈中,混合战略被称为“行为战略”。 行为战略是指参与人在每一个信息集上随机地选择行动。,尽管扩展式博弈和战略式博弈有完全相同的纯战略空间,战略式博弈的混合 战略集合不同于扩展式博弈的行为战略 集合。,我们也可以从行为战略构造出混合战略,行为战略 令混合战略为特别地,,1,2,2,L,L,U,R,R,D,图2.12,参与人2有四个纯战略:L,L,L,R,R,L和R,R.,对应于行为战略。,一个行为战略可能对应多个混合战略,反之不成立,如果一个扩展式博弈有有限个信息集,每个信息集上参与人有有限个行动选择,我们说这个博弈是有限博弈。,定理 (Zermelo,1913;Kuhn,19

12、83):一个有限完美信息博弈有一个纯战略纳什均衡。,可以使用动态规划的逆向归纳法(backward induction)证明上述定理。,上述归纳法过程不适用于无限博弈和不完美信息博弈。 逆向归纳法的逻辑仍可用来找出不完美信息博弈的均衡解,2,1,L,U,R,D,(0,0),(2,2 ),(3,1),参与人2 L R,U 参与人1 D,图2.13,图2.13的战略式表述,我们可以用图2.13所示的扩展式博弈(表2.2是这个博弈的长表述)说明这个定理,2.3子博弈精炼纳什均衡,泽尔腾(Selten)的“子博弈精炼纳什均衡”是纳什均衡概念的第一个最重要的改进 子博弈精炼纳什均衡是完全信息动态博弈 解

13、的基本概念,2.3.1 引言,用上一节房地产开发博弈的例子来说明上述论点,A,B,B,开发,开发,开发,不开发,不开发,不开发,(0,1) (0,0),(-3,-3 ) (1,0),图2.14 房地产开发博弈,容易看出,只有(开发,不开发,开发)是一个合理的均衡,因为构成这个均衡的每个参与 人的均衡战略都是合理的。,事实上,(开发,不开发,开发)是这个博弈的唯一的子博弈精炼纳什均衡。,2.3.2 子博弈精炼纳什均衡,定义:一个扩展式博弈的子博弈G由一个决策结x和所有该决策 后续结T(x)(包括终点结)组成,它满足下列条件(1)x是一个单结信息集,即h(x)=x;(2)对于所有的x1 T(x),

14、如果xh(x1),那么xT(x)。,解释: 条件(1)说的是一个子博弈必须从一个单结信息集开始。,A,B,B,开发,开发,开发,不开发,不开发,不开发,(0,1) (0,0),(-3,-3 ) (1,0),图2.15 房地产开发博弈,(-3,-3 ),(1,0),开发,不开发,开发,不开发,(0,1),(0,0),(b)子博弈,(b)子博弈,(a)原博弈,解释: 条件(2)说的是,子博弈的信息集和支付向量都 直接继承自原博弈 。,1,2,2,L,L,U,R,R,D,Z4,Z1,Z2,Z3,1,2,2,L,L,U,R,R,D,3,l,r,l,l,l,r,r,r,3,图2.16 囚徒困境的扩展式表

15、述,图2.17,下面给出“子博弈精炼纳什均衡”的正式定义,定义:扩展式博弈的战略组合 是一个子博弈精炼纳什均衡,如果:(1)它是原博弈的纳什均衡;(2)它在每一个子博弈上给出的纳什均衡。,2.3.3 用逆向归纳法求解 子博弈精炼的纳什均衡,假定博弈有两个阶段,第一阶段参与人1行动,第二阶段参与人2行动,并且2在行动前观测到1的选择。当博弈进入第二阶段,给定参与人1在第一阶段的选择a1A1,参与人2面临的问题是:,参与人1在第一阶段面临的 问题是:,令上述问题的最优解为 。那么,这个博弈的子博弈精炼纳什均衡为 ,均衡结果为,图2.18是一个三阶段完美信息博弈均衡结果是参与人1在第一阶段选择U结束博弈,参与1得到2个单位的支付,参与人2得到0个单位的支付。,有些非完美信息博弈也可以运用逆向归纳法求解。,2,1,U,L,U,D,R,D,(2,0),(1,1),(3,0)

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 大杂烩/其它

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号