ch3--完全且完美信息动态博弈教程文件

资源描述

《ch3--完全且完美信息动态博弈教程文件》由会员分享，可在线阅读，更多相关《ch3--完全且完美信息动态博弈教程文件（58页珍藏版）》请在金锄头文库上搜索。

1、2020 4 22 1 第三章完全且完美信息动态博弈完全得益完美过程动态先后请考虑以下问题 1 是不是信息越多越有利 2 过程是否重要 3 动态博弈与静态博弈有哪些异同之处 4 人们对已经过去的博弈是更注重结果还是更注重过程其意义何在 2020 4 22 2 本章分六节 3 1动态博弈的表示法和特点3 2可信性和纳什均衡的问题3 3子博弈和子博弈完美纳什均衡3 4几个经典动态博弈模型3 5有同时选择的动态博弈模型3 6动态博弈分析的问题和扩展讨论 2020 4 22 4 3 1 1阶段和扩展性表示阶段动态博弈中一个博弈方的一次选择行为例子仿冒和反仿冒博弈注并不是所有的动态博

2、弈都可以用扩展形来表示如下棋 2020 4 22 5 3 1 2动态博弈的基本特点 1 动态博弈的策略和结果策略是在整个博弈中所有选择行为的计划结果是上述计划型策略的策略组合构成一条路径得益对应每条路径而不是对应每步选择行为2 与静态博弈不同的基本特点1 策略不同每个博弈方的策略是指在整个博弈过程中在每个阶段作出相应选择和行为的完整计划 2 结果不同博弈的结果是指每个博弈方的策略组成的策略组合实现博弈的路径及各个博弈方的得益 3 地位不对称 6 完全信息静态博弈模型的表述回顾图3 2市场进入的动态博弈扩展式博弈树标准战略式 A先行动 B先行动图3 1市场进入

3、的静态博弈完全信息静态博弈模型的表述等价动态博弈的标准式表示图3 2市场进入的动态博弈扩展式博弈树标准战略式 A先行动该博弈有三个纳什均衡 1 进入不进入不进入 2 不进入进入进入 3 进入不进入进入博弈的最终结局应出现哪个均衡需要分析在三个均衡的合理性 1 含有不可信的承诺 2 含有不可信的威胁 3 合理的纳什均衡完全信息静态博弈模型的表述等价静态博弈的博弈树表示图3 1市场进入的静态博弈扩展式博弈树标准战略式 A先行动 B决策时不知道A的选择 2020 4 22 9 3 2可信性和纳什均衡的问题 3 2 1相机选择和策略中的可信性问题3

4、 2 2纳什均衡的问题3 2 3逆推归纳法 2020 4 22 10 3 2可信性和纳什均衡的问题在动态博弈中由于博弈方策略的实施是一个过程所以过程十分重要类似于对未来过程的了解它本身依赖于其它博弈方的行为那么就存在一个对其博弈方所可能采取策略的可信性问题博弈方在博弈过程中存在着改变计划的情况这种问题称为相机选择问题可信性动态博弈中先行为的博弈方是否应该相信后行为博弈方会采取某种策略或行为后行为博弈方将来采取对先行为博弈方有利的行为为许诺采取对先行方不利的行为为威胁 2020 4 22 11 3 2 1相机选择和策略中的可信性问题1 开金矿博弈条件甲去开采一价值

5、4万元的金矿缺1万元乙恰好有1万元可以投资甲向乙借1万元可以可开金矿并许诺成功后与对半分成问题乙是否该给甲投资 2020 4 22 12 3 2 1相机选择和策略中的可信性问题1 开金矿博弈可能性即甲可能成功之后不与乙分钱分当然好则乙损失1万元由此乙决策的关键在于他是否相信甲的许诺而结局取决于甲是否遵守他的许诺接下来乙可采取一些方法以使甲尽可能兑现他的许诺打官司 2020 4 22 13 3 2 1相机选择和策略中的可信性问题1 开金矿博弈根据自身利益最大化原则甲在轮到行为时的唯一选择是不分而乙清楚甲的行为准则则选择不借对乙来讲本博弈中甲有一个不

6、可信的肯定不会信守的许诺怎样使甲的许诺变为可信的呢关键在于必须增加一些对甲行为的约束 2020 4 22 14 3 2 1相机选择和策略中的可信性问题2 法律保障的开金矿博弈若乙采取法律手段即打官司保护自己的利益则博弈进程如下图所示 2020 4 22 15 3 2 1相机选择和策略中的可信性问题2 法律保障的开金矿博弈在本博弈中乙的唯一选择是打官司对甲来讲乙打官司的威胁是可信的是肯定会信守的他最理智的选择就是分即乙的策略是在第一阶段借如甲在第二阶段选择不分则第三阶段选择打甲的策略是如乙在第一阶段选择借则他在第二阶段选择分在双方这样的策略组合下本博弈的路径

7、是借分双方得益为 2 2 实现有效率的理想的结果 2020 4 22 16 3 2 1相机选择和策略中的可信性问题3 法律保障不足的开金矿博弈根据纳什均衡的定义可以判断乙的策略是第一阶段选择借若第二阶段甲选择不分第三阶段选择打甲的策略是第二阶段选择分实际结果是乙在第一阶段不会选择借甲在第二阶段也不会选择分乙在第三阶段也不会选择打结果相反的原因是第三阶段的打是不可信的威胁如果乙的选择打官司的得益是 1 即所谓赢了官司输了钱即法律保障不足的开金矿博弈 2020 4 22 17 3 2 1相机选择和策略中的可信性问题3 法律保障不足的开金矿博弈法律制

8、度必须满足两方面的要求一是对人们的正当权益保护力度足够大二是对侵害他人利益者有足够的震慑作用否则作用有限甚至完全无效乙打官司的威胁不可信于是甲分钱的许诺就不可信最后结果乙选择不借 2020 4 22 18 3 2 1相机选择和策略中的可信性问题结论在动态博弈中各个博弈方的选择和博弈结果与各个博弈方在各个阶段选择各种行为的可信程度有很大关系 2020 4 22 19 3 2 1相机选择和策略中的可信性问题先来后到博弈在此博弈中后进入者博弈方1要决定是否进入市场竞争而先进入市场的博弈方2有打击和不打击两种选择 2020 4 22 20 3 2 1相机选择和策略中的可

9、信性问题先来后到博弈根据利润最大化原则博弈方2的唯一选择是无情打击对手这时博弈方2的打击的威胁是可信的了解博弈方2决策原则的博弈方1在第一阶段只会选择不进该博弈的结果为 0 10 即先占领市场者独享利润 2020 4 22 21 3 2 1相机选择和策略中的可信性问题先来后到博弈当得益变成右图情况以后博弈方2的打击的威胁就不再是可信的了这样博弈方1在第一阶段的合理选择当然只有进博弈的结果选择路径为进不打击双方得益为 5 8 后进者信息多但利润不如先进入者后来者不一定总是从前者利益中分出一部分而可能创造更大的总利益而先进入者的损失也不一定很大 2020 4 22

10、 22 第三种开金矿博弈中不借不打不分和借打分都是纳什均衡但后者不可信不可能实现或稳定结论纳什均衡在动态博弈可能缺乏稳定性也就是说在完全信息静态博弈中稳定的纳什均衡在动态博弈中可能是不稳定的不能作为预测的基础根源纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定不能解决动态博弈的相机选择引起的可信性问题 3 2 2纳什均衡的问题 2020 4 22 23 3 2 3逆推归纳法在动态博弈中如何求解动态博弈的特点是在采取某一种决策时必须对其后可能进行的子博弈有充分的了解这样才能很好的进行博弈并得到合理的结果基于理性和可信性相当于对后博弈行为的合

11、理假设由此对于完全且完美信息的动态博弈其基本求解方法可由最后阶段的子博弈逆推来决定采取合适的策略逆推归纳法 2020 4 22 24 3 2 3逆推归纳法定义逆推归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始逐步向前倒推以求解动态博弈的方法例 2020 4 22 25 3 2 3逆推归纳法逆推归纳法是动态博弈分析最重要基本的方法 2020 4 22 26 3 3子博弈和子博弈完美纳什均衡 3 3 1子博弈3 3 2子博弈完美纳什均衡 2020 4 22 27 3 3 1动态博弈中的子博弈定义子博弈即能够自成一个博弈的某个动态博弈的从其某个阶段开始的后续阶段它必须

12、有一个初始信息集且具备进行博弈所需的各种信息 2020 4 22 28 3 3 1动态博弈中的子博弈注意原博弈的初始节点开始的博弈为原博弈本身不称它为原博弈的子博弈第五章将说明在不完美信息博弈中有其它的不作为子博弈的起始信息集的节点 2020 4 22 29 3 3 2子博弈完美纳什均衡在动态博弈中由于博弈过程是逐步深入的这一过程由每个阶段所采取的策略构成由此引出路径的概念路径从第一阶段开始通过每阶段一个行为最后达到博弈结束的一个终端各博弈方的行为组合找到了路径也就找到了一个分阶段的策略组合这一策略组合恰似一个完整的计划计划的最终实现取决于过程中各阶段的实现 2

13、020 4 22 30 3 3 2子博弈完美纳什均衡在开金矿案例中策略组合借分是一个稳定的策略组合因为如果不分则有乙打官司的威胁这是双方都不愿得到的结果稳定意味着博弈方都不会单独改变策略这恰似纳什均衡的概念 2020 4 22 31 3 3 2子博弈完美纳什均衡由于动态博弈与静态博弈有较大的差异那么如何才能使静态博弈中的纳什均衡在动态博弈中亦有相应的概念发展以开金矿为例注意此例与以前开金矿例子的差异 2020 4 22 32 3 3 2子博弈完美纳什均衡此时打官司对乙亦无好处此情况在现实中可能出现在此情况中逆推可以得出乙不借原因在于乙在第三阶段打官司的威

14、胁是不可信的由此导致甲在第二阶段分的许诺也变为不可信结局是甲开不成金矿乙保本甲失去挣钱的机会 2020 4 22 33 3 3 2子博弈完美纳什均衡如果按照静态博弈的分析方法则借分打的策略组合为一个纳什均衡因为任何一方都不会单独改变策略而降低自己的得益这与逆推归纳法得到的结论相矛盾原因在于路径借分的纳什均衡策略组合包含了一个不可信的威胁即乙在第三阶段会选择打官司的行为是不可信的 2020 4 22 34 3 3 2子博弈完美纳什均衡由此需要对静态博弈中的纳什均衡的概念有所调整即应满足是纳什均衡从而具有策略稳定性不能包含任何的不会信守的许诺或威胁这样的

15、动态博弈策略组合称为子博弈纳什均衡 2020 4 22 35 3 3 2子博弈完美纳什均衡定义 Selten塞尔顿如果动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成一个纳什均衡则称该策略组合为一个子博弈完美纳什均衡 2020 4 22 36 3 3 2子博弈完美纳什均衡注意用逆推归纳法所得到的解应为子博弈完美纳什均衡动态博弈所应注意的两点要求各博弈方的策略对每阶段每种可能的情况都设定一个行为方案其意义在于避免出现不会信守的许诺或威胁从而使子博弈完美纳什均衡可以用假定所有博弈方都是理性的且不会犯错误的 2020 4 22 37 3 3 2子博弈完美纳什均衡与实

16、际情况的差异后续可能性太多而无法分析于是考虑仅知道有限后续阶段的情况许诺有限非理性如何考虑比如假设非理性的次数小于等于k 下棋 K叉树算法博弈构成的长短与稳定性不可预测性等 2020 4 22 38 3 4几个经典动态博弈模型 3 4 1寡占的斯塔克博格模型3 4 2劳资博弈3 4 3讨价还价博弈3 4 4委托人代理人理论 2020 4 22 39 3 4 1寡占的斯塔克博格模型古诺模型在动态博弈中的体现模型设一市场有1 2两个厂商生产同样的产品如果厂商1的产量为q1 厂商2的产量为q2 则市场总产量为Q q1 q2 设市场出清价格是P P Q 8 Q 生产无固定成本单位变动成本为2 讨论其纳什均衡分析个体收益最大化博弈方1利润博弈方2利润回忆古诺的寡头模型 2020 4 22 40 回忆古诺的寡头模型在本博弈中的纳什均衡的充分必要条件是和的最大值问题第一个对q1求导并将q1 代入 6 q2 2q1 0第二个对q2求导并将q2 代入 6 q1 2q2 0解得唯一解社会收益最大化假设总产量为Q 总收益为U QP Q CQ Q 8 Q 2

展开阅读全文