ch3--完全且完美信息动态博弈教程文件

上传人:yulij****0329 文档编号:129141236 上传时间:2020-04-22 格式:PPT 页数:58 大小:658.50KB
返回 下载 相关 举报
ch3--完全且完美信息动态博弈教程文件_第1页
第1页 / 共58页
ch3--完全且完美信息动态博弈教程文件_第2页
第2页 / 共58页
ch3--完全且完美信息动态博弈教程文件_第3页
第3页 / 共58页
ch3--完全且完美信息动态博弈教程文件_第4页
第4页 / 共58页
ch3--完全且完美信息动态博弈教程文件_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《ch3--完全且完美信息动态博弈教程文件》由会员分享,可在线阅读,更多相关《ch3--完全且完美信息动态博弈教程文件(58页珍藏版)》请在金锄头文库上搜索。

1、2020 4 22 1 第三章完全且完美信息动态博弈 完全 得益完美 过程动态 先后请考虑以下问题 1 是不是信息越多越有利 2 过程是否重要 3 动态博弈与静态博弈有哪些异同之处 4 人们对已经过去的博弈是更注重结果还是更注重过程 其意义何在 2020 4 22 2 本章分六节 3 1动态博弈的表示法和特点3 2可信性和纳什均衡的问题3 3子博弈和子博弈完美纳什均衡3 4几个经典动态博弈模型3 5有同时选择的动态博弈模型3 6动态博弈分析的问题和扩展讨论 2020 4 22 4 3 1 1阶段和扩展性表示 阶段 动态博弈中一个博弈方的一次选择行为例子 仿冒和反仿冒博弈 注 并不是所有的动态博

2、弈都可以用扩展形来表示 如下棋 2020 4 22 5 3 1 2动态博弈的基本特点 1 动态博弈的策略和结果策略是在整个博弈中所有选择 行为的计划结果是上述 计划型 策略的策略组合 构成一条路径得益对应每条路径 而不是对应每步选择 行为2 与静态博弈不同的基本特点1 策略不同 每个博弈方的策略是指在整个博弈过程中在每个阶段作出相应选择和行为的完整计划 2 结果不同 博弈的结果是指每个博弈方的策略组成的策略组合 实现博弈的路径及各个博弈方的得益 3 地位不对称 6 完全信息静态博弈模型的表述 回顾 图3 2市场进入的动态博弈 扩展式 博弈树 标准 战略 式 A先行动 B先行动 图3 1市场进入

3、的静态博弈 完全信息静态博弈模型的表述 等价 动态博弈的标准式表示 图3 2市场进入的动态博弈 扩展式 博弈树 标准 战略 式 A先行动 该博弈有三个纳什均衡 1 进入 不进入 不进入 2 不进入 进入 进入 3 进入 不进入 进入 博弈的最终结局应出现哪个均衡 需要分析在三个均衡的合理性 1 含有不可信的承诺 2 含有不可信的威胁 3 合理的纳什均衡 完全信息静态博弈模型的表述 等价 静态博弈的博弈树表示 图3 1市场进入的静态博弈 扩展式 博弈树 标准 战略 式 A先行动 B决策时不知道A的选择 2020 4 22 9 3 2可信性和纳什均衡的问题 3 2 1相机选择和策略中的可信性问题3

4、 2 2纳什均衡的问题3 2 3逆推归纳法 2020 4 22 10 3 2可信性和纳什均衡的问题 在动态博弈中 由于博弈方策略的实施是一个过程 所以过程十分重要 类似于对未来过程的了解 它本身依赖于其它博弈方的行为 那么就存在一个对其博弈方所可能采取策略的可信性问题 博弈方在博弈过程中存在着改变计划的情况 这种问题称为相机选择问题 可信性 动态博弈中先行为的博弈方是否应该相信后行为博弈方会采取某种策略或行为 后行为博弈方将来采取对先行为博弈方有利的行为为 许诺 采取对先行方不利的行为为 威胁 2020 4 22 11 3 2 1相机选择和策略中的可信性问题1 开金矿博弈 条件 甲去开采一价值

5、4万元的金矿 缺1万元 乙恰好有1万元可以投资 甲向乙借1万元可以可开金矿 并 许诺 成功后与对半分成 问题 乙是否该给甲投资 2020 4 22 12 3 2 1相机选择和策略中的可信性问题1 开金矿博弈 可能性即甲可能成功之后不与乙分钱 分当然好 则乙损失1万元 由此 乙决策的关键在于他是否相信甲的 许诺 而结局取决于甲是否遵守他的 许诺 接下来乙可采取一些方法以使甲尽可能兑现他的许诺 打官司 2020 4 22 13 3 2 1相机选择和策略中的可信性问题1 开金矿博弈 根据自身利益最大化原则 甲在轮到行为时的唯一选择是不分 而乙清楚甲的行为准则 则选择不借 对乙来讲 本博弈中甲有一个不

6、可信的肯定不会信守的许诺 怎样使甲的许诺变为可信的呢 关键在于必须增加一些对甲行为的约束 2020 4 22 14 3 2 1相机选择和策略中的可信性问题2 法律保障的开金矿博弈 若乙采取法律手段 即打官司保护自己的利益 则博弈进程如下图所示 2020 4 22 15 3 2 1相机选择和策略中的可信性问题2 法律保障的开金矿博弈 在本博弈中 乙的唯一选择是打官司 对甲来讲 乙打官司的威胁是可信的 是肯定会信守的 他最理智的选择就是分 即 乙的策略是在第一阶段借 如甲在第二阶段选择不分 则第三阶段选择打 甲的策略是如乙在第一阶段选择借 则他在第二阶段选择分 在双方这样的策略组合下 本博弈的路径

7、是 借 分 双方得益为 2 2 实现有效率的理想的结果 2020 4 22 16 3 2 1相机选择和策略中的可信性问题3 法律保障不足的开金矿博弈 根据纳什均衡的定义可以判断 乙的策略是第一阶段选择 借 若第二阶段甲选择 不分 第三阶段选择 打 甲的策略是第二阶段选择 分 实际结果是 乙在第一阶段不会选择 借 甲在第二阶段也不会选择 分 乙在第三阶段也不会选择 打 结果相反的原因是第三阶段的 打 是不可信的威胁 如果乙的选择打官司的得益是 1 即所谓赢了官司输了钱 即法律保障不足的开金矿博弈 2020 4 22 17 3 2 1相机选择和策略中的可信性问题3 法律保障不足的开金矿博弈 法律制

8、度必须满足两方面的要求 一是对人们的正当权益保护力度足够大 二是对侵害他人利益者有足够的震慑作用 否则作用有限甚至完全无效 乙打官司的威胁不可信 于是甲 分 钱的许诺就不可信 最后结果乙选择 不借 2020 4 22 18 3 2 1相机选择和策略中的可信性问题 结论 在动态博弈中 各个博弈方的选择和博弈结果 与各个博弈方在各个阶段选择各种行为的可信程度有很大关系 2020 4 22 19 3 2 1相机选择和策略中的可信性问题先来后到博弈 在此博弈中 后进入者博弈方1要决定是否进入市场竞争 而先进入市场的博弈方2有打击和不打击两种选择 2020 4 22 20 3 2 1相机选择和策略中的可

9、信性问题先来后到博弈 根据利润最大化原则 博弈方2的唯一选择是无情打击对手 这时博弈方2的打击的威胁是可信的 了解博弈方2决策原则的博弈方1在第一阶段只会选择不进 该博弈的结果为 0 10 即先占领市场者独享利润 2020 4 22 21 3 2 1相机选择和策略中的可信性问题先来后到博弈 当得益变成右图情况以后 博弈方2的打击的威胁就不再是可信的了 这样 博弈方1在第一阶段的合理选择当然只有进 博弈的结果选择路径为 进 不打击 双方得益为 5 8 后进者信息多 但利润不如先进入者 后来者不一定总是从前者利益中分出一部分 而可能创造更大的总利益 而先进入者的损失也不一定很大 2020 4 22

10、 22 第三种开金矿博弈中 不借 不打 不分 和 借 打 分 都是纳什均衡 但后者不可信 不可能实现或稳定 结论 纳什均衡在动态博弈可能缺乏稳定性 也就是说 在完全信息静态博弈中稳定的纳什均衡 在动态博弈中可能是不稳定的 不能作为预测的基础 根源 纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定 不能解决动态博弈的相机选择引起的可信性问题 3 2 2纳什均衡的问题 2020 4 22 23 3 2 3逆推归纳法 在动态博弈中如何求解 动态博弈的特点是 在采取某一种决策时必须对其后可能进行的子博弈有充分的了解 这样才能很好的进行博弈并得到合理的结果 基于理性和可信性 相当于对后博弈行为的合

11、理假设 由此 对于完全且完美信息的动态博弈其基本求解方法可由最后阶段的子博弈逆推来决定采取合适的策略 逆推归纳法 2020 4 22 24 3 2 3逆推归纳法 定义 逆推归纳法就是从动态博弈的最后一个阶段或最后一个子博弈开始 逐步向前倒推以求解动态博弈的方法 例 2020 4 22 25 3 2 3逆推归纳法 逆推归纳法是动态博弈分析最重要 基本的方法 2020 4 22 26 3 3子博弈和子博弈完美纳什均衡 3 3 1子博弈3 3 2子博弈完美纳什均衡 2020 4 22 27 3 3 1动态博弈中的子博弈 定义 子博弈即能够自成一个博弈的某个动态博弈的从其某个阶段开始的后续阶段 它必须

12、有一个初始信息集 且具备进行博弈所需的各种信息 2020 4 22 28 3 3 1动态博弈中的子博弈 注意 原博弈的初始节点开始的博弈为原博弈本身 不称它为原博弈的子博弈 第五章将说明在不完美信息博弈中有其它的不作为子博弈的起始信息集的节点 2020 4 22 29 3 3 2子博弈完美纳什均衡 在动态博弈中由于博弈过程是逐步深入的 这一过程由每个阶段所采取的策略构成 由此引出 路径 的概念 路径 从第一阶段开始通过每阶段一个行为 最后达到博弈结束的一个终端各博弈方的行为组合 找到了路径也就找到了一个分阶段的策略组合 这一策略组合恰似一个完整的计划 计划的最终实现取决于过程中各阶段的实现 2

13、020 4 22 30 3 3 2子博弈完美纳什均衡 在开金矿案例中 策略组合 借 分 是一个稳定的策略组合 因为如果不分 则有乙打官司的威胁 这是双方都不愿得到的结果 稳定 意味着博弈方都不会单独改变策略 这恰似纳什均衡的概念 2020 4 22 31 3 3 2子博弈完美纳什均衡 由于动态博弈与静态博弈有较大的差异 那么如何才能使静态博弈中的纳什均衡在动态博弈中亦有相应的概念发展 以开金矿为例 注意此例与以前开金矿例子的差异 2020 4 22 32 3 3 2子博弈完美纳什均衡 此时打官司对乙亦无好处 此情况在现实中可能出现 在此情况中 逆推可以得出乙不借 原因在于乙在第三阶段打官司的威

14、胁是不可信的 由此导致甲在第二阶段分的许诺也变为不可信 结局是 甲开不成金矿 乙保本 甲失去挣钱的机会 2020 4 22 33 3 3 2子博弈完美纳什均衡 如果按照静态博弈的分析方法 则 借 分 打 的策略组合为一个纳什均衡 因为任何一方都不会单独改变策略而降低自己的得益 这与逆推归纳法得到的结论相矛盾 原因在于路径 借 分 的纳什均衡策略组合包含了一个不可信的威胁 即乙在第三阶段会选择打官司的行为是不可信的 2020 4 22 34 3 3 2子博弈完美纳什均衡 由此需要对静态博弈中的纳什均衡的概念有所调整 即应满足 是纳什均衡 从而具有策略稳定性不能包含任何的不会信守的许诺或威胁这样的

15、动态博弈策略组合称为子博弈纳什均衡 2020 4 22 35 3 3 2子博弈完美纳什均衡 定义 Selten塞尔顿 如果动态博弈中各博弈方的策略在动态博弈本身和所有子博弈中都构成一个纳什均衡 则称该策略组合为一个 子博弈完美纳什均衡 2020 4 22 36 3 3 2子博弈完美纳什均衡 注意 用逆推归纳法所得到的解应为子博弈完美纳什均衡 动态博弈所应注意的两点 要求各博弈方的策略对每阶段每种可能的情况都设定一个行为方案 其意义在于避免出现不会信守的许诺或威胁 从而使子博弈完美纳什均衡可以用 假定所有博弈方都是理性的且不会犯错误的 2020 4 22 37 3 3 2子博弈完美纳什均衡 与实

16、际情况的差异 后续可能性太多而无法分析 于是考虑仅知道有限后续阶段的情况 许诺有限非理性 如何考虑 比如假设非理性的次数小于等于k 下棋 K叉树算法博弈构成的 长短 与稳定性 不可预测性等 2020 4 22 38 3 4几个经典动态博弈模型 3 4 1寡占的斯塔克博格模型3 4 2劳资博弈3 4 3讨价还价博弈3 4 4委托人 代理人理论 2020 4 22 39 3 4 1寡占的斯塔克博格模型 古诺模型在动态博弈中的体现 模型 设一市场有1 2两个厂商生产同样的产品 如果厂商1的产量为q1 厂商2的产量为q2 则市场总产量为Q q1 q2 设市场出清价格是P P Q 8 Q 生产无固定成本 单位变动成本为2 讨论其纳什均衡 分析 个体收益最大化博弈方1利润 博弈方2利润 回忆 古诺的寡头模型 2020 4 22 40 回忆 古诺的寡头模型 在本博弈中 的纳什均衡的充分必要条件是和的最大值问题 第一个对q1求导 并将q1 代入 6 q2 2q1 0第二个对q2求导 并将q2 代入 6 q1 2q2 0解得唯一解社会收益最大化 假设总产量为Q 总收益为U QP Q CQ Q 8 Q 2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号