博弈论课件第四章－金锄头文库

资源描述

《博弈论课件第四章》由会员分享，可在线阅读，更多相关《博弈论课件第四章（60页珍藏版）》请在金锄头文库上搜索。

1、单击此处编辑母版副标题样式*1单击此处编辑母版标题样式第四讲重复博弈l 迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理何为“重复博弈”？l重复博弈是指基本博弈重复进行构成的博弈过程。重复博弈中每个阶段中的博弈方、可选策略、规则和得益都是相同的-是特殊的动态博弈；形式上是基本博弈的重复进行，但博弈方的行为和博弈结果不一定是基本博弈的简单重复，因为博弈方对于博弈会重复进行的意识，会使他们对利益的判断发送变化，从而使他们在重复博弈过程不同阶段的行为选择受到影响。可信度：子博弈完美性仍是判断均衡是否稳定可靠的重要判断依据单击

2、此处编辑母版副标题样式*3单击此处编辑母版标题样式4.1 引论论迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理4.1.1 为何研究“重复博弈”（Game ）：迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理4.1.2 基本概念：l分类：有限次重复博弈，无限次重复博弈有限次重复博弈：给定一个基本博弈G（可以静态，也可以动态），重复进行了T次G，并且在每次重复G之前，各博弈方都能观察到以前博弈的结果，这样的博弈过程称为“G的T次重复博弈”，记为G(T)。而G称为G(T)的

3、“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。无限次重复博弈：理论上，重复博弈可以无限制进行下去，不一定经过一定次数重复以后就必须结束。如果一个基本博弈G一直重复下去，这样的重复博弈就是“无限次重复博弈” ，记为G()。无限次重复博弈的基本博弈也称为“原博弈” 。无限次重复博弈是有无限个阶段的动态博弈。迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理l 重复博弈的次数虽然有限，但重复的次数或博弈结束的时间不确定，这种重复博弈中博弈方的行为选择与确定结束时间的有限次重复博弈很不同，与无限次重复博弈很相似，甚至可以

4、通过某种方式与无限次重复博弈统一起来。这种重复博弈可以称为“随机结束的重复博弈”。迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理策略、子博弈和均衡路径l策略：博弈方的一个策略就是在每个阶段（即每次重复），针对每种情况（以前阶段的结果）如何行动的计划。l子博弈：重复博弈的子博弈就是从某个阶段（不包括第一阶段）开始，包括此后所有阶段的重复博弈部分。子博弈：重复博弈？原博弈？（最后一个阶段）l路径：子博弈完美纳什均衡，以逆推归纳法（逆向归纳法）为核心的子博弈完美纳什均衡分析及相关结论，可以推广到重复博弈中。重复博弈的路径是由每个阶

5、段博弈方的行动组合串联而成的。因为对应前一阶段的每种结果，下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m 种策略组合，那么重复两次就有m2条博弈路径，重复次就有mt条博弈路径。迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理重复博弈的得益l任何博弈博弈方策略选择依据都是得益的大小。l计算重复博弈的“总得益”。l计算各阶段的“平均得益”。l时间有先后，引入贴现系数无限次重复博弈：迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理随机停止和贴现率l典型的随机结束

6、重复博弈可以理解为在进行一个重复博弈时，每次都通过抽签来决定是否停止重复，如果抽到停止重复的概率为，则抽到重复下去的概率为。l设某博弈方在此博弈中的阶段得益为，利率为，因为在每一次博弈以后能继续下一次重复的可能性是，因此第二阶段的期望得益为，进一步，第三阶段的期望得益为，l故该博弈方在重复博弈中期望得益的现值为：l其中最后一个等式是通过令得到的。l把这个与前面纯粹考虑时间价值的贴现率统一起来，我们就把已知概率的随机停止重复博弈与无限次重复博弈统一起来了。随机停止重复博弈问题可以当作无限次重复博弈来进行分析。迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据

7、分析定量分析中的误差与数据处理4.2 有限次重复博弈l有限次重复博弈：给定一个基本博弈G（可以静态，也可以动态），重复进行了T次G，并且在每次重复G之前，各博弈方都能观察到以前博弈的结果，这样的博弈过程称为“G的T次重复博弈”，记为G(T)。而G称为G(T)的“原博弈”。G(T)中的每次重复称为G(T)的一个“阶段”。迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理策略、子博弈和均衡路径l策略：博弈方的一个策略就是在每个阶段（即每次重复），针对每种情况（以前阶段的结果）如何行动的计划。l子博弈：重复博弈的子博弈就是从某个阶

8、段（不包括第一阶段）开始，包括此后所有阶段的重复博弈部分。子博弈：重复博弈？原博弈？（最后一个阶段）l路径：子博弈完美纳什均衡，以逆推归纳法（逆向归纳法）为核心的子博弈完美纳什均衡分析及相关结论，可以推广到重复博弈中。重复博弈的路径是由每个阶段博弈方的行动组合串联而成的。因为对应前一阶段的每种结果，下一阶段都有原博弈全部策略组合数那么多种可能的结果。原博弈有m 种策略组合，那么重复两次就有m2条博弈路径，重复次就有mt条博弈路径。迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理4.2.1 两人零和博弈的有限次重复博弈l重复零和博弈

9、不会创造出新的利益。l合作的可能性根本不存在。即使双方都知道还要重复进行许多次基本博弈，也不会改变它们在当前阶段博弈中的行动方式，不可能变得（哪怕是暂时的）合作和顾及对方的利益。l所有以零和博弈为原博弈的有限次重复博弈，博弈方的正确策略都是重复一次性博弈中的纳什均衡策略。l推广：非零和或多个博弈方，博弈方的利益严格对立，没有纯策略纳什均衡的其他严格竞争博弈中。在以这些博弈作为原博弈构成的有限次重复博弈中，惟一的子博弈完美纳什均衡就是所有博弈方都始终采用原博弈的混合策略纳什均衡策略。迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与

10、数据处理有限次重复猜硬币博弈l各博弈方的正确策略就是在每次重复中都采用一次性博弈中的纳什均衡策略。迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理4.2.2 惟一纯策略纳什均衡博弈的有限次重复博弈l在有惟一纯策略纳什均衡的博弈中，博弈方之间的利益关系不再是始终对立的，而是有很大一致性甚至完全一致。l在以这样的博弈为原博弈的有限次重复博弈中，博弈方的行动和博弈结果会不会发生质的变化？l如果原博弈惟一的纯策略纳什均衡本身就是帕累托意义上的最佳策略组合，那么因为符合所有博弈方的利益，因此，有限次重复显然不会改变博弈方的行动方式

11、。l分析：原博弈惟一的纳什均衡没有达到帕累托效率，因此存在通过合作进一步提高效率的潜在可能性的囚徒困境式的博弈，在有限次重复博弈中能不能实现合作和提高效率呢？迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理有限次重复博弈的囚徒困境重复博弈等价于图4.2 两次迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理一般结论：在有限次重复博弈中，如果原博弈存在唯一的纯策略纳什均衡策略组合，则有限次重复博弈的唯一的均衡解即各博弈方在每阶段中都采用原博弈的纳什均衡；（2）由于在这样

12、的双方策略下，均衡路径中的每个阶段都不存在任何不可信的威胁或许诺，因此这种均衡是子博弈完美纳什均衡。（3）在一个博弈中的每个博弈方的所有得益上各自加上相同的数值不会改变博弈原来的均衡定理设原博弈G有惟一的纯策略纳什均衡，则对任意正整数T，重复博弈G(T)有惟一的子博弈完美纳什均衡，即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍，平均得益等于原博弈G中的得益。迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理一般结论：（1）在有限次重复博弈中，如果原博弈存在唯一的纯策略纳什均衡策略组

13、合，则有限次重复博弈的唯一的均衡解即各博弈方在每阶段中都采用原博弈的纳什均衡；（2）由于在这样的双方策略下，均衡路径中的每个阶段都不存在任何不可信的威胁或许诺，因此这种均衡是子博弈完美纳什均衡。（3）在一个博弈中的每个博弈方的所有得益上各自加上相同的数值不会改变博弈原来的均衡定理：设原博弈G有惟一的纯策略纳什均衡，则对任意正整数T，重复博弈G(T)有惟一的子博弈完美纳什均衡，即各博弈方每个阶段都采用G的纳什均衡策略。各博弈方在G(T)中的总得益为在G中得益的T倍，平均得益等于原博弈G中的得益。迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析

14、定量分析中的误差与数据处理石油输出国组织的困境l（1）某些成员国的石油资源已趋枯竭；l（2）不少非石油输出国组织成员国加入石油市场；l（3）石油输出国组织成员之间地位的不平衡；l（4）有些国家由于政治、经济、军事等方面的原因造成资金、财政紧张；迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理有限次重复削价竞争模型迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理重复囚徒困境悖论和连锁店悖论l（1）与直觉的差异l（2）连锁店悖论（Selten，1978）泽尔腾l一个在n个市场

15、都开设有连锁店的企业，对于各个市场的竞争者是否应该加以打击排斥？l由于n个市场的竞争者一般不会同时进入竞争，如果忽略各个市场环境、竞争者不同等方面的微小差异，这个问题对上述连锁企业来说相当于一个n次重复的重复博弈。l l较多阶段的动态博弈迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理例：若10次重复下先来后到博弈，SPNE ？97l 打进不进（0，10）打击和平（-2，3）（5，5）BA结论： 10个重复博弈的SPNE就是重复原博弈G的子博弈纳什均衡。这就有有名的“连锁店悖论。迅速改善中信银行零售业绩方案电子商务在传统

16、企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理总结：l第一类是由零和博弈构成的，不存在纯策略NE；第二类是唯一的纯策略纳什么均衡的静态博弈构成的。l共性：重复博弈本质上只不过是原博弈的简单重复，重复博弈每个阶段采取的策略就是原博弈中所采取的策略，在零和博弈的情况下是同样的混合策略NE，在后一种情况下则是纯策略NE;l重复博弈并不能给博弈方带来比一次博弈更好的结果，每阶段的平均得益与一次性博弈的得益相同。迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理例：如果T次重复齐威王田忌赛马，双方在该重复博弈中的策略是什么？博弈结果如何？l特点：此博弈是混合博弈NE的严格竞争零和博弈，对一方有利的策略组合总是对另一方不利，没有一个策略组合双方同时愿意接受。迅速改善中信银行零售业绩方案电子商务在传统企业中的应用店长培训之商品销售数据分析定量分析中的误差与数据处理例2：重复博弈与一次性博弈效率不同？迅速改善中信银行零

展开阅读全文

博弈论课件 第四章

博弈论课件第四章