产业组织学绪论(4)博弈论与战略教学课件

资源描述

《产业组织学绪论(4)博弈论与战略教学课件》由会员分享，可在线阅读，更多相关《产业组织学绪论(4)博弈论与战略教学课件（36页珍藏版）》请在金锄头文库上搜索。

1、1,第4章博弈论与战略,4.1 占优战略，劣战略和纳什均衡4.2 序贯博弈：承诺和逆向归纳4.3 重复博弈,2, 相互依赖的决策,在一个销售商很少的市场里，一个公司的利润不仅取决于自己制定的价格，也取决于其他厂商的定价。例如，某烟草厂商研制了一种新型烟草，计划推出一种高价的极品烟，这个计划能否成功常常取决于其竞争对手是否采取同样的策略。如果竞争对手没有推出同类产品，那么该烟草厂商的计划成功的可能性就很大。如果竞争对手也推出高价极品烟，而且档次、宣传力度比前者还要高、要大，那么计划成功的难度就很大。因此，烟草厂商新产品开发、价格定位的效果，常常取决于其他厂商、竞争对手的相关竞争策略。,

2、3, 博弈的概念,博弈是描述战略行为情况的程序化的模型，其中一位参与者的收益不仅取决于自己的行动，也取决于其他参与者的行动。博弈论是关于包含相互依存情况中理性行为的研究，主要是由一位出生于匈牙利叫John von Neumann（1903-1957）的数学天才所开创和发展的。博弈论的指导思想是：假设你的对手在研究你的策略并追求自己最大利益行动的时候，你如何选择最有效的策略。,4, 博弈的基本要素,博弈方：博弈中进行决策并承担结果的参与者。博弈的规则：什么人可以做什么，以及在什么时间做。博弈的收益函数：博弈的各方从每个可能的战略组合里可能得到的益处。,5, 两人博弈,参与者1,参与者2,

3、策略T （高价）,策略R（低价）,策略L（高价）,策略B （低价）,6,4.1 占优战略，劣战略和纳什均衡,4.1.1 占优战略4.1.2 囚徒困境4.1.3 劣战略4.1.4 重复剔除的一个例子4.1.5 纳什均衡,7, 4.1.1 占优战略,占优战略是指当参与的一方拥有一种战略，该战略无论何时，无论其他参与者选择什么战略，都优于可选择的其他战略时，我们就称该参与者拥有占优战略。占优战略的判别，通过比较参与者的收益向量即可得知。,8, 4.1.2 囚徒困境,局中人甲,局中人乙,策略1（坦白）,策略2（抗拒）,策略1（坦白）,策略2（抗拒）,9,囚徒困境的博弈描述了个人动机和共同动机之间的冲

4、突：从共同利益出发，参与者的战略选择为（抗拒，抗拒），收益为（-1，-1）。但是，依据个人动机，局中人甲和乙都会选择坦白，收益反而下降到（-8，-8）。许多寡头垄断的情况具有囚徒困境的本质，只有采取一定的措施，企业才可以避免这种放弃好结果转而寻求坏结果的困境。,10, 4.1.3 劣战略,劣战略是指无论其他参与者选择何种战略，该战略的收益都比其他战略差的战略。对存在劣战略的情形，通常采用重复剔除的方法（也称累次严优法）求解。在此过程中，双方的理性假设是求解的前提。,11, 4.1.4 重复剔除的一个例子（1）,甲,乙,丙,子,丑,寅,参与者1,参与者2,12, 4.1.4 重复剔除的一个例

5、子（2）,参与者1的收益向量：战略甲（4，5，6）；战略乙（2，8，3）；战略丙（3，9，2）参与者2的收益向量：战略子（3，1，0）；战略丑（1，4，6）；战略寅（2，6，8）显然，对于参与者2而言，战略丑的收益向量明显较战略寅差，是一个劣战略，理性的参与者2将不会考虑选择此战略。参与者2可将战略丑从策略空间中剔除。,13, 4.1.4 重复剔除的一个例子（3）,甲,乙,丙,子,寅,参与者1,参与者2,参与者 2 剔除了战略丑后的博弈变成为：,14, 4.1.4 重复剔除的一个例子（4）,此时，参与者1的收益向量变为：战略甲（4，6）；战略乙（2，3）；战略丙（3，2）参与者2的收益向量

6、变为：战略子（3，1，0）；战略寅（2，6，8）同理，此时对于参与者1而言，存在着劣战略，即战略乙（2，3）和战略丙（3，2），理性的参与者1将无不犹豫地选择战略甲，而将战略乙和战略丙从策略空间中剔除。,15, 4.1.4 重复剔除的一个例子（5）,甲,子,寅,参与者1,参与者2,参与者 1 剔除了战略乙和战略丙后的博弈变成为：,最后的必然结果是参与者1选择战略甲，而参与者2选择战略子。,16, 4.1.5 纳什均衡,博弈的均衡表示参与者会选择的战略。最普通的均衡概念是纳什均衡。纳什均衡是指博弈的任何一方不能单独改变战略来提高收益的一组战略。纳什均衡的实质是给定你的策略，我的策略是最优的，

7、给定我的策略，你的策略是最优的。值得注意的是，在一个博弈过程中，纳什均衡可能不止一组，也可能不存在。,17,多重纳什均衡,参与者 1,参与者2,(T,L)和(B,R) 都是纳什均衡,18,4.2 序贯博弈：承诺和逆向归纳,4.2.1 同时决策与序贯决策4.2.2 博弈树4.2.3 逆向归纳,19, 4.2.1 同时决策与序贯决策,同时博弈就是博弈双方同时作出决策的博弈。序贯决策是指在博弈中一方在另一方作出博弈决策后，根据结果再作出决策的博弈。博弈可以用标准式（矩阵）或者扩展式（博弈树）来表示。一般情况下，同时选择的博弈用标准式来表示，而描述序贯博弈模型最好的方法是采用博弈树。,20, 4.

8、2.2 博弈树,-10，-10,10，20,0，50,2,1,e,e,r,r,决策结,收益函数,决策,参与者1(进入者)： e（进入） e,（不进入）参与者2（在位者）： r（报复） r,（不报复）,存在两个纳什均衡（0,50）和（10,20）,由于参与者2选择报复的威胁是不可置信的，所以，只有（10,20）是对参与者可能的选择的合理预测。,21, 4.2.3 逆向归纳,逆向归纳是指在在求解博弈结果时，进行反向求解，逐步去除“不合理”解的过程。逆向归纳的方法，通常适合于序贯博弈的场合。,22,b, 承诺的价值,2,-10，-10,10，-20,0，50,-10，-10,10，20,0，50

9、,2,2,1,1,b,e,e,e,e,r,r,r,r,假设参与者2签订了一份强行合约b，承诺如果参与者1选择e（进入），那么他一定会选择r（报复），否则会被罚款40，收益降为-20。,23,两个重要观点,第一，对未来行动的可置信承诺具有重要的战略价值。在本例中，承诺使得参与者2的收益从20提高到50，承诺的价值等于30。第二，可置信承诺可以通过改变参与者的收益或行动的顺序来构建。,2,1,1,-10，-10,0，50,10，20,0，50,r,r,e,e,e,e,构建参与者2预先承诺能力的模型,24,长期变量、短期变量与建模,在同时具有长期决策和短期决策时，通常先进行长期决策再进行短期

10、决策。例如，生产能力决策通常是企业的长期选择，因为生产能力（建筑物、机器）通常会持续很多年；定价是典型的短期变量，因为企业可以用相对较低的成本来频繁的改变它。短期变量是在给定长期变量值的情况下进行选择的变量，建模时通常假设参与者先选择长期变量再选择短期变量，即把生产能力决策放在第一阶段而把定价决策放在第二阶段。,25, 4.3 重复博弈,重复博弈即为一次博弈或阶段博弈的多次重复。按重复博弈的次数，可分为有限次重复或无限次重复。,26,一次博弈及其两阶段重复博弈,参与者 1,参与者2,两个纳什均衡（M,C）和（B,R）最佳纳什均衡（M,C）最佳战略（T,L）,27,两阶段重复博弈均衡与

11、一次博弈均衡一致,一次博弈均衡战略的重复执行形成了重复博弈的均衡：战略（M,C）在每一阶段都是均衡。对于参与者1来说，得到重复博弈均衡暗含的战略就是：在第一阶段选择M，而且无论第一阶段发生了什么，在第二阶段仍然选择M。对于参与者2也一样，即，博弈各方选择以往独立的战略。重复博弈的均衡与一次博弈的均衡是一致的，都采取战略（M,C）。,28,两阶段重复博弈均衡与一次博弈均衡不一致(一),假设参与者1的战略是：在第一阶段选择T；如果第一阶段的行动是（T,L）则在第二阶段选择M，否则选择B。参与者2的战略是：在第一阶段选择L；如果第一阶段的行动是（T,L）则在第二阶段选择C，否则选择R。下面

12、证明上述战略是否构成重复博弈的均衡：,29,两阶段重复博弈均衡与一次博弈均衡不一致（二）,在第二阶段中，假设第一阶段的结果是（T,L），则选定的战略要求参与者选择（M,C）。因为这些行动形成一次博弈的纳什均衡，所以在两阶段重复博弈的第二阶段选择它们是符合参与者的最大利益的。同样，若在第二阶段假设第一阶段的结果不是（T,L），则选定的战略要求参与者选择（B,R）。因为该行动同样也形成一次博弈的均衡，所以同样的推理也适用，即参与者不能通过任何改变来提高他们的收益。,30,两阶段重复博弈均衡与一次博弈均衡不一致（三）,最后，验证第一阶段的行动也是纳什均衡的一部分。对参与者1而言，选择T将在第一阶

13、段得到收益5，进而导致第二阶段的选择为（M,C），参与者1两阶段的总收益为9（5+4）。如果参与者1在第一阶段选择M，则收益为6，但会导致第二阶段的选择为（B,R），参与者1两阶段的总收益为7（6+1），比9小。同样推理也适用于参与者2。可见，博弈的任何一方对选定战略的背离都会减小他的总收益。因此，该选定的战略构成了纳什均衡。,31,结论与意义（一）,博弈的各方都在第一阶段选择受益最大化的行为（T,L）。因为博弈的双方都有动机去背离该选择，所以在一次博弈中无法维持该选择。但是，如果（T,L）是两阶段博弈均衡的一部分时，这种安排就可以实现。阶段2的行动将用来“惩罚”在第一阶段背离选定战

14、略的参与者。有了第二阶段的惩罚，第一阶段的背离实际上是没有益处的。因为，第一阶段因背离而得到的收益为1（6-5），少于在第二阶段由于参与者2的报复而导致的收益损失3（4-1）。,32,结论与意义（二）,结论：因为参与方可以对其他参与方过去的行动做出回应，所以重复博弈允许在相应的一次博弈中非均衡的结果成为均衡的结果。意义：这种由参与者之间互相报复而得以执行的“协议”在解释卡特尔的运作和合谋行为的本质时起到很大的作用。,33,本章小结,博弈是描述战略行为情况的模型。博弈包括参与者、规则和收益函数。博弈可以用标准式（矩阵）或者扩展式（博弈树）来表示。一般情况下同时选择的博弈用标准式来表示，而序贯

15、选择的博弈用扩展式来表示。,34,同时战略选择不能按字面意思来解释：当观察时滞显著时，就好像参与博弈的每一方在同时选择战略，博弈的均衡表示预期参与者会选择的战略。最普通的均衡概念是纳什均衡这种情况下参与博弈的每一方都不可能通过单独改变战略来达到最优。,35,在进行博弈分析时，不仅参与者是否理性是重要的，而且参与者是否相信其他参与者有理性也是十分重要的。序贯博弈应该逆向求解。这一过程排除了不可信的战略。,36,对未来行动的承诺会带来战略价值。重复博弈是描述参与者之间重复战略互动的模型。因为参与者可以对其他参与者过去的行动做出回应，所以重复博弈允许在相应的一次博弈中非均衡的结果成为均衡结果。,

展开阅读全文

产业组织学绪论(4)博弈论与战略 教学课件

最新文档

产业组织学绪论(4)博弈论与战略教学课件