博弈论与市场竞争模型概述(PPT 135页)

资源描述

《博弈论与市场竞争模型概述(PPT 135页)》由会员分享，可在线阅读，更多相关《博弈论与市场竞争模型概述(PPT 135页)（135页珍藏版）》请在金锄头文库上搜索。

1、博弈论初步非合作寡占模型合作寡占模型垄断竞争模型,1,第六章博弈论与市场竞争模型,6.1 博弈论初步,一、什么是博弈论 1、博弈论的定义博弈论是研究决策主体之间的行为发生直接作用时的决策（即决策者的收益不仅取决于自己的行动，也取决于对手的行动），以及这种决策的均衡问题。 2、为什么要学习博弈论？新古典企业理论认为消费者是在收入和价格的约束下追求效用最大化；企业则是在技术和市场的约束下追求利润最大化，与其他人的选择无关。因此消费者被理解为效用函数，企业被理解为生产函数。对于个体而言，所有其他个体的行为被一个参数即价格所包括。同时假定是完全信息的，不存在信息不对称。但在不完全竞争市场

2、上必须要考虑对手的行为和不完全信息，而博弈论是研究自己的收益和选择取决于其他人的收益和选择。,2,3、基本概念博弈论的基本概念包括：参与人、行动、信息、战略、支付函数、结果、均衡。参与人指的是博弈中选择行动以最大化效用的决策主体(个人或团体)；战略是参与人选择行动的规则，它告诉参与人在什么时候选择什么行动 (如“人不犯我，我不犯人；人若犯我，我必犯人”是一种战略，“犯”与“不犯”是两种不同的行动，战略规定了何时选择“犯”，何时“不犯”)；行动是参与人的决策变量；信息指参与人在博弈中的知识，特别是其他参与人(对手)的特征和行动的知识；支付函数是参与人从博弈中获得的效用水平，是所有参与

3、人战略或行动的函数；结果是指博弈分析者感兴趣的要素的集合；均衡是所有参与人的最优战略或行动的组合。博弈分析的目的是使用博弈规则决定均衡。,3,4、博弈的划分博弈的划分可以从两个角度进行。第一个角度是按照参与人行动的先后顺序，划分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈指的是博弈中，参与人同时选择行动，或虽然不是同时行动，但后行动者并不知道前行动者采取了什么具体行动；动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到前行动者所选择的行动。第二个角度是根据参与人对其它参与人的特征，战略空间和支付函数的知识，划分为完全信息博弈和不完全信息博

4、弈。完全信息博弈是指每一个参与人对所有其它参与者的特征、战略空间和支付函数有准确知识。否则就是不完全信息。表1 博弈的分类及对应的均衡概念,4,二、完全信息静态博弈 1、占优战略例一，囚徒困境(prisonersdilemma)。两个疑犯作案后被警察抓住，分别被关在不同的屋子里审讯。警察告诉他们：如果两人都坦白，各判刑8年；如果两个都抵赖，各判1年(或许因证据不足)；如果其中一人坦白另一人抵赖，坦白的放出去，不坦白的判刑10年。表1给出囚徒困境的战略式表述。这里，每个囚徒都有两种战略：坦白或抵赖。表中每一格的两个数字代表对应战略组合下两个囚徒的支付(效用)，其中第一个数字是囚徒A的支付

5、，第二个数字为囚徒B的支付。表2 囚徒困境,5,战略式表达：矩阵相对应的每个小格表示每位参与者采取不同的战略组合时所得到的收益，特别方便于静态分析。在每个小格左下角的数字代表参与者1所得的收益；右上角的数字则代表参与者2的收益。在这个例子里，纳什均衡就是(坦白，坦白)：给定B坦白的情况下，A的最优战略是坦白；同样，给定A坦白的情况下，B的最优战略也是坦白。 (坦白，坦白)不仅是纳什均衡，而且是一个占优战略均衡。不论对方如何选择，个人的最优选择是坦白。结果是，每个人都选择坦白，各判刑8年。占优均衡：如果某参与方的某一战略无论何时，无论其他参与者选择什么战略，都优于可选择的其他战略时，就称该

6、参与者拥有占优战略（dominant strategy）。如果一位参与者拥有占优战略而且有理性，则我们预期他会选择占优战略。占优战略只需假设该参与者是理性的，而不需要假设其他参与者也有理性，甚至不需要假设该参与者知道其他参与者的收益。,6,囚徒困境反映了个人理性与集体理性的矛盾。如果两个人都抵赖，各判刑1年，显然比都坦白各判刑8年好。但这个帕累托改进办不到，因为它不满足个人理性要求，(抵赖，抵赖)不是纳什均衡。囚徒困境在经济学上有着广泛的应用: （1）产量选择的寡头博弈。如果两企业联合起来形成卡特尔，选择垄断利润最大化的产量，每个企业都可以得到更多利润。但卡特尔协定不是一个纳什均衡，因为给

7、定对方遵守协议的情况下，每个企业都想增加生产，结果每个企业都只得到纳什均衡产量的利润，它严格小于卡特尔产量下的利润。（2）公共产品的供给。如果大家都出钱兴办公用事业，所有人的福利都会增加。但是，如果我出钱你不出钱，我得不偿失；而如果你出钱我不出钱，我就可以占便宜。所以，每个人的最优选择都是“不出钱”，这种纳什均衡使得所有人的福利都得不到提高。从囚徒困境中，可以引出一个很重要的结论：一种制度(体制)安排，要发生效力，必须是一种纳什均衡。否则，这种制度安排便不能成立。,7,2、劣战略与重复剔除的占优均衡只有很少的博弈具有占优战略，因此需要寻找其他方法来“求解”博弈。考虑参与者1的决策。表3的

8、博弈没有占优战略。但存在劣战略M。如果参与者2选择L，则对于参与者1来说，选择B战略要比M战略好。参与者2选择C或R时，情况也是一样的。从参与者1的角度来看，B战略要比M战略占优势(实际上，T战略也比M战略占优势)。而在囚徒困境中，无论对方选择何种战略，抵赖的战略的收益都比其他战略差，因此抵赖战略就是一个劣战略。表3 重复剔除劣战略,8,劣战略(dominated strategy)：当存在一种战略，无论其他参与者选择何种战略，该战略的收益都比其他战略差时，我们就定义该战略为劣战略。如果给定的参与者有劣战略且有理性，则我们预期此参与者不会选择该战略。劣战略的概念比占优战略的概念要弱一些

9、。如果参与者1有占优战略，他肯定会选择该战略；但当参与者1有劣战略时，只能说明他不会选择该战略，仍然有许多战略可供参与者1选择。但是，如果重复剔除“劣”战略，则可能得到更明确的信息。假设参与者2知道参与者1的收益，而且还知道参与者1是有理性的。根据以上推理，参与者2预计参与者1应该不会选择战略M。给定参与者1不会选择战略M，参与者2发现C战略相对于L和R战略成为“劣”战略。需要注意的是，严格来说，C战略并不是劣战略：如果参与者1选择战略M，则C战略要比L和R战略都要好。但是，在给定参与者1不选择M战略的情况下，C战略相对于L和R战略则成为劣战略。,9,进一步进行此过程。如果参与者1是有理性的

10、，而且相信参与者2也是有理性的，同时也相信参与者2会认为参与者1也是有理性的，参与者1就会发现T战略是“劣”战略。如果参与者2不选择C战略，则T战略相对于B战略而言成为“劣”战略：如果参与者2选择L战略，则对于参与者1来说，B战略更好；如果参与者2选择R战略，对于参与者1来说，仍然是B战略较好。最后，对于参与者2来说，L是“劣”战略。这样，我们剩下一对战略(B，R)。即博弈的“解”。 “重复剔除严格劣战略”(iterated elimination of strictly dominated strategies) ：首先找出某个参与人的劣战略(假定存在)，把这个劣战略剔除掉，重新构造一个

11、不包含已剔除战略的新的博弈；然后再剔除新博弈中某个参与人的劣战略；继续这个过程，一直到只剩下一个唯一的战略组合为止。这个唯一剩下的战略组合就是这个博弈的均衡解，称为“重复剔除的占优均衡” 。,10,注意“占优战略”和“劣战略”的区别：（1）两者的强弱不同占优战略是指一个参与人所有可选择的战略中严格优于所有其他战略的那个战略，所有的其它战略都是相对于该占优战略的劣战略。在应用重复剔除方法寻找均衡时，一个战略是劣战略可能只是相对于另一个特定战略而言的。（2）对理性和共同知识的假设要求不同重复剔除劣战略所需的假设比占优战略的假设要严格得多。在占优战略中，需要假设的就是参与者有理性以及效用最

12、大化。重复剔除劣战略则需要假设博弈的各方都相信其他方是有理性的，而且也相信其他参与者相信自己是有理性的，即理性参与是一种共同知识。,11,在博弈分析中，不仅参与者是否有理性是重要的，参与者是否相信其他参与者有理性也是十分重要的。表4中的博弈中，参与者2有劣战略L，也有占优战略R。如果参与者1相信参与者2有理性，则参与者1会预期参与者2应该选择R战略而非L战略。在给定这一信念的情况下，参与者1的最佳战略选择是B，收益为2。但是，假设参与者1认为参与者2没有理性，则B战略就不再是最佳选择。因为如果参与者2选择了L战略，则参与者1的收益为-100。表4 劣战略的不确定性,12,3、纳什均衡表

13、5的博弈没有劣战略和占优战略。该博弈中任一参与方的最佳战略取决于其他方的战略选择。因此，必须考察参与者1对参与者2战略选择的推测以及参与者2对参与者1战略选择的推测。这个博弈的自然候选“方案”是： (1)给定对其他参与者战略选择的推测后，参与博弈的每一方都选择最佳战略。(2)上述推测与其他参与者的战略选择一致。表5 纳什均衡,13,假设参与者1推测参与者2会选择R，而参与者2推测参与者1会选择B。在给定这些推测的条件下，参与者1的最佳战略选择是B而参与者2的最佳战略选择是R。实际上，如果参与者1推测参与者2选择R，则参与者1的最佳战略选择是B；其他任何选择都会造成较低的收益。对于参与者2而言

14、，情况也是同样的。需要注意的是，基于这些战略，参与者的推测是一致的：参与者1认为参与者2会选择自己认为最佳的战略，反之亦然。这种情况被称为纳什均衡。它是完全信息静态博弈解的一般概念。纳什均衡(Nash equilibrium)：博弈的任何一方不能够单独改变战略来提高收益的一组战略被称为纳什均衡。在表5的博弈中(B，R)是纳什均衡，其他任何战略组合都不是纳什均衡。例如，(M，C)不是纳什均衡。因为如果给定参与者2选择战略C，则T对于参与者1来说是最优战略，而非M。,14,与占优战略的选择相反，纳什均衡概念的应用常会产生一个均衡，有时存在不止一个均衡。表6中(T，L)和(B，R)都是纳什均

15、衡。该博弈的一个例证就是寻求标准化。战略T，L和战略B，R与导致兼容的战略组合一致。博弈双方在兼容时的收益都较好。参与者1倾向标准(B，R)的兼容，而参与者2倾向标准(T，L)的兼容。这个例子代表了一类博弈：(1)参与者都想调和；(2)有不止一个调和点；(3)博弈各方在哪个点更好的问题上意见不一致。表6 多重纳什均衡,15,市场进入阻挠。在位者的垄断地位受到进入者的威胁，所以要阻挠进入者进入。博弈中进入者有两种战略可以选择：进入/不进入；在位者也有两种战略：默许/斗争。假定进入前垄断利润为50，进入后寡头利润合为40(各得20)，进入成本为10。各种战略组合下的支付矩阵如表7所示。这个博

16、弈有两个纳什均衡，即(进入，默许)，(不进入，斗争)。给定进入者进入，在位者选择默许时得20单位利润，选择斗争时利润为-10，所以最优战略是默许；类似地，给定在位者选择默许，进入者的最优战略就是进入。因此(进入，默许)是纳什均衡。只有当在位者选择斗争时，不进入才是进入者的最优选择，所以，(不进入，斗争)也是纳什均衡。表7 多重纳什均衡与市场进入阻挠,16,纳什均衡与占优战略均衡及重复剔除的占优均衡之间的关系： (1) 占优战略均衡、重复剔除的占优均衡一定是纳什均衡，但并非纳什均衡都是占优战略均衡或重复剔除的占优均衡。许多不存在占优战略均衡或重复剔除的占优均衡的博弈，却存在纳什均衡。因为如果参与人的占优战略是对于所有其他参与人的任何战略组合的最优选择，自然它也一定是对于所有其他人的某个特定战略的最优选择。其次，一个战略构成纳什均衡战略的唯一条件是它是参与人对于其他参与人均衡战略的最优选择。因此在重复剔除过程中，

展开阅读全文

博弈论与市场竞争模型概述(PPT 135页)

最新文档