实用有价值企业管理培训：微观经济学之博弈论

资源描述

《实用有价值企业管理培训：微观经济学之博弈论》由会员分享，可在线阅读，更多相关《实用有价值企业管理培训：微观经济学之博弈论（60页珍藏版）》请在金锄头文库上搜索。

1、第十章博弈论,2,博弈论用来分析所观察到的决策主体相互影响时的现象，在给定的条件下寻求最优的解决办法。本章主要介绍非合作博弈，非合作博弈可分成四种情况：完全信息静态博弈、完全信息动态博弈、不完全信息静态博弈和不完全信息动态博弈。本章分析的重点在完全信息静态博弈和完全信息动态博弈，分别给出纳什均衡和子博弈精炼纳什均衡的详细讲解。,3,3人对决,4,强盗分赃： 5个强盗抢到100块金币然后分赃。 A 第1个人提出方案，全体表决。超过半数同意才实施该方案，否则提案者被丢进海里。 B 第2个人继续提案，直到最后一个人。问题：第一个人可以获得多少金币？如何提案？,5,逆向思维：第4个人很被动，（

2、0，100）第3个人，（100，0，0）（99，1，0）第2个人，（97，0，2，1）第1个人，（97，0，1，0，2）,6,第一节博弈论概述,博弈论：用来分析所观察到的决策主体相互影响时的现象，在给定的条件下寻求最优的解决办法。,一、博弈论的发展,20世纪40年代博弈论思想体系初步建立，经过50年代的理论发展，博弈论在60年代逐步走向成熟。20世纪70年代中后期以后，随着博弈论在经济分析领域内的广泛和成功应用，博弈论也逐步进入主流经济学的体系。,7,博弈论的发展1944年，由冯诺依曼和摩根斯坦恩合著的博弈论和经济行为一书的出版标志着现代博弈论作为一种系统理论的创立。20世纪50年

3、代，纳什创立了公理化的讨价还价理论，证明纳什讨价还价解的存在性，逐渐形成了以纳什非合作博弈理论为核心的现代博弈论体系。20世纪60年代以后，泽尔滕在纳什的研究基础上引入动态分析，海萨尼则把不完全信息引入到博弈论中。20世纪70年代以后，经济学家开始强调个人理性。,8,博弈论与主流经济学博弈论进入主流经济学，反映了经济学发展的以下几个趋势：经济学研究的对象越来越转向个体，放弃了一些没有微观基础的假定；经济学越来越转向人与人之间竞争与合作的研究，特别是经济学注意到理性人的个人理性行为可能导致的集体非理性；经济学越来越重视对信息的研究。博弈可以划分为合作博弈和非合作博弈。合作博弈与非合作博弈之间的区

4、别主要在于人们的行为相互作用时，当事人能否达成一个具有约束力的协议。如果能，就是合作博弈；反之，则是非合作博弈。,9,二、博弈分析举例,沙滩上的饮料销售商为了争取更多的游客，两家销售商的销售位置又会开始向中点移动，最终都将销售位置定在了中点处。,10,掷币游戏A、B两个小孩玩掷币游戏，两人各拿出一枚硬币抛掷在地面上，要么正面朝上，要么反面朝上。都同为正面或反面朝上，A赢得B一枚硬币；一正面一反面朝上，A输给B一枚硬币。这个例子中，两个小孩各自得到的结果（赢得一枚硬币或者输掉一枚硬币），不仅取决于自己掷币的后果，也取决于对手掷币的后果，双方决策的互相影响构成博弈。在这个博弈中，一方所得正是其他方

5、所失，这种博弈称为零和博弈。,11,三、博弈的要素,博弈的要素包括参与人、行动、信息、策略、支付、结果和均衡，其中，参与人、策略和支付是描述一个博弈所需要的最基本的要素，参与人、行动和结果统称为博弈规则。参与人：指一个博弈中的决策主体。在囚徒困境模型中，有两个参与人，即“囚徒A”和“囚徒B”。行动：是参与人在博弈的某个时点的决策变量。在囚徒困境模型中，囚徒A、B都只有两种行动可供选择，即“坦白”和“抵赖”。,12,信息是参与人在博弈中的知识，特别是有关其他参与人（对手）的特征和行动的知识。在囚徒困境模型中，两囚徒的信息是都知道自己和另一囚徒在选择坦白和抵赖的不同组合时面对的处罚。策略：是参与人

6、在拥有既定信息情况下的行动规则，它规定参与人在什么时候选择什么行动。一个参与人的所有可选择的策略的集合就是这个参与人的策略空间。如果每个参与人选择一个策略，就构成一个策略组合。支付：在博弈论中指一个特定策略组合下参与人得到的确定效用水平，或者是指参与人得到的期望效用,13,水平。支付是博弈参与人真正关心的东西。在一个策略组合下，所有参与者的支付就构成了一个支付组合。在囚徒困境模型中，如果两囚徒的策略组合为（抵赖，坦白），那么囚徒A的支付为-10，囚徒B的支付为0，两囚徒的支付组合为（-10，0）；如果两囚徒的策略组合为（坦白，坦白），那么囚徒A和囚徒B的支付均为-8，两囚徒的支付组合为（-8，

7、-8）。结果：是博弈分析者感兴趣的所有东西，如均衡策略组合、均衡支付组合等。均衡：是所有参与人的最优策略的组合。,14,四、博弈的分类,15,第二节完全信息静态博弈,每一个参与人对所有其他参与人（对手）的特征、策略空间及支付函数有准确的知识，而且博弈的参与人同时选择行动或虽非同时但后行动者并不知道前行动者采取了什么具体行动，这种情况下参与人的决策就是完全信息静态博弈。纳什对非合作博弈的主要贡献是在一般的意义上定义了非合作博弈及其均衡解，并证明了均衡解的存在，这一均衡就被称为“纳什均衡”。,16,博弈可以采用两种不同的方式来表述，一种是策略式表述，一种是扩展式表述。从理论上讲，这两种表述形式几

8、乎是完全等价的，但策略式表述更适合于分析静态博弈，扩展式表述更适合于分析动态博弈。,一、博弈的策略式表述,策略式表述n个参与人；说明每个参与人都有哪些策略；每个参与人都选定一种策略时，每个参与人的支付水平（获得的效用）是多少。根据上面给出的三要素，策略式表述的博弈就是：,17,在双头垄断的产量博弈中，两个寡头厂商A、B是参与人，两者的产量qA、qB的范围是其策略空间，获得利润A、B是其支付，策略式表述的博弈可写为：,18,策略式表述的博弈举例在掷币游戏中，每个参与人的支付直接用其赢得或输掉的硬币数量来表示：赢得一枚硬币的支付为1，输掉一枚硬币的支付为-1。掷币游戏的支付矩阵见表10-3所示。,

9、19,再如下面的斗鸡博弈。试想有两只公鸡遇到一起，每只公鸡有两个行动选择：一是进攻，一是撤退。如果一只公鸡撤退，一只公鸡进攻，则进攻的公鸡获得胜利，撤退的公鸡很丢面子；如果两只公鸡都撤退则打个平手；如果两只公鸡都进攻，那么两败俱伤。设其支付矩阵见表10-4所示。,20,二、纳什均衡,占优策略均衡不论其他参与人选择什么策略，他的最优策略是唯一的，这样的最优策略被称为占优策略。在 “囚徒困境”的例子中，每个囚徒都有两种可选择的策略：坦白或抵赖。但是，不论另一囚徒选择什么策略，每个囚徒的最优策略是“坦白”。所有参与人占优策略的组合称为占优策略均衡。,21,囚徒困境囚徒困境讲的是两个嫌疑犯作案后被警察

10、抓住，分别被关在不同的屋子里审讯。表10-1给出了囚徒困境模型的表述。每个囚徒都有两种选择：坦白或抵赖。表中每一格的两个数字代表对应两个囚徒选择组合下各自的刑期。,22,表2 关税博弈,23,表3 新关税博弈,24,重复剔除的占优均衡考虑“智猪博弈”例子。猪圈里围着两头猪，一头大猪，一头小猪。猪圈的一头有一个猪槽，另一头安装了一个按钮，控制着猪食的供应。按下一按钮会有8个单位的猪食进槽，但按下按钮的猪需要付出2个单位的成本。若大猪先到，大猪吃到7个单位，小猪只能吃1个单位；若同时到，大猪吃5个单位，小猪吃3个单位；若小猪先到，大猪和小猪各吃4个单位。表10-5的表列出对应不同策略组合的支付水平

11、，如第一格表示两头猪同时按下按钮，就会同时走到猪食槽，大猪吃5个单位，小猪吃3个，扣除2个单位的成本，支付水平分别为3和1。,25,26,纳什均衡如果重复剔除劣策略后剩下的策略组合是唯一的，那么该博弈才是重复剔除占优可解的。但很多博弈是无法使用重复剔除劣策略的方法找到均衡解的。例如性别之战的例子。一男一女谈恋爱，周末安排业余活动，要么看足球,比赛，要么看舞蹈演出。男的爱好足球，女的更喜欢舞蹈，但他们宁愿在一起而不愿分开。支付矩阵见表10-6所示。,27,约翰纳什, 美国经济学家， 1994年Nobel 经济学奖得主。在非合作博弈的均衡分析理论方面做出了开创性的贡献，对博弈论产生了重大影响。,2

12、8,29,一个参与人的纳什均衡策略是面对其他参与人的均衡策略时的最优选择。在囚徒困境中，（坦白，坦白）是一个纳什均衡，而（抵赖，抵赖）不是一个纳什均衡，因为给定同伙选择抵赖，自己选择抵赖时得到-3，选择坦白时得到0，因而抵赖不是自己的最优策略；同样，（坦白，抵赖）和（抵赖，坦白）也不是纳什均衡。在性别之战中，（足球，足球）是一个纳什均衡，因为一旦形成这个策略组合的结果，任何一方的偏离都会造成自己支付的减少，例如女的此时去看舞蹈将把自己的支付从2降到1；同样，（舞蹈，舞蹈）也是一个纳什均衡，其他策略组合都不是纳什均衡。,30,寻求纳什均衡首先考虑A的策略，对于B的每一个给定策略，找出A的最优策略

13、，在其对应的支付下划一横线，再用类似的方法找出B的最优策略。完成这个过程后，如果某个支付组合的两个数字下都有线，这个支付组合所对应的策略组合就是一个纳什均衡。,31,比较：纳什均衡定义：对所有的i， ui (s1*, si*, sn*) ui (s1*, si , sn*) 特点：任何人都没有单方改变战略的动机。占优战略均衡定义：对所有的i， ui (s1, si*, sn) ui (s1, si , sn) 特点：每个人都必须存在占优战略。,32,通过对纳什均衡与占优策略均衡以及重复剔除的占优均衡的分析，可知它们之间的关系如下：每一个占优策略均衡、重复剔除的占优均衡一定是纳什均衡，但并非

14、每一个纳什均衡都是占优策略均衡或重复剔除的占优均衡。这是因为，一个参与人的占优策略是对于所有其他参与人的任何策略组合的最优选择，自然也一定是对于所有其他参与人的某个特定策略的最优选择；而一个参与人的纳什均衡策略只要求是对于其他参与人均衡策略（这是一个或几个特定策略）的最优选择。所以说，占优策略均衡和重复剔除的占优均衡是特殊的纳什均衡，它们所要求的条件比纳什均衡的条件要严格。,33,三、纳什均衡与寡头垄断市场,古诺模型与纳什均衡用QA、QB分别表示厂商A和厂商B的产量；CA(QA)和CB(QB) 表示两者的成本函数； PP(QAQB) 表示需求函数的逆函数，其中P是价格。厂商A和厂商B的利润函数

15、分别为：,34,对每个厂商的利润函数求一阶偏导数并令其等于零，整理可得：,反应函数意味着每个厂商的最优策略（产量）是另一个厂商的策略（产量）的函数，两个反应函数的交叉点（即两个方程的解）就是纳什均衡：,35,第三节完全信息动态博弈,一、博弈的扩展式表述,扩展式表述与博弈树扩展式表述要给出每个参与人的动态描述，即参与人在什么时点、什么情况下选择什么样的行动。,当一个人行动在前，而一个人行动在后时，后者自然会根据前者的选择进行策略的调整，前者也能理性地预期到这一点，并考虑这一影响。此时，就进入了动态博弈的分析。,36,具体来说，扩展式表述包括五个要素。参与人集合；参与人的行动顺序：哪个参与者在什

16、么时候行动；参与人的行动空间：在每次行动时参与人所有可供选择的行动；参与人的信息集合：在每次行动时参与人所知道的有关对手行动选择的信息；参与人的支付函数：在行动结束后每个参与人得到的支付，它是所有行动的函数。,37,如同用支付矩阵描述策略式表述一样，扩展式表述可以借用博弈树来描述。如图10-2所示，有两个参与者A和B进行博弈，第一个参与者A用“”来表示，有两种策略：1或2。第二个参与者B用“”来表示，参与者A选择1时，参与者B有11或12两种选择；参与者A选择2时，参与者B有21或22两种选择。(A11, B11)、(A12, B12)、(A21, B21)和(A22, B22) 表示两个参与者选择不同策略后的最终支付。这就是博弈树的形式，当然，每个参与者的策略并不局限于两种。,38,博弈树的基本结构包括结、枝和信息集。结分为决策结和终点结两类。决策结是参与人采取行动的时点，如图,

展开阅读全文

实用有价值企业管理培训：微观经济学之博弈论

最新文档