微观经济学第七版丹尼尔罗伯特中央财经大学 chapter_12

资源描述

《微观经济学第七版丹尼尔罗伯特中央财经大学 chapter_12》由会员分享，可在线阅读，更多相关《微观经济学第七版丹尼尔罗伯特中央财经大学 chapter_12（41页珍藏版）》请在金锄头文库上搜索。

1、Microeconomics 中央财经大学宋一淼 ,微观经济学,Chapter 12,Game Theory and Competitive Strategy 博弈论和竞争策略,博弈论和竞争策略,要讨论的问题,博弈和决策占优策略均衡纳什均衡,一、博弈和决策,博弈的含义：研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈(game)的基本构成要素参与者(participant) 策略或行动(strategy)：参与者在博弈中遵循的行动规则或计划。支付（得益）(payoff)：如以汇报或利润等方式表示的产出；拍卖中赢家的支付即其CS,一、博弈和决策,博弈的分类：非合

2、作博弈与合作博弈合作博弈(cooperative game) 参与者可以谈定能使它们设计联合策略的有约束力的合同例子：买卖双方商议一种商品或服务的价格，或者两厂商的合资企业（如微软和IBM）签订一份能够分配联合投资利润的有约束力的合同。使得双方都获益的合作的结果是有可能的，也就是有约束力的合同是可能的,一、博弈和决策,非合作博弈(noncooperative game) 谈判和执行有约束力的合同是不可能的例子：假定其它厂商的行为，两个竞争性厂商独自决定价格和广告策略，以获得市场份额。再如，拍卖时每一个投标者在做出自己的最优投标决策时，都必须考虑其他投标者可能的行动。有约束力的合同

3、是不可能的这也是合作博弈与非合作博弈的基本区别。我们主要关心的是非合作博弈,一、博弈和决策,不论是非合作博弈还是合作博弈，策略设计都应满足：以理解你的对手的观点为基础，且（假定你的对手是理性的，）推断他或她对你的行动的可能反应。,例子：囚徒困境 (prisoners dilemma) 注意以下的支付是负的。他们不能共谋，且即使共谋也难以互相信任。结果无论A还是B都以坦白作为总是最优方案。,囚徒A,坦白,不坦白,坦白,不坦白,囚徒B,你选择坦白吗？,博弈的分类（续）,从行为的时间序列性，博弈论分为静态博弈、动态博弈两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先

4、行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。“囚徒困境“就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全信息博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。,二、占优策略均衡,占优策略(dom

5、inant strategy) 不论对手选择什么策略，这个策略对自己都是最优的。占优策略均衡(equilibrium in dominant strategies) 由所有参与者的占优策略构成的策略组合。,例子：广告博弈的支付矩阵,厂商 A,做广告,不做广告,做广告,不做广告,厂商 B,广告博弈的支付矩阵,从分析来看，做广告对于厂商A是占优策略。对于厂商B这也是正确的：不管厂商A的决定是什么，厂商B做广告都能得到最好的结果。所以，如果设两厂商都是理性的，则这个博弈的结果是两个厂商都做广告。也就是两个厂商都有占优策略。这样的博弈结果也就是占优策略均衡(equilibrium in dom

6、inant strategy)。然而，并不是每个博弈的各个参与者都有一个占优策略。如,厂商 A,做广告,不做广告,做广告,不做广告,厂商 B,例子：修改后的广告博弈 A没有占优策略，他的最优决策取决于B：当B做广告，A最好也做；B若不做，A不做是最好选择,三、纳什均衡,纳什均衡(Nash equilibrium) 在给定其他参与者的行动后，每个参与者采取了他能采取的最优行动。由所有参与者的最优行动构成的策略组合，被称为纳什均衡。给定你所做的，我采取我能采取的最优行动；给定我所做的，你采取你能采取的最优行动。,纳什均衡 (Nash equilibrium),占优策略(dominant st

7、rategy) 不管你如何行动，我都采取我能采取的最优行动。不管我如何行动，你都采取你能采取的最优行动。由此可以看出，占优策略均衡是纳什均衡的特例,纳什均衡的例子两个早餐麦片公司一个脆麦片生产者的市场一个甜麦片生产者的市场每个厂商仅有推出一种新麦片的资源非合作的,纳什均衡 (Nash equilibrium),产品选择问题,产品选择问题,Firm 1 厂商1,Crispy 脆,Sweet 甜,Firm 2 厂商2,Crispy 脆,Sweet 甜,海滩定位问题,竞争者定位在何处（纳什均衡在何处）？若开始对手在A点，那么你可以在他左边即占领3/4的市场，而对手只有1/4的市场。但

8、这不是一种均衡最终，两个销售者都会选择C即海滩中点。,类似问题,这个决策问题的例子包括: 加油站定位总统选举,混合策略均衡 Mixed strategies,石头、布、剪子的博弈孩子 B石头布剪子孩石头子布 A 剪子这里没一个策略组合所对应的收益要素中，两个人的收益之和总是零，即零和博弈。上述博弈找不出每个人都最优的策略组合，所以本博弈无均衡。如果把策略选择过程随机化，从混合策略的意义上来分析，仍能发现nash均衡。,混合策略均衡 Mixed strategies,游戏者BF C 游戏者A FC若B在策略F和C之间选择的概率密度各为1/2，则若A选择F，A的效用就是1/2

9、 *(-1)+1/2* (1)=0；若A选择C，A的效用仍是1/2 *(1)+1/2* (-1)=0 可见，B选择F和C的概率各为1/2时，A选择F和C的效用是相同的。这说明A在这种条件下的最大效用为零，并且对F和C无差异。,混合策略均衡 Mixed strategies,若A以1/2概率选择F与C，则B在F与C无差异，而且也达到效用极大化，即零。即A与B都以（1/2,1/2）的概率选择F与C，则它们各自都达到了效用极大化。则混合策略定义为：对于游戏者i，其一个混合策略是一个概率密度函数i:Si-R，使得对于所有的si都有0，并且i(Si)=1 即游戏者i的混合策略是m个密度函数（若有

10、m个可能的策略选择）。若第i个游戏者只有两个可能的策略选择，则其混合策略就只是p与（1-p）两个概率,最大最小化策略 (max min stratesy),这是一种保守的策略，又是风险比较小的策略。当游戏者想回避风险时，他会采取该策略。游戏者B左右游戏者A 上下若B是理性的，他肯定会选右，因为右占优于左的若A相信B是理性的，他必选下，达到A与B都收益极大化的结果（2,1）,最大最小化策略 (max min stratesy),但A这样决策会有风险：若B以损害A为目标，则B知道A会选择下时会故意选择左。尽管B这样做对自己并没有好处，反而比选右少的一个单位利益。但B达到了损害A程度最大的目

11、标。 A若估计到这一可能性，则保守为妙两害相权取其轻，即最大最小化策略。 A首先考虑，若选上，min1,1=1若选下， min-1000,2=-1000 A的决策是从两个坏结果中挑一个相对好一些的结果 Maxmin1,1, min-1000,2=max1,-1000=1 故A选上。,智猪博弈 Pigs payoffs,这是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑

12、到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。在两头猪都有智慧的前提下，最终结果是小猪选择等待，即等待是小猪的占优策略。用报酬矩阵可清晰的刻画出小猪的选择：,智猪博弈 Pigs payoffs,小猪将选择“搭便车”策略，也就是等在食槽边；而大猪则为一点残羹奔忙于踏板和食槽之间。小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强,智猪博弈 Pigs payoffs,“小猪躺着大猪跑”的现象是由于故事中的游戏规

13、则所导致的。规则的核心指标是：每次落下的事物数量和踏板与投食口之间的距离。如果改变一下核心指标，猪圈里还会出现同样的“小猪躺着大猪跑”的现象吗？改变方案一：减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩，大猪将会把食物吃完；大猪去踩，小猪将也会把食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板的动力了如果目的是想让猪们去多踩踏板，这个游戏规则的设计显然是失败的。,智猪博弈 Pigs payoffs,改变方案二：增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质

14、相对丰富的“共产主义”社会，所以竞争意识却不会很强。对于游戏规则的设计者来说，这个规则的成本相当高（每次提供双份的食物）；而且因为竞争不强烈，想让猪们去多踩踏板的效果并不好。,智猪博弈 Pigs payoffs,改变方案三：减量加移位方案。投食仅原来的一半分量，但同时将投食口移到踏板附近。结果呢，小猪和大猪都在拼命地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好消费完。对于游戏设计者，这是一个最好的方案。成本不高，但收获最大。,智猪博弈 Pigs payoffs,“智猪博弈”故事给了竞争中的弱者（小猪）以等待为最佳策略的启发。但对于社会而言，因小猪未能参与竞争，小猪搭便车时的社会资

15、源配置的并非最佳状态为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府如此，公司的老板也是如此。如，公司的激励制度设计，奖励力度太大，又是持股，又是期权，成本高不说，员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大，而且见者有份（不劳动的“小猪”也有），一度十分努力的大猪也不会有动力了-就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三-减量加移位的办法，奖励并非人人有份，而是直接针对个人（如业务按比例提成），既节约了成本，又消除了“搭便车”现象，能实现有效的激励。,斗鸡博弈(Chicken Game),其实是一种误译

16、。美国口语中的Chicken是懦夫的意思，也就是应翻译为懦夫博弈，但错误不严重。,斗鸡博弈(Chicken Game),它强调的是如何在博弈中采取妥协的方式获得利益。如果双方都换位思考，他们就可以就补偿进行谈判，最后造成以补偿换退让的协议。博弈中经常有拖鞋，双方若能换位思考就可以容易达成协议。考虑自己得到多少补偿才愿意退出。只有从自己立场出发考虑问题，不愿意退让，又不想给对方一定的补偿，则僵局就难以打破。,博弈论发展简史,博弈论思想古已有之，我国古代的孙子兵法就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。对于博弈论的研究，始于策墨洛(Zermelo,1913)、波雷尔(Borel,1921)及冯诺伊曼(von Neumann, 1928)，后来由冯诺伊曼和奥斯卡摩根斯坦(von Neumann and Morgenstern，1944，1947)首次对其系统化和形式化（Myerson, 1991）。随后约翰福布斯纳什(John Forbes Nash Jr., 1950, 1951)利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。,

展开阅读全文

微观经济学 第七版 丹尼尔 罗伯特 中央财经大学 chapter_12

微观经济学第七版丹尼尔罗伯特中央财经大学 chapter_12