第十章博弈论课件－金锄头文库

资源描述

《第十章博弈论课件》由会员分享，可在线阅读，更多相关《第十章博弈论课件（57页珍藏版）》请在金锄头文库上搜索。

1、1,第十章博弈论,2,10.1博弈和博弈论,博弈和博弈论博弈的要素博弈的种类,3,10.1.1 博弈的概念,传统经济学是研究市场完全竞争条件下的人们行为的选择，而且假定信息是充分的；但是，实际生活中人们的行为不是在市场完全竞争的条件下，这时人们行为的结果不仅取决于自己，还取决对手，这是人们的选择称为“策略”或者“战略”（strategy）,战略的典型形式是“对手采取A行动，则我采取B行动” 博弈论(game theory)研究参加各方之间相互影响，存在利益冲突和依赖的某项活动，为了实现自己的利益目标，需要在考虑其他参与人行动的条件下，应当如何选择和实施一系列行动和战略。,4,猜硬币的博弈

2、,5,可口可乐和百事可乐的价格战,6,10.1.2 博弈的要素,参与人（players or actors）行动（actions or moves）信息（information）：关于博弈的各种知识战略（strategies）支付（payoff）结果（outcome）：参与人的行动、战略或者收益的各种可能出现的组合。如甲出正面，乙才正面，支付是（输，赢）,7,10.1.3 博弈的种类,对于博弈，根据博弈的各种要素或者其间的关系，可以有多种分类首先可以划分为合作博弈和非合作博弈。博弈论主要研究非合作博弈，每个参与人只考虑自身利益最大化为目标。非合作博弈的种类，见表经济学家主要研究了

3、四种博弈结构，见表,8,9,四种主要的博弈类型,NE：纳什均衡 BNE：贝叶斯纳什均衡 SPNE：子博弈精练纳什均衡 SPBE：子博弈精练贝叶斯纳什均衡,10,10.1.4 博弈论,博弈论：研究理性的经济主体在相互影响的决策中的战略选择博弈论的关键：找出其他参与人选择既定条件下自己的最优反应行为（即最优战略）如果自己的最优战略和其他参与人的最优战略是相容的，则各方都没有激励改变战略，这个战略组合就是均衡战略。博弈论研究的目标就是找出均衡战略,11,10.2 纳什均衡,概述案例：囚徒困境博弈的战略表达式最佳战略纳什均衡纳什均衡的解法练习：求解修路博弈纳什均衡的社会含义,12,

4、10.2.1 概述,均衡是一种稳定的状态，在此状态下，经济主体都没有单方面改变行为的动机和激励。例如市场竞争的供求均衡就是一种这样的状态在博弈情形下的均衡，就是博弈均衡，由于这种均衡的思想是最早有纳什（Nash）提出的，所以称为纳什均衡本节以完全信息的静态博弈为例，阐述博弈均衡的思想，以及人们的行为选择策略,13,10.2.2 囚徒困境,张三和李四合伙抢了珠宝行，却在离现场不远的地方被逮。他们被关进分隔的牢房。检察官分别告诉他们：如果两人都不坦白，他们会因非法携带枪支的罪名各判刑年；如果其中一人招供而另一人不招，坦白者作为证人将不会被起诉，另一人将会被重判10年；如果两人都招供，则两人都会

5、以抢劫罪名各判8年。问：张三和李四选择坦白还是不坦白？,14,10.2.3 博弈的战略表达式,博弈的战略表达式（有的教科书称之为 “标准表达式”）是指用参与人及其战略和支付表达的博弈，包括3个方面：参与人集合，I=(1,2,3,n) 每个参与人的战略空间Si，i =1,2,3,n 每个参与人的支付函数ui，ui= ui（s1，s2，sn）。战略表达式一般的表示方式是用一个支付矩阵表格表示,15,囚徒困境的战略表达式,前一个支付为行的支付，后一个支付为列的支付,16,10.2.4 最优战略的概念,所谓最优战略，是指给定其他参与人战略的条件下，使自己收益最大的战略。如果其他参与人的战略组合

6、用s-i=（s1，s2，si-1，si+1，,sn）表示，s*i是最优战略，则有：,17,写出囚徒困境的最优战略,囚徒A 给定B坦白，A的最优战略是坦白；给定B抵赖，A的最优战略是坦白；囚徒B 给定A坦白，B的最优战略是坦白；给定A抵赖，B的最优战略是坦白。,18,写出猜硬币的最优战略,儿童 A 给定B猜正面，A的最优战略是出反面；给定B猜反面，A的最优战略是出正面；儿童B 给定A出正面，B的最优战略是猜正面；给定A出反面，B的最优战略是猜反面。,19,10.2.5 纳什均衡的概念,如果一个战略组合包括了所有参与人的最优战略，即其他参与人不改变战略，则任何一个参与人都没有激励改变自

7、身战略，该战略组合s*=s*1 ， s*2 ，， s*n 就是纳什均衡（Nash equilibrium，NE）,20,准确理解纳什均衡,纳什均衡是一个战略组合均衡的战略组合包含了所有参与者的最优战略，是最优战略的组合；均衡战略组合是每一个参与者最优战略的交集部分。每个参与人肯定存在最优战略，但是如果不存在交集，或者说参与人之间的最优战略是不相容的，就没有均衡的战略组合。,21,囚徒困境的纳什均衡,A、B最优战略的交集是坦白，所以（坦白，坦白）就是均衡战略，更具体一些说，（B坦白则A坦白， A坦白则B 坦白），均衡支付是（-8，-8）。虽然（坦白，抵赖）是A的最优战略，但是B并不会选

8、择这个战略，所以这时A、B最优战略的交集是空集。同理，虽然（抵赖，坦白）是B的最优战略，但是A并不会选择这个战略，所以这时A、B最优战略的交集是空集。,22,猜硬币的纳什均衡,由于A的最优战略和B的最优战略没有交集，或者说二者是不相容的，所以猜硬币博弈没有纳什均衡以后我们看到，这种肯定性的战略称为纯战略，猜硬币博弈没有纯战略均衡，但是存在混合战略均衡，即一定的概率采取某种行动。,23,优势战略的纳什均衡,如果一个参与人的最优战略不依赖于其他参与人的战略，这个最优战略就是优势战略。如果对于所有的i，s*i是的优势战略，那么，战略组合（s*1，s*2，, s*i，s*n）就是优势战略NE 实

9、际上，在囚徒困境中，坦白是两个囚徒的优势战略（因为B坦白和不坦白时，A的优势战略都是坦白，B也是如此），所以（坦白，坦白）就是一个优势战略NE 优势战略均衡是纳什均衡的一个特例,24,10.2.6 求解NE的方法,划线法箭头法,25,第1步任选A的每一个行动，找出B的最优战略，在B的最优战略的相应支付下划线第2步任选B的每一个行动，找出A的最优战略，并划线第3步如果一个战略组合都被划线，就是NE,划线法求解纳什均衡,26,任选一个战略组合，观察其是否稳定。如果A选择该战略，观察B的战略是否为最优战略，如果不是，找出B的最优战略，并划箭头指向之；如果B稳定，则观察A这是的战略是不是最

10、优战略，如果不是，找出A的最优战略，并划箭头指向之；如果A也是稳定的，则该组合是NE,箭头法求解纳什均衡,27,10.2.6 练习,假定张三和李四同住一村，通往公路有一段距离需要修路。修路的成本是4，如果两个人同时修，可以平担成本。张三和李四都存在出钱修路和不出钱修路的选择。考虑以下情况的博弈均衡战略张三和李四的收益都是3 张三和李四的收益都是5 张三的收益是5，李四的收益是3 求解三种情形下的NE，说明参与人的战略,28,修路的囚徒困境,29,修路的斗鸡博弈,30,修路的智猪博弈,31,10.2.7 NE的社会意义,NE的结局存在改进的空间，不是帕累托最优的个人理性不能保证集体理性存在

11、个人投机的动机，导致行为和结果的不确定性。市场机制不是有效率的，政府的干预存在可能性。,32,10.3 混合战略均衡,混合战略猜硬币的混合战略混合战略均衡,33,10.3.1 混合战略,定义：对于博弈G=I；S；u，假定 i有K个纯战略，战略空间为Si=si1, si2, siK，则pi=（pi1, pi2, piK）是i的一个混合战略，这里pik是选择sik的概率，k=1，2，K,，且,34,儿童出硬币，儿童猜硬币的正反面，猜中为赢该博弈没有纯战略 A的混合战略是（pA，1-pA），B的混合战略是（pB，1-pB） A的期望支付：vA=pA pB+（1pB）+（1-pA）pB（1pB

12、） =2pA+2 pB4 pA pB1 B的期望支付： vB=4 pA pB2pA2 pB+1,两小猜枚,35,10.3.2 混合战略纳什均衡,对于两小猜枚博弈，要使A的期望支付最大化，则需要满足,这个解的意思是说：假定A有一个最优的混合战略，这个战略就是，如果B猜正面的概率小于0.5，A就出正面；若大于0.5，则出反面,36,同理，要使B的期望支付最大化，则需要满足pA=0.5,这个解的意思是：假定B有一个最优的混合战略，这个战略就是，如果A出正面的概率大于0.5，B就猜正面；若小于0.5，则猜反面,pB,pA,pB,pA,0,0.5,1,如果A、B都知道对方的意图，就只能选择pA=0.

13、5， pB=0.5,37,斗鸡博弈（chicken）,这个博弈有纯战略NE吗？,38,10.3.3 斗鸡博弈的混合战略均衡,这个博弈有纯战略NE吗？,39,支付均等化方法求解混合战略,斗鸡博弈的一个特点是它是一个对称博弈，其最优战略一定应当是相同的，所以其概率可以使用同一个符号表示求解最优战略的方法是：采取最优混合战略时，两个纯战略的期望支付必然是相等的,对于琼斯来说，,同理，对于史密斯，得到：,40,斗鸡博弈的一般化,假定都坚持的支付为x，则可以解得混合战略为=1/（1+x）显然， x =3时， =0.25；如果x =9时， =0.1； x =99时， =0.01 所以，混合战略均衡的解

14、释比纯战略均衡更加合理,41,10.3.4 混合战略的特点,如果存在优势战略NE，就不存在混合战略，因为这时混合战略不如优势战略，不符合理性人假设，这时可能求解去混合战略的概率大于1或者小于0 混合战略的概率大小取决于支付数值的大小，而不仅仅是数值的排序，而纯战略NE只与数值的顺序有关参与人混合战略的概率取决于另一参与人的支付,42,10.4 完全信息动态博弈,基本涵义举例完全信息动态博弈的表达式完全信息动态博弈的均衡,43,10.4.1 概念,完全信息动态博弈：参与人的信息是充分的，任何可能发生的事件都是确定的，不过参与人采取行动有先后顺序；而且，后行动者可以观察到先行动者的行动,4

15、4,10.4.2 市场进入博弈,有一个行业，原来有一个企业（称为在位者），可以有年利润300万。现在有一个强势的新企业（称为进入者）想投资进入瓜分利润。如果在位者默许，则进入者获得50万利润，在位者利润降为40万；如果在位者采取降低价格的斗争策略，则自己要亏损10万，而进入者的利润为0。假定进入者先采取行动，在位者如何制定自己的战略？进入者是否进入？,45,静态博弈的情形,46,10.4.3 动态博弈的扩展表达式,先动者,后动者,（支付，支付）,行动A,行动2,行动B,行动1,支付的顺序为（先动者，后动者）,（支付，支付）,后动者,（支付，支付）,行动A,行动B,（支付，支付）,决策结

16、,枝,47,进入者,在位者,（0，300）,（50，40）,（0，10）,默许,不进入,斗争,进入,支付的顺序为（进入者，在位者）,市场进入博弈的扩展表达式,48,10.4.4子博弈与子博弈精练纳什均衡,子博弈，是能够自成一个博弈的某个动态博弈的一个阶段，具有一个初始信息集，具备进行博弈的各种信息如果动态博弈中的参与人的战略在原博弈和所有的子博弈中都构成纳什均衡，则该战略组合是子博弈精练纳什均衡。,49,动态博弈均衡的逆推归纳法,逆推归纳法，就是从动态博弈的最后一个子博弈（动态博弈的最后一个阶段）开始，逐步向前推导出动态博弈均衡的方法。逆推归纳法的依据是假定先行为的参与人总是在考虑后采取行动的参与者在后一个阶段的选择而选择自己的行动的。例如，进入者是否进入，要考虑如果自己进入，在位者的最优选择应该是什么，这样才能对是否进入做出选择。没有后采取行动的参与者的相应行动，先行动的参与者就没有依据，不符合纳什均衡的原则。,50,进入者,在位者,

展开阅读全文

第十章 博弈论课件

第十章博弈论课件