微观经济学第十章博弈论

资源描述

《微观经济学第十章博弈论》由会员分享，可在线阅读，更多相关《微观经济学第十章博弈论（31页珍藏版）》请在金锄头文库上搜索。

1、第十章博弈论第一节博弈论基础一、博弈论（Game Theory）博弈论研究决策主体的行为相互发生直接作用时的决策，以及这种决策的均衡问题。也就是说，一个主体（一个人或一个企业）的选择受到其他主体选择的影响，并且其选择反过来会影响到其他主体的选择，这类的的决策问题和均衡问题就是博弈论研究的对象。在这个意义上说，博弈论也称为“对策论”。博弈论中的个体决策与传统经济学中的行为个体决策不同。二、博弈论的基本概念1、参与者/局中人（players）：在博弈中选择行动以最大化自己效用的决策主体。2、行动（acttions, moves)：参与者的决策变量。3、战略（strategies）：参

2、与者选择行动的规则。4、信息（information）：是参与人在博弈中的知识，特别是有关其他参与人(对手)的特征和行动的知识。5、支付/收益（payoff）：是参与人从博弈中获得的效用水平，是所有参与人战略或行动的函数，也是是每个参与人真正关心的东西。6、结果（outcomes）：是指博弈分析者感兴趣的要素的集合。7、均衡（equilibrium）：是所行参与人的最优战略或行动的组合。上述概念中，参与人、行动、结果统称为博弈规则，博弈分析的目的是使用博弈规则决定均衡。三、博弈的分类1、合作博弈（cooperative game）和非合作博弈（non- cooperative game

3、）：人们的行为相互作用时，当事人能不能达成一个具有约束力的协议，如果有，就是合作博弈；反之，则是非合作博弈。现在经济学家谈到博弈论，一般指的是非合作博弈，很少指合作博弈。2、静态博弈（static game）与动态博弈（dynamic game）：按参与人行动的先后顺序划分，静态博弈：参与者同时决策，或非同时决策但后决策者不知道先决策者的行动。动态博弈：参与者的行动有先后，后决策者能观察到县决策者的行动，并据此选择行动。3、完全信息博弈（games of complete information）和不完全信息博弈（ games of incomplete information ）：完

4、全信息指的是每一个参与人对所有其他参与人(对手)的特征、战略空间及支付函数有准确的知识；否则，就是不完全信息。第二节完全信息静态博弈一、博弈的标准式（nomal form representation）例：囚徒困境。囚徒面临的问题可用下图所示的双变量矩阵表来描述。-1，-1-9，00，-9-6，-6囚犯B囚犯A沉默招认沉默招认在此博弈中，每一囚徒有两种战略可供选择：招认、沉默)。在一组特定的战略组合被选定后，两人的收益由矩阵中相应单元的数据来表示。博弈的标准表述包括：(1)博弈的参与者，(2)每一参与者可供选择的战略集，(3)针对所有参与者可能选择的战略组合，每一个参与者

5、获得的收益。可以用支付矩阵表述一个博弈。假定有n个参与者参加博弈，序号分别为1，2，n，第i个参与者可以选择的战略集合（i的战略空间）为Si ，每个具体的战略si为Si 的元素。令（ s1，s2，sn)为每个参与人选定一个战略的组成的战略组合， ui表示在该战略组合下参与人i的收益收益函数： ui（ s1，s2，sn ），表述的标准形式为：二、占优战略均衡（Dominant-stragety equilibrium）一般来说，由于每个参与者的效用（支付）是博弈中所有参与人的战略的函数，因此每个参与者的最优战略选择依赖于所有其他参与人的战略选择。但在些特殊的博弈中，一个参与人的最优战

6、略可能并不依赖于其他参与人的战略选择，就是说，不论其他参与人选择什么战略，他的最优战略是唯一的，这样的最优战略被称为“占优战略”（dominant stragety）。三、重复剔除严格劣战略均衡（interated dominance equilibrium）在每个参与人都有占优战略的情况下，占优战略均衡是一个非常合理的预测，但在绝大多数博弈中，不存在占优战略均衡。在囚徒困境中，“招认”是每个囚犯的占优战略。博弈的结果是两人都选择 “招认”，尽管福利不是最大。-1，-1-9，00，-9-6，-6囚犯B囚犯A沉默招认沉默招认占优战略均衡：小猪大猪按等待按等待3，12，47，-10，0考虑

7、下面的“智猪博弈”。两猪共槽吃食，按下在房间另一端的按钮，能出食8单位，按下按钮者将付出2单位的代价。若大猪先到食槽，能吃到7单位的食，小猪只能吃到1单位的食；若小猪先到食槽，能吃到4单位的食，大猪能吃到4单位的食。如果把“理性的参与者不会选择严格劣战略”作为局中人的理性假设，并且局中人的理性是博弈中的共同知识，则可以通过重复剔除严格劣战略来选择均衡。小猪大猪按等待按等待3，12，47，-10，0在此博以中，小猪的占优战略为“等待”，而大猪不存在占优战略。此时，不存在占优战略均衡。严格劣战略：在智猪博弈中，“按”是小猪的严格劣战略，理性的小猪不会选择“按”；而大猪知道小猪

8、是理性的，不会选择“按”。因此，博弈就变成右边的形式。显然，“等待”是大猪的严格劣战略，大猪不会选择“不按”。（按，等待）为均衡结果。小猪大猪等待按等待2，40，0考虑下面的博弈：局中人A的战略空间为（上，下）、局中人B的战略空间为（坐，中，右），收益矩阵如下：1，01，20，10，30，12，0局中人B局中人 A左中上下右“右”是B的相对于“中”的严格劣战略。理性的B不会选择“右”，而理性的A也知道B不会选择“右”，博弈就变为：1，01，20，30，1局中人B局中人 A左中上下此时，“下”是A的相对于“上”的严格劣战略。理性的A不会选择“下”，而理性的B也知道A 不会选

9、择“下”，博弈就变为：1，01，2局中人B 局中人 A左中上此时，“左”是B的相对于“中”的严格劣战略。理性的B不会选择“下”，而理性的 A也知道B不会选择“下”，博弈的结果就是：(上，中）。上面的过程可称为“重复剔除严格劣战略”，得到的唯一均衡为重复剔除严格劣战略均衡。尽管“重复剔除严格劣战略” 的过程建立在理性参与人不会选择严格劣战略这一合情近理的原则之上，它仍有两个缺陷：第一，每一步剔除都需要参与者间相互了解的更进一步假定，如果我们要把这一过程应用到任意多步，就需要假定“参与者是理性的 “共同知识”（common knowledge，是与信息有关的一个重要概念。共同知识

10、指的是“所有参与人知道，所有参与人知道所有参与人知道，所有参与人知道所有参与人知道所有参与人知道”的知识）。 0，44，05，34，00，45，3 3，53，56，6局中人B局中人 A左中上中右下第二，这一方法对博弈结果的预测经常是不精确的。例如，在下面的博弈中，就没有可以剔除的严格劣战略。四、纳什均衡（Nash equilibrium）设想在博弈论预测的博弈结果中，为使该预测是正确的，局中人自愿选择的战略必须是理论给他推导出的战略。这样，每个局中人要选择的战略必须是针对其他参与者选择战略的最优战略。这种理论推测结果可以叫做“战略稳定”或“自动实施”的，因为没有参与人愿意独自离

11、弃他所选定的战略，我们把这一状态称为纳什均衡。0，44，05，34，00，45，33，53，56，6局中人B局中人 A左中上中右下在右边的博弈中，对于A选择“上”时，B的最优战略为“左”；对于A选择“中”时，B的最优战略为“中”；对于A选择“下”时，B的最优战略为“右”；对于B选择“左”时，A的最优战略为“中”；对于B选择“中”时，A的最优战略为“上”；对于B选择“右”时，A的最优战略为“下”；（下，右）满足纳市均衡的条件。-6，-60，-9-9，0-1，-1囚犯B囚犯A沉默招认沉默招认(招认，招认）是重复剔除严格劣战略均衡。(招认，招认）是纳什均衡。纳什均衡和重复剔除严格劣战

12、略均衡的关系：如果用重复剔除严格劣战略把除战略组合外所有的战略组合都剔除掉，则该所存战略组合就是此博弈惟一的纳什均衡。由于重复剔除严格劣战略并不一定会只剩下惟一的战略组合，作为解的概念，纳什均衡比重复剔除严格劣战略更强。下面的例子表明一个博弈可以有多个纳什均衡。1，20，00，02，1 女男歌剧拳击歌剧拳击性别博弈(歌剧，歌剧)和(拳击，拳击)都是纳什均衡。五、几个命题“斗鸡博弈”也有多个纳什均衡。1、古诺的双头垄断模型六、应用举例假定：双头垄断，非勾结，产量竞争；同质产品，生产的边际成本为0；市场需求为线性需求曲线：P = a b Q = a b (q1 + q2 ) ；决策：假

13、定对方不改变产量决策，追求利润最大化。化为标准形式：参与人：厂商1、厂商2收益：企业的收益就是其利润额，这样在一般的两个参与者标准式博弈中，参与者1的收益分别为：每个厂商要选择的战略必须是针对其他参与者选择战略的最优战略，因而两个厂商各自的反应函数就是其最优反应。两个厂商的反应函数：根据纳什均衡的定义，博弈的均衡解（q*1， q*2 ）必须同时满足两个反应函数：2、公地的悲剧有n户村民的村庄，每年在村庄公共牧场上放牧羊只。以gi表示第i户村民放牧的羊数，全村牧羊总数G = g1+ g2+ gn。假定购买和照看每只羊的成本为c ，c不随意户村民拥有的羊的数目而变化。当草地上羊的总数为G

14、时，一户村民养一只羊的价值为v(G)。由于一只羊要生存，至少需要一定数量的青草，草地可以放牧的羊的总数优一个上限Gmax：当G Gmax时， v(G)0，而当G Gmax时， v(G)=0。此外，假定在最初，由于优足够的放牧空间，增加一只羊不会对已经放养的洋产生太大影响，而随着羊的增加，所有羊只的价值将受到影响越来越大，到当G = Gmax时，每只羊的价值为0，即： Gmax时， v(G) 0， v”(G) 0，如下图所示：GmaxGv(G)O这里假定羊是连续可分的，每年初，各户村民决定养殖羊的数目gi。在此博弈中，参与人为n户村民，每户村民的战略就是其决定养殖羊的数目gi，战略

15、空间为0，），而收益为：如果（g*1 ,g*n）为纳什均衡，则对于村民i，当其他村民选择战略（ g*1 , g*i-1 , g*i+1 ,g*n）时，其最优战略应是使其收益最大的战略：第一项为每户村民每头羊的边际收益，第二、三项为对村民而言每增加一头羊的边际成本。从村民的反应函数可看出，尽管每户村民在决定增加饲养量时考虑了对现有羊的价值的负效应，但他考虑的只是对自己羊的影响，而并不是对所有羊的影响。因此，最优点上个人边际成本小于社会边际成本，纳什均衡的总饲养量大于社会最优的饲养量。从整个村庄的最优选择考虑，最优的总饲养数G*优以下最优化问题解出：与纳什均衡结果相比较：，即公共资源被

16、过渡使用了。第三节完全信息动态博弈在静态博弈中，所有参与人同时行动(或行动虽有先后，但没有人在自己行动之前观测到别人的行动。在动态博弈中，参与人的行动有先后顺序，且后行动者在自己行动之前能观测到先行动吉的行动。动态博弈常用扩展式表述。进入不进入ABB进入不进入不进入进入收益：A B-3 ，-31 ，00 ，10 ，0考虑右边以博弈树描述的两阶段博弈。在某产品市场上，厂商A和B对是否进入该市场进行决策。A是先行动者，B在观察了A的行动后，决定自己的行动。如果市场中只有一个厂商，则该厂商得到全部1个单位的收益。不进入市场的厂商收益为零。如果市场中有两个厂商，则各得到-3单位的收益。一、博弈的扩展式（extentive form representation）一个博弈的扩展式表述包括：(1）参与人（players）；（2）行动（actions） (2a)每一参与者的行

展开阅读全文

微观经济学 第十章 博弈论

微观经济学第十章博弈论