微观经济学 第十章 博弈论

上传人:lizhe****0920 文档编号:48600620 上传时间:2018-07-17 格式:PPT 页数:31 大小:294.50KB
返回 下载 相关 举报
微观经济学 第十章 博弈论_第1页
第1页 / 共31页
微观经济学 第十章 博弈论_第2页
第2页 / 共31页
微观经济学 第十章 博弈论_第3页
第3页 / 共31页
微观经济学 第十章 博弈论_第4页
第4页 / 共31页
微观经济学 第十章 博弈论_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《微观经济学 第十章 博弈论》由会员分享,可在线阅读,更多相关《微观经济学 第十章 博弈论(31页珍藏版)》请在金锄头文库上搜索。

1、第十章 博弈论第一节 博弈论基础一、博弈论(Game Theory)博弈论研究决策主体的行为相互发生直接作用时的决策,以及这种决 策的均衡问题。也就是说,一个主体(一个人或一个企业)的选择受到其 他主体选择的影响,并且其选择反过来会影响到其他主体的选择,这类的 的决策问题和均衡问题就是博弈论研究的对象。在这个意义上说,博弈论 也称为“对策论”。博弈论中的个体决策与传统经济学中的行为个体决策不同。二、博弈论的基本概念1、参与者/局中人(players):在博弈中选择行动以最大化自己效用的决 策主体。2、行动(acttions, moves):参与者的决策变量。3、战略(strategies):参

2、与者选择行动的规则。4、信息(information):是参与人在博弈中的知识,特别是有关其他参 与人(对手)的特征和行动的知识。5、支付/收益(payoff):是参与人从博弈中获得的效用水平,是所有参 与人战略或行动的函数,也是是每个参与人真正关心的东西。6、结果(outcomes):是指博弈分析者感兴趣的要素的集合。7、均衡(equilibrium):是所行参与人的最优战略或行动的组合。上述概念中,参与人、行动、结果统称为博弈规则,博弈分析的目的 是使用博弈规则决定均衡。三、博弈的分类1、合作博弈(cooperative game)和非合作博弈(non- cooperative game

3、) :人们的行为相互作用时,当事人能不能达成一个具有约束力的协议,如 果有,就是合作博弈;反之,则是非合作博弈。现在经济学家谈到博弈论,一般指的是非合作博弈,很少指合作博弈。2、静态博弈(static game)与动态博弈(dynamic game):按参与人行动的先后顺序划分,静态博弈:参与者同时决策,或非同时 决策但后决策者不知道先决策者的行动。动态博弈:参与者的行动有先后, 后决策者能观察到县决策者的行动,并据此选择行动。3、完全信息博弈(games of complete information)和不完全信息博弈( games of incomplete information ):完

4、全信息指的是每一个参与人对所有其他参与人(对手)的特征、战略空 间及支付函数有准确的知识;否则,就是不完全信息。第二节 完全信息静态博弈一、博弈的标准式(nomal form representation)例:囚徒困境。 囚徒面临的问题可用下图所示的双变量矩阵表来描 述。-1,-1-9,00,-9-6,-6囚犯B囚犯A沉默招认沉默招认在此博弈中,每一囚徒 有两种战略可供选择:招认 、沉默)。在一组特定的战略组合 被选定后,两人的收益由矩 阵中相应单元的数据来表示 。 博弈的标准表述包括:(1)博弈的参与者,(2)每一参与者可供选择的战 略集,(3)针对所有参与者可能选择的战略组合,每一个参与者

5、获得的 收益。可以用支付矩阵表述一个博弈。假定有n个参与者参加博弈,序号分别为1,2,n,第i个参与者可以 选择的战略集合(i的战略空间)为Si ,每个具体的战略si为Si 的元素。令( s1,s2,sn)为每个参与人选定一个战略的组成的战略组合, ui表示在 该战略组合下参与人i的收益收益函数: ui( s1,s2,sn ),表述的标准 形式为:二、占优战略均衡(Dominant-stragety equilibrium)一般来说,由于每个参与者的效用(支付)是博弈中所有参与人的战 略的函数,因此每个参与者的最优战略选择依赖于所有其他参与人的战略 选择。但在些特殊的博弈中,一个参与人的最优战

6、略可能并不依赖于其 他参与人的战略选择,就是说,不论其他参与人选择什么战略,他的最优 战略是唯一的,这样的最优战略被称为“占优战略”(dominant stragety)。三、重复剔除严格劣战略均衡(interated dominance equilibrium)在每个参与人都有占优战略的情况下,占优战略均衡是一个非常合理 的预测,但在绝大多数博弈中,不存在占优战略均衡。在囚徒困境中,“招认”是每个囚犯 的占优战略。博弈的结果是两人都选择 “招认”,尽管福利不是最大。-1,-1-9,00,-9-6,-6囚犯B囚犯A沉默招认沉默招认占优战略均衡:小猪大猪按等待按等待3,12,47,-10,0考虑

7、下面的“智猪博弈”。两猪共槽吃食 ,按下在房间另一端的按钮,能出食8单位 ,按下按钮者将付出2单位的代价。若大猪 先到食槽,能吃到7单位的食,小猪只能吃 到1单位的食;若小猪先到食槽,能吃到4单 位的食,大猪能吃到4单位的食。如果把“理性的参与者不会选择严格劣战略”作为局中人的理性假设 ,并且局中人的理性是博弈中的共同知识,则可以通过重复剔除严格劣 战略来选择均衡。 小猪大猪按等待按等待3,12,47,-10,0在此博以中,小猪的占优战略为“等待”, 而大猪不存在占优战略。此时,不存在占优战 略均衡。严格劣战略:在智猪博弈中,“按”是小猪的严格劣战略,理 性的小猪不会选择“按”;而大猪知道小猪

8、是理性的 ,不会选择“按”。因此,博弈就变成右边的形式。显然,“等待”是大猪的严格劣战略,大猪不会 选择“不按”。(按,等待)为均衡结果。小猪大猪等待按等待2,40,0考虑下面的博弈:局中人A的战略空间为(上,下)、局中人B的战略 空间为(坐,中,右),收益矩阵如下:1,01,20,10,30,12,0局中人B局 中 人 A左中上下右“右”是B的相对于“中”的严格劣战 略。理性的B不会选择“右”,而理性 的A也知道B不会选择“右”,博弈就 变为:1,01,20,30,1局中人B局 中 人 A左中上下此时,“下”是A的相对于“上”的严格劣战略 。理性的A不会选择“下”,而理性的B也知道A 不会选

9、择“下”,博弈就变为:1,01,2局中人B 局 中 人 A左中上此时,“左”是B的相对于“中”的严格劣 战略。理性的B不会选择“下”,而理性的 A也知道B不会选择“下”,博弈的结果就 是:(上,中)。上面的过程可称为“重复剔除严格劣战略”,得到的唯一均衡为重复剔 除严格劣战略均衡。尽管“重复剔除严格劣战略” 的过程建立在理性参与人不会选择严格 劣战略这一合情近理的原则之上,它仍有两个缺陷:第一,每一步剔除都需要参与者间相互了解的更进一步假定,如果 我们要把这一过程应用到任意多步,就需要假定“参与者是理性的 “共同 知识”(common knowledge,是与信息有关的一个重要概念。共同知识

10、指的是“所有参与人知道,所有参与人知道所有参与人知道,所有参与 人知道所有参与人知道所有参与人知道”的知识)。 0,44,05,34,00,45,3 3,53,56,6局中人B局 中 人 A左中上中右下第二,这一方法对博弈结果的预测 经常是不精确的。例如,在下面的博弈 中,就没有可以剔除的严格劣战略。四、纳什均衡(Nash equilibrium)设想在博弈论预测的博弈结果中,为使该预测是正确的,局中人自愿 选择的战略必须是理论给他推导出的战略。这样,每个局中人要选择的战 略必须是针对其他参与者选择战略的最优战略。这种理论推测结果可以叫 做“战略稳定”或“自动实施”的,因为没有参与人愿意独自离

11、弃他所选定的 战略,我们把这一状态称为纳什均衡。0,44,05,34,00,45,33,53,56,6局中人B局 中 人 A左中上中右下在右边的博弈中,对于A选择“上”时,B的最优战略为“左”; 对于A选择“中”时,B的最优战略为“中”; 对于A选择“下”时,B的最优战略为“右”;对于B选择“左”时,A的最优战略为“中”; 对于B选择“中”时,A的最优战略为“上”; 对于B选择“右”时,A的最优战略为“下”;(下,右)满足纳市均衡的条件。-6,-60,-9-9,0-1,-1囚犯B囚犯A沉默招认沉默招认(招认,招认)是重复剔除严格劣 战略均衡。(招认,招认)是纳什均衡。纳什均衡和重复剔除严格劣战

12、略均衡的关系:如果用重复剔除严格劣战略 把除战略组合 外所有的战略组合都剔除掉,则该所存 战略组合就是此博弈惟一的纳什均衡。由于重复剔除严格劣战略并不一定会只剩下惟一的战略组合,作为解的 概念,纳什均衡比重复剔除严格劣战略更强。下面的例子表明一个博弈可以有多个纳什均衡。1,20,00,02,1 女男歌剧拳击歌剧拳击性别博弈(歌剧,歌剧)和(拳击,拳击)都是纳什均衡。五、几个命题“斗鸡博弈”也有多个纳什均衡。1、 古诺的双头垄断模型六、应用举例假定:双头垄断,非勾结,产量竞争; 同质产品,生产的边际成本为0;市场需求为线性需求曲线:P = a b Q = a b (q1 + q2 ) ;决策:假

13、定对方不改变产量决策,追求利润最大化。化为标准形式:参与人:厂商1、厂商2收益:企业的收益就是其利润额,这样在一般的两个参与者标准式博弈 中,参与者1的收益分别为:每个厂商要选择的战略必须是针对其他参与者选择战略的最优战略, 因而两个厂商各自的反应函数就是其最优反应。两个厂商的反应函数:根据纳什均衡的定义,博弈的均衡解(q*1, q*2 )必须同时满足两个 反应函数:2、 公地的悲剧有n户村民的村庄,每年在村庄公共牧场上放牧羊只。以gi表示第i户村民放 牧的羊数,全村牧羊总数G = g1+ g2+ gn。假定购买和照看每只羊的成本为c ,c不随意户村民拥有的羊的数目而变化。当草地上羊的总数为G

14、时,一户村民 养一只羊的价值为v(G)。由于一只羊要生存,至少需要一定数量的青草,草地 可以放牧的羊的总数优一个上限Gmax:当G Gmax时, v(G)0,而当G Gmax时 , v(G)=0。此外,假定在最初,由于优足够的放牧空间,增加一只羊不会对已 经放养的洋产生太大影响,而随着羊的增加,所有羊只的价值将受到影响越来 越大,到当G = Gmax时,每只羊的价值为0,即: Gmax时, v(G) 0, v”(G) 0,如下图所示:GmaxGv(G)O这里假定羊是连续可分的,每年初,各户 村民决定养殖羊的数目gi。在此博弈中,参与人为n户村民,每户村 民的战略就是其决定养殖羊的数目gi,战略

15、空 间为0,),而收益为:如果(g*1 ,g*n)为纳什均衡,则对于村民i,当其他村民选择战略( g*1 , g*i-1 , g*i+1 ,g*n)时,其最优战略应是使其收益最大的战略:第一项为每户村民每头羊的边际收益,第二、三项为对村民而言 每增加一头羊的边际成本。从村民的反应函数可看出,尽管每户村民在决定增加饲养量时考虑了 对现有羊的价值的负效应,但他考虑的只是对自己羊的影响,而并不是对 所有羊的影响。因此,最优点上个人边际成本小于社会边际成本,纳什均 衡的总饲养量大于社会最优的饲养量。从整个村庄的最优选择考虑,最优的总饲养数G*优以下最优化问题 解出:与纳什均衡结果相比较:,即公共资源被

16、过渡使用了。第三节 完全信息动态博弈在静态博弈中,所有参与人同时行动(或行动虽有先后,但没有人在自 己行动之前观测到别人的行动。在动态博弈中,参与人的行动有先后顺序 ,且后行动者在自己行动之前能观测到先行动吉的行动。动态博弈常用扩 展式表述。进入不进入ABB进入不进入不进入进入收益:A B-3 ,-31 ,00 ,10 ,0考虑右边以博弈树描述的两阶段 博弈。在某产品市场上,厂商A和B对 是否进入该市场进行决策。A是先行动者,B在观察了A的行 动后,决定自己的行动。如果市场中只有一个厂商,则该 厂商得到全部1个单位的收益。不进入 市场的厂商收益为零。如果市场中有 两个厂商,则各得到-3单位的收益。一、博弈的扩展式(extentive form representation)一个博弈的扩展式表述包括:(1)参与人(players);(2)行动(actions) (2a)每一参与者的行

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 企业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号