北大博弈论习题1

上传人:飞*** 文档编号:53306975 上传时间:2018-08-29 格式:PDF 页数:31 大小:209.05KB
返回 下载 相关 举报
北大博弈论习题1_第1页
第1页 / 共31页
北大博弈论习题1_第2页
第2页 / 共31页
北大博弈论习题1_第3页
第3页 / 共31页
北大博弈论习题1_第4页
第4页 / 共31页
北大博弈论习题1_第5页
第5页 / 共31页
点击查看更多>>
资源描述

《北大博弈论习题1》由会员分享,可在线阅读,更多相关《北大博弈论习题1(31页珍藏版)》请在金锄头文库上搜索。

1、1 博 弈 论 习 题一、试给出下述战略式表述博弈的纳什均衡B A L R U 1,3 2,5 D 4,1 6,2 解:由划线解得知有一个纯战略均衡(RD ,)再看看它是否有混合战略均衡设B以)1 ,(玩混合战略,则有均衡条件:2)1(21)(UVA26)1(64)( DVA262得14,这是不可能的,故无混合战略均衡,只有这一个纯战略均衡。二、试将题一中的支付作一修改使其有混合战略均衡解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。B A L R U 5,6 2,5 D 4,1 6,2 2 将博弈改成上述模型,则)1(64)1(252632得 54同样,设A的混合战

2、略为)1 ,(,则)1(25)1(16325121于是混合战略均衡为 51 , 54 , 21 , 21。三、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡1 2 1 2 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解:3 1 LR2 ab1 1 2 LRLRcd(5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在 1 的第二个信息集上, 1 认为 2 选a的概率为P,则 1 选L的支付PPP32)1(251 选R的支付PPPP3233)1(36故 1 必选R。给定 1 在第二个决策结上选R,2 在左边决策结上会选a,故子博弈精炼均

3、衡为),( ,daRL四、两个厂商生产相同产品在市场上进行竞争性销售。第1 个厂商的成本函数为11qc, 其中1q为厂商 1 的产量。 第 2 个厂商的成本函数为22cqc,其中2q为厂商 2 的产量,c为其常数边际成本。 两个厂商的固定成本都为零。厂商 2 的边际成本c是厂商 2 的“私人信息”,厂商 1 认为c在23, 21上呈均匀分布。 设市场需求函数为214qqP,其中P为价格, 两个厂商都以其产量为纯战略,问纯战略贝叶斯均衡为何?解:给定2q,厂商 1 的问题是12111)14()1(max1qqqqP q因)(22cqq。厂商 1 不知道c,故目标函数为4 2/3212112/31

4、2121 121 1)(3max)1)(4(maxdccqqqqdcqcqqqq一阶条件:0)(232/32121dccqq得2/32121)( 2123dccqq(1)厂商 2 的问题是:2221222122)4()4()(max2qqqqcqcqqqcP q一阶条件:02)4(21qqc得24)(12qccq(2)代入式( 1) :4321238144234124212324212312212/32/312/311212121qqcdcqdcqcq得11q代入式( 2) :23 )(2c cq若1c,则121qq1215 若 信 息 是 完 全 的 且1c, 则 古 诺 博 弈 均 衡 为

5、1 5321qq,1 252721。这说明信息不完全带来的高效率。五、试给出下述信号博弈的纯战略均衡中的混同均衡和分离均衡(8,1) (1,2) 1a发送者1a2m1t1m2a5.02a(2,7) (10,8) 接收者自然N接收者 (6,5) ( 4,1)1a5.01a2m发送者1m2a2t2a(7,3) (3,7) 解:有四种可能:混同均衡11mt,12mt21mt,22mt分离均衡11mt,22mt21mt,12mt设)(imu为接收者看见im时认为发送者是1t的后验概率。看11mt,12mt则5.0)(1mu,非均衡路径上1 ,0)(2mu当接收者看见1m,选1a的支付为5.115.02

6、5.0选2a的支付为5.15.775.085.0故选2a。6 当接收者看见2m,选1a的支付为)(455)(1(1)(222mumumu选2a的支付为)(433)(1(7)(222mumumu当1t选1m,接收者会选2a,1t得支付 10,要求1t不选2m,对)(2mu无要求,因1t总会选1m。当2t选1m,接收者会选2a,2t得支付 3,要求2t不选2m是不可能的, 因2t选2m是占优于选1m的,故此混同均衡11mt,12mt不存在。再看混同均衡21mt,22mt此时1 ,0)(1mu为非均衡路径上的后验概率,5.0)(2mu当接收者看见2m,选1a的支付为355.015.0选2a的支付为3

7、535.075.0故接收者必选2a。当接收者看见1m时,选1a的支付为)(11)(1(2)(111mumumu选2a的支付为)(1)(77)(1(8)(1111mumumumu故必选2a。这样,无论发送者发出1m或2m信号,接收者总选2a,给定接收者总是选2a。1t会选1m,2t会选2m。故21mt,22mt不是混同均衡。看分离均衡11mt,22mt1)(1mu,0)(2mu7 接收者看见1m时,必选2a接收者看见2m时,必选1a此时,1t选1m,2t选2m故11mt,22mt是一个分离均衡。最后看分离均衡21mt,12mt0)(1mu,1)(2mu接收者看见1m时,必选2a接收者看见2m时,

8、必选2a给定接收者总选2a11mt,22mt故21mt,12mt不是分离均衡。故只有一个纯战略子博弈精炼分离均衡11mt22mtJxbkaneking求助1.在下列监工与工人之间的博弈中,试用划线法分析该博弈有无纯策略纳什均衡;如果没有,那么写出混合策略纳什均衡的结果。工人监工偷懒不偷懒监督1,-1 -1,2 不监督8 -2,3 2,2 2.求解下列博弈的纳什均衡,最好阐述一下求解方法和过程。博弈方 2 博弈方 1 likui106 解答第一题没有纯策略均衡, 只有混合策略均衡 ( (0.25, 0.75) , (0.5, 0.5) )第二题可以根据画线法求得有唯一纯策略均衡(上,左)兰烬落,

9、屏上暗红蕉。闲梦江南梅熟日,夜船吹笛雨萧萧,人语驿边桥。楼上寝,残月下帘旌。 梦见秣陵惆怅事, 桃花柳絮满江城, 双髻坐吹笙。在电影 E.T 中有一个用 Hershey公司的 Reese s Pieces牌巧克力米引诱小外星人出树林的镜头。 由于这个镜头的公众效应, 使得 R eese s Pieces牌巧克力的销量大增, Hershey公司终于赶上了其对手Mars Universal Studio的原计划是在该电影中用Mars 的 M公司每星期可以生产 50 台彩色电视机或100 台黑白电视机。市场对彩电和黑白电视的需求量分别是200 台/星期和 100 台/星期,售价分别为每台2000 元

10、和每台1000元。公司的生产成本为:彩电每台 1500元,黑白电视机每台600元。公司的生产成本为 :彩电每台 1600元,黑白电视机 850 元。如果生产大于21 需求, 两家公司将按照各自的产量在总产量中占有的比例确定售出量(例如假定生产 200 台彩电,而生产50 台,需求量为 200 台,则和的售出量分别为 200/250200=160台和 200/25050=40台)。电视机售不出去,公司不仅得不到利润,相反却仍要支出生产成本,现在我们将这个问题构成一个 22 非零和对策,并求其解。公司有两个策略 : 1:生产 200台彩电2:生产 100台彩电, 100 台黑白电视机公司有两个策略

11、 : 1:生产 50 台彩电2:生产 100台黑白电视机该问题的赢得矩阵为 :(20000,0) (100000,15000)(90000,100000) (40000,-35000)这显然是一个 2*2 非零和对策,如果公司和公司不合作,公司的最大最小值为 V1=63077(元),公司的最大最小值为V2=4286(元)。请问这个赢得矩阵是怎么出来的?为什么啊?lanh_113求助: 考虑下面的贝兰特德双垄断模型在对称信息下的情况,两企业的产品存在差异。对企业i 的需求为 qi (pi ,pj )=a- pi bipj ,两企业的成本都为 0。企业 i 的需求对企业 j 的价格的敏感程度有可能

12、较高,也可能较低,也就是说, bi 可能等于 bH ,也可能等于 bL ,这里 bH bL 0 。对每一个企业, bH = bi 的概率为 ,bi= bL 的概率为 1-,并与 bj 的值无关。每一企业知道自己的bi ,但不知道对方的,所有这些都是共同知识。此博弈中的行动空间,类型空间,推断以及效用函数各是什么?双方的战略空间各是什么?此博弈对称的纯战略贝叶斯纳什均衡应满足哪些条件?求出这样的均衡解。22 huang000lei 求助:两个人A,B 凑钱买东西,同时分别出自己的钱CA,CB,可买的东西有两样, S,T, S比 T 贵。如果 CA+CBS,就买 S;如果SCA+CBT,就买 T。

13、否则什么也不买。其中B 希望买 S, T 对他没有价值;A 则买 T 买 B 无所谓,获得的价值一样。 这种局势是否构成一个博弈?(条件够吗?)有解吗?allan9182736求助:关于植草益产业组织学的一个问题,请那位高手指导一下:小弟学习第七章短期利润最大化,q= p【1-1/(1+k) s】-v,按推算则 p=v/【1-(1+k) s/】 为何书上却写为p=v/【1-1/(1+k) s/】 ,怎么也搞不明白?Colinzc 求助分钱与海盗分珠宝的差别:关于两个人分100 元钱和五个海盗分珠宝的博弈,看上去性质似乎差不多,结果上也是先行者有优势,但是为什么结果上感觉前者没有后者的博弈那么均

14、衡呢?我觉得是否是因为两个人分 100 元钱中,最大的损失也就是100 元,但在分珠宝中,损失是生命,所以参与人在博弈过程中更为理性和不那么计较,所以哪怕只得到1个珠宝也愿意。忧伤河的水:新 100 囚犯题100个死囚,关在 100个单人牢房,牢房排成一个圆圈。国王的特赦令是:每个囚犯早上必须在后窗挂起红旗或者黄旗。如果有连续100天,第k 天只有第 k 间牢房挂起红旗,其他全是黄旗,就释放所有死囚。如果三年后还没完成,所有人全部拉出去砍了。囚犯可以先开一个会,会后所有人会被随机分到一间牢房, 而且不知道自己的房间号。 为了阻止囚犯们得到特赦,囚犯们并不是同一天被关进自己的牢房,而是先被麻醉,

15、又关进不见天日的小黑屋一段日子, 所以每个囚犯都不知道自己到底是哪一天被送进自己的单人牢房。每个囚犯进自己牢房的第一天会得到一个数,范围在 0-100 之间(可23 能有人得到相同的数) 。囚犯相互之间唯一的交流方法是每天晚饭时每人可以报一个数, 这个数与他上一次得到的数差距不能超过10-(数是循环的,0 和 100的差距是 1) ,由看守在熄灯时给他的左边邻居,如果某间牢房里暂时没有犯人,看守会编一个数传下去,由于囚犯开会是被监视的,所以看守可以利用这个机会进行破坏。请问囚犯们怎么办?注:三年的期限是从所有囚犯都进入自己的牢房开始算。5 名海盗,夺得 100 颗宝石分赃规则:海盗 1 提出分

16、配方案,若 5 名海盗 (包括 1 自己)半数以上 (不含半数 )票同意,则实施 1 的方案,否则杀死1,由 2 提方案2 的方案由现有 4 名海盗投票,半数以上同意则实施2 的方案,否则杀死 2,然后由 3 提方案;如此反复,依此类推。问:海盗 1 如何提出自己的分配方案可以获得最大的好处(假设每个海盗都绝顶聪明且理性)以下是个人见解:这个例子为迪克西特所说的相继出招的博弈,应用其法则1:向前展望,倒后推理。假设剩下最后海盗4 和海盗 5 两个人时:海盗 4 无论怎么分(除非全部 100 个金币都给海盗 5)海盗 5 都会不同意,从而海盗4 会因为不过半数而被杀,这样海盗5 可以独霸 100 个金币。这里说了海盗都是绝顶聪明且理性,所以对海盗 3 的方案海盗 4 否决会把自己推向很不利的境况,而海盗5 则会竭力否决,因为只要海盗3 的方案被否决了,海盗5 接下来可以拿到 100 个金币。所以海盗3 知道了海盗 4和海盗 5 的策略,因为那是海盗4 和海盗 5 剔除劣势策略后的唯一策略,所以海盗 3

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 其它文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号