博弈论练习题 第一组 参考答案

上传人:mg****85 文档编号:44599648 上传时间:2018-06-14 格式:PDF 页数:5 大小:144.74KB
返回 下载 相关 举报
博弈论练习题 第一组 参考答案_第1页
第1页 / 共5页
博弈论练习题 第一组 参考答案_第2页
第2页 / 共5页
博弈论练习题 第一组 参考答案_第3页
第3页 / 共5页
博弈论练习题 第一组 参考答案_第4页
第4页 / 共5页
博弈论练习题 第一组 参考答案_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

《博弈论练习题 第一组 参考答案》由会员分享,可在线阅读,更多相关《博弈论练习题 第一组 参考答案(5页珍藏版)》请在金锄头文库上搜索。

1、1 博弈论练习题第一组 第一章 囚徒困境与经典矩阵博弈 博弈论练习题第一组 第一章 囚徒困境与经典矩阵博弈 习题集(2011年9月30日) 习题集(2011年9月30日) 1.(单项选择)甲乙两人各在纸片上写下“合作”或“斗争”两词,然后双方同 时翻开纸片。如果两人都写“合作”,每人各得100元;若两人都写“斗争”, 两人什么也得不到;若一人写“斗争”,另一人写“合作”,则:“合作” 者得S, “斗争”者得 T。要使“斗争”为占优策略,S和T必须是( )。 AS+T200 BS100 CS100 D以上都不是 解答,答案为C,写出这个博弈的支付矩阵如下: 乙 合作 斗争 甲 由于这个博弈是对称

2、的,因此,只需要解其中一个人的最优反应即可(对于 对称博弈而言,两个人的占优策略及其支付是完全相同的),我们不妨解 乙的反应。要使“斗争”为占优策略,意味着无论甲选择什么行动,对于 乙而言,斗争总是好于合作,于是,若甲选择合作,那么乙选择斗争的收 益是T,选择合作的收益是100,因此T100;若甲选择斗争,乙选择斗争的 收益是0,选择合作的收益是S,要使对于乙而言斗争好于合作,则0S。因 此要选C。 2. 某博弈中甲乙双方各有三个策略,其相应的支付矩阵如下图所示: 问: (1)甲会不会采用策略A,为什么? (2)请剔除上述支付矩阵里的占劣策略。 (3)请找出该博弈的纯策略纳什均衡。 (100,

3、 100)(S, T) (T, S) (0, 0) D F E A C B 乙乙 甲甲 2,5 4,8 3,7 6,4 2,7 4,2 1,2 3,5 3,7 合作 斗争 2 答案:1)甲不会采用策略A,策略A是甲的劣策略,它是劣于C的。 2)对于甲而言,A是一个劣策略。对于乙而言,F是一个劣策略(做到这一步即 可算正确)。 但当剔除了A和F这两个策略后,对乙而言,D又变成了劣策略,可以剔除。 当剔除了A, F, D之后, 对甲而言, B是劣策略, 可以剔除。 因此, 纳什均衡是 (C,E) (做到这一步也是正确的,且可以一并解决问题3) 3)可以用重复剔除劣策略法,如上,纳什均衡为(C,E)

4、。也可以用最优反应 法(用红色数字标出),答案相同。 3.(05年北京大学考研题)求下列博弈的纯策略纳什均衡。这个博弈在经典矩阵 博弈的名称是什么? 参与人 2 参与人 1 答:步骤 1:先找两人的最优反应,用划圈法。(注意:划圈的时候,要记住, 如果找列参与人的最优策略,就要固定行参与人的行动。反之亦然)。 步骤2:两人的最优反应的组合即是纳什均衡。即(U,L)和(D,R)(注意不要 写(6,2),(2,6)(注意不要 写(6,2),(2,6)。 这个博弈在经典矩阵博弈中叫做“协调博弈”。 4.A和B手中各有一个魔瓶,魔瓶中各有1元钱,他们可以把这1元钱从魔瓶取出放 入自己的衣袋,也可以把这

5、1元钱放入对方的衣袋。但是,如果放入自己的衣 袋,这1元钱会变为2元钱,如果放入对方的衣袋,这1元钱会魔术般地变为4 元。 (1)假设A和B互不关心,只关心自己的收益,他们各自的备选行动是“把1元钱 放入自己的口袋”(可用字母D表示),“把1元钱放入对方的口袋”(可用 字母C表示)(注意只有这两个备选行动,没有其他可能的行动),写出该博 弈的货币收益矩阵,并解出它的占优策略均衡。 (2)假设A是段誉王子,B是王语嫣姑娘,段誉非常喜欢王语嫣,在计算自己的 支付时,段誉会把王语嫣的收入乘以r加在自己的收入上,而王语嫣则并不关 心段誉,她只计算自己的货币收入,例如,如果段誉有x元钱,王语嫣有y元 钱

6、,则段誉的心理支付是x+ry,而王语嫣的心理支付为y。如果该博弈最后的 均衡结果是段誉总是往王语嫣的衣袋里放1元钱, 而王语嫣也往自己的衣袋里 放了1元钱,问r的取值范围是多少? (3)假设A是贾宝玉,B是林黛玉,两人互相关爱对方,因此,在计算自己的心 理支付时,两人互相把对方的收入乘以r加在自己的收入上,例如,如果宝玉 有x元钱, 黛玉有y元钱, 则宝玉的心理支付是x+ry, 而黛玉的心理支付为y+rx。 如果该博弈最后的均衡结果是双方都总是往对方的衣袋里放1元钱,问r的取值范围是多少?假设1 3r1 2,那么纯策略纳什均衡解是什么? L R U (2, 6) (5, 5) D (0, 0)

7、 (6, 2) 3 解答:(1)这个博弈的货币收益矩阵如下: B C D A 这是一个囚徒困境博弈,该博弈的占优策略均衡是(D,D)。 (2)段誉和王语嫣的心理支付矩阵如下: 王语嫣 C D 段誉 “该博弈最后的均衡结果是段誉往王语嫣的衣袋里放了1元钱,而王语嫣也往自 己的衣袋里放了1元钱”,亦即根据原题目,(C,D)是一个纳什均衡。 余江锋的解法:对于王语嫣而言,D是一个占优策略,因此不需考虑王语嫣选择C 策略的情况。当王语嫣选择D的时候,段誉选择C好于D,就可以使(C,D)成为 纳什均衡。 故令6r2+2r,解得r1/2。 (3)宝玉和段誉的心理支付矩阵如下: 黛玉 C D 宝玉 由原题目

8、,(C,C)是一个纳什均衡,由于它是对称的,因此只需要解宝玉的选 择即可确定r的取值范围,对宝玉而言,4+4r6,6r2+2r,解得r1/2。 若1 3r1 2,则64+4r,2+2r6r,故而D是宝玉和黛玉的占优策略,均衡在(D,D)点上达到。 (4, 4) (0, 6) (6, 0) (2, 2) (4+4r, 4) (6r, 6) (6, 0) (2+2r, 2) (4+4r, 4+4r) (6r, 6) (6, 6r) (2+2r, 2+2r) C D C D C D 4 5.考虑下面的囚徒困境博弈: B A 此时囚徒困境博弈的均衡是(不合作,不合作)。 (1) 假设你想用对不合作者罚

9、款的方法促进A和B的合作。 为了使 (合作, 合作) 成为一个占优策略纳什均衡,你需要对不合作者罚款多少元? (假设你可以观察到谁不合作,而且对不合作的人征缴罚款x元,这个题是让你 求x的取值范围)。 (2)(困难)假设在这个博弈中,你看不到具体的支付,也不知道G和H代表的 是“合作”还是“不合作”,你只知道这是一个囚徒困境博弈,假设你想用 罚款的方式来促进A和B的合作。 此时你应当如何设计罚款方案, 而使 “合作, 合作”成为一个纳什均衡? B A 解答:(1)如果对不合作的人罚款x元,则收益矩阵改为 B A 现在(合作,合作)是纳什均衡,亦即23-x,01-x,联合两式子,解得x1。也 就

10、是至少要对不合作的人罚款1元。 (2) 这个题目的困难之处在于不知道G和B代表什么, 也不知道具体的支付情况, 因此,你是不能对G或H的特定行为去罚款的,即使你认为初次达到的均衡是 一个囚徒困境中最坏的结果,你也不能确定罚款的数额。 但是,可以这样设想,我们不需要把囚徒困境转变成一个囚徒顺境,只需要把它 转变成一个协调博弈。 根据这一思路,只需设计这样一个罚款制度:如果观察到(G,H)或(H,G), 不妨设支付较高的一方的支付为*,则应对其处以(*-&)数额以上的罚款, 这样,就把囚徒困境博弈变成了一个协调博弈,此时,“合作,合作”是纳 什均衡(但不是占优策略纳什均衡)。 合作 不合作 合作

11、2,2 0,3 不合作 3,0 1,1 G H G %,% &,* H *,& #,# 合作 不合作 合作 2,2 0,3-x 不合作 3-x,0 1-x,1-x 5 6.一个支付组合是帕累托有效率的, 当且仅当没有任何其他的支付组合可以同时 改善所有人的处境。假定A和B两人组成一个社会,可能的支付组合如下: 组合1(200,200),组合2(0,300),组合3(300,0),组合4(100,100), (这里(200,200)表示A的支付为200,B的支付为200)。 (1)假定只有如上可能的四个支付组合。找出下列支付组合中帕累托有效率的 支付。 (2)在一个囚徒困境博弈里面(例如可考虑习

12、题5中的囚徒困境博弈),找出帕 累托有效的支付。帕累托有效的支付是否是纳什均衡? 答案:1)在四种状态中,帕累托有效率的支付是组合1-3,组合4是帕累托无效 率的(组合1可以同时改善两人的支付)。 2)在囚徒困境博弈中,帕累托有效的支付不是纳什均衡。 7.假定A和B一起参加一场奇特的拍卖,拍品是100元人民币,拍卖规则是价高者 得到100元,并付给拍卖商自己的出价,出价低者完全丧失自己的出价(例如, 若A出价50元,B出价40元,则A的净收入为50元(即100元减去50元出价),而B 净损失40元) , 如果出价相同, 则每人得50元, 但需要支付给拍卖行自己的出价。 现在, 假定在这场拍卖中

13、A和B只有两个策略, C出价90元, D出价120元, 假定两人是同时出价(各写一个纸条交给拍卖商,由拍卖商根据A和B出价的多少 和以上的博弈规则决定100元的分配)。 (1)写出此时两人的收益矩阵,并计算出纳什均衡,写出纳什均衡下的双方净 收入。 (2)这个博弈可以对应于真实世界中的哪些情况? (1)这个博弈的收益矩阵如下: B C D A 用最优反应法可知,纳什均衡是(D,D),双方的净收入均为-70。 (2)这个博弈其实不是真正的拍卖(虽然也有这样的拍卖,但不典型),但它 很好地刻画了现实生活中的过度、恶性竞争。现实中人们在不断地竞争,但并不 是所有竞争都是过度竞争,过度竞争发生的条件,就是“如果一方输了,投入会 完全沉没掉”, “赢家通吃”,例如公司研发产品,价格战,考研,军备竞赛 在“不能输”的刺激下,各方都加紧投入,结果是两败俱伤,所谓“太宗皇帝真 长策,赚得英雄尽白头”。 (-40, -40)(-90, -20) (-20, -90)(-70, -70) C D

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号