博弈论复习题及答案

资源描述

《博弈论复习题及答案》由会员分享，可在线阅读，更多相关《博弈论复习题及答案（29页珍藏版）》请在金锄头文库上搜索。

1、博弈论判断题（每小题1分，共15分）囚徒困境说明个人的理性选择不一定是集体的理性选择。（）子博弈精炼纳什均衡不是一个纳什均衡。（）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（）纳什均衡一定是上策均衡。（）上策均衡一定是纳什均衡。（）在一个博弈中只可能存在一个纳什均衡。（）在一个博弈中博弈方可以有很多个。（）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（）在博弈中纳什均衡是博弈双方能获得的最好结果。（）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（）上策均衡是帕累托最优的均衡。（）

2、因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博

3、弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（）如果阶段博弈G=A1, A2,An; u1, u2,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的tT，在t阶段的结局并不是G的Nash均衡。（）（或：如果阶段博弈G=A1, A2,An; u1, u2,un)具有多重Nash均衡，那么该重复博弈G(T)的子

4、博弈完美均衡结局，对于任意的tT，在t阶段的结局一定是G的Nash均衡。）零和博弈的无限次重复博弈中，所有阶段都不可能发生合作，局中人会一直重复原博弈的混合战略纳什均衡。（）（或：零和博弈的无限次重复博弈中，可能发生合作，局中人不一定会一直重复原博弈的混合战略纳什均衡。（）原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合，符合各局中人最大利益：采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果，符合所有局中人的利益，因此，不管是重复有限次还是无限次，不会和一次性博弈有区别。（）原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合，符合各局中人最大利益，但惟一的纳什均衡不是效率

5、最高的战略组合，存在潜在合作利益的囚徒困境博弈。（）（或：原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳战略组合，符合各局中人最大利益，不存在潜在合作利益的囚徒困境博弈。（）根据参与人行动的先后顺序，博弈可以划分为静态博弈(static game)和动态博弈(dynamic game)。如果阶段博弈G有唯一的Nash均衡，那么对任意有限次T，重复博弈G(T)有唯一的子博弈完美结局：在每一阶段取G的Nash均衡策略。（）四、名词解释（每小题3分，共15分）参与人(player)指的是博弈中选择行动以最大化自己效用(收益)的决策主体，参与人有时也称局中人，可以是个人，也可以是企业、国家等团体；

6、策略(strategy)是参与人选择行动的规则，如“以牙还牙”是一种策略；信息(information)是指参与人在博弈中的知识，尤其是有关其他参与人的特征和行动的知识；支付(payoff)函数是参与人从博弈中获得的效用水平，它是所有参与人策略或行动的函数，是每个参与人很关心的东西；结果(outcome)是指博弈分析者感兴趣的要素的集合，常用支付矩阵或收益矩阵来表示；均衡(equilibrium)是所有参与人的最优策略或行动的组合。静态博弈指参与人同时选择行动或虽非同时但后行动者并不知道先行动者采取什么样的行动；动态博弈指参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。博弈就

7、是一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。零和博弈：也称“严格竞争博弈”。博弈方之间利益始终对立，偏好通常不同变和博弈：零和博弈和常和博弈以外的所有博弈。合作利益存在，博弈效率问题的重要性。完全信息静态博弈即各博弈方同时决策，且所有博弈方对各方得益都了解的博弈。上策：不管其它博弈方选择什么策略，一博弈方的某个策略给他带来的得益始终高于其它的策略，至少不低于其他策略的策略上策均衡：一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策，必然是该博弈比较稳定的结果严格下策：不管

8、其它博弈方的策略如何变化，给一个博弈方带来的收益总是比另一种策略给他带来的收益小的策略合作博弈非合作博弈零和博弈常和博弈变和博弈上策均衡纳什均衡纳什均衡：在博弈中，如果由各个博弈方的各一个策略组成的某个策略组合中，任一博弈方的策略，都是对其余博弈方策略的组合的最佳对策，也即对任意都成立，则称为的一个纳什均衡（或纳什均衡是指这样一种策略组合，这种策略组合由所有参与人的最优策略组成，即给定别人策略的情况下，没有任何单个参与人有积极性选择其他策略，从而没有任何参与人有积极性打破这种均衡。）完全信息博弈混合策略：在博弈中，博弈方 i 的策略空间为，则博弈方以概率分布随机在其 k

9、个可选策略中选择的“策略”，称为一个“混合策略”，其中对都成立，且帕累托上策均衡风险上策均衡聚点均衡重复博弈指同样结构的博弈重复多次，其中的每次博弈称为“阶段博弈”。阶段博弈重复博弈中的每次博弈称为“阶段博弈”。贴现因子下一期的一单位支付在这一期的价值。触发战略（Trigger Strategy）首先试探合作，一旦发现对方不合作，则也用不合作相报复的战略。子博弈精炼纳什均衡（夫妻博弈）一对新婚夫妻为晚上看什么电视节目争执不下，丈夫（记为I方）要看足球比赛节目，而妻子（记为方）要看戏曲节目.他们新婚燕尔，相亲相爱，所以若这方面的行动不一致，则是很伤感情的.因此，这对夫妻间的争执是一次非

10、零和对策。二、计算与分析题（每小题15分，共45分）1、无限次重复博弈与有限重复博弈的区别：a. 无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中，存在最后一次重复正是破坏重复博弈中局中人利益和行为的相互制约关系，使重复博弈无法实现更高效率均衡的关键问题。b. 无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题，必须考虑后一期得益的贴现系数，对局中人和博弈均衡的分析必须以平均得益或总得益的现值为根据。c. 无限次重复博弈与有限次重复博弈的共同点：试图“合作”和惩罚“不合作”是实现理想均衡的关键，是构造高效率均衡战略的核心构件。2、可口可乐与百事可乐（参与者）的价格决策：双方都可以

11、保持价格不变或者提高价格（策略）；博弈的目标和得失情况体现为利润的多少（收益）；利润的大小取决于双方的策略组合（收益函数）；博弈有四种策略组合，其结局是：（1）如果双方都不涨价，各得利润10单位；（2）如果可口可乐不涨价，百事可乐涨价，可口可乐利润100，百事可乐利润-30；（3）如果可口可乐涨价，百事可乐不涨价，可口可乐利润-20，百事可乐利润30；（4）如果双方都涨价，可口可乐利润140，百事可乐利润35；求纳什均衡。博弈的稳定状态有两个：都不涨价或者都涨价（均衡），均衡称为博弈的解。3、猪圈里有一头大猪和一头小猪，猪圈的一头有一个饲料槽，另一头装有控制饲料供应的按钮。按一下按钮就会有

12、10个单位饲料进槽，但谁按谁就要付出2个单位的成本。谁去按按纽则谁后到；都去按则同时到。若大猪先到，大猪吃到9个单位，小猪吃到一个单位；若同时到，大猪吃7个单位，小猪吃3个单位；若小猪先到，大猪吃六个单位，小猪吃4个单位。各种情况组合扣除成本后的支付矩阵可如下表示（每格第一个数字是大猪的得益，第二个数字是小猪的得益）：小猪按等待大猪按 5，14，4等待 9，-1 0，0 求纳什均衡。在这个例子中，我们可以发现，大猪选择按，小猪最好选择等待，大猪选择不按，小猪还是最好选择等待。即不管大猪选择按还是不按，小猪的最佳策略都是等待。也就是说，无论如何，小猪都只会选择等待。这样的情况下，大猪最好选择是

13、按，因为不按的话都饿肚子，按的话还可以有4个单位的收益。所以纳什均衡是（大猪按，小猪等待）。4、根据两人博弈的支付矩阵回答问题： abA2,30,0B0,04,2(1) 写出两人各自的全部策略，并用等价的博弈树来重新表示这个博弈（6分）(2) 找出该博弈的全部纯策略纳什均衡，并判断均衡的结果是否是Pareto有效。(3) 求出该博弈的混合策略纳什均衡。（7分）(1)策略甲：乙：博弈树（草图如下：(2)Pure NE (A, a); (B, b)都是Pareto有效，仅(B, b)是有效。(3)Mixed NE (2/5, 3/5); (2/3, 1/3)5、用反应函数法求出下列博弈的所有纯战略

14、纳什均衡。参与人2abcdA2,33,23,40,3参与人1B4,45,20,11,2C3,14,11,410,2D3,14,1-1,210,1解答：纯策略纳什均衡为（B，a）与（A，c）分析过程：设两个参与人的行动分别为，player1的反应函数player2的反应函数交点为（B，a）与（A，c），因此纯策略纳什均衡为（B，a）与（A，c）。6、（entry deterrence市场威慑）考虑下面一个动态博弈：首先，在一个市场上潜在的进入者选择是否进入，然后市场上的已有企业（在位者）选择是否与新企业展开竞争。在位者可能有两种类型，温柔型（左图）和残酷型（右图），回答下面问题。.进入者在位者进入不进入默许斗争（20，30）（-10，0）（0，100）进入者在位者进入不进入默许斗争（-10，25）（0，100）（10，20）左图：温柔型

展开阅读全文