博弈复习试题与参考题答案

资源描述

《博弈复习试题与参考题答案》由会员分享，可在线阅读，更多相关《博弈复习试题与参考题答案（28页珍藏版）》请在金锄头文库上搜索。

1、可编辑版3000100100第一章复习题2, 4, 5, 6, 7第一章参考答案2、设定一个博弈必须确定的方面包括：（1）博弈方，即博弈中进行决策并承担结果的参与者；（2）策略（空间），即博弈方选择的内容，可以是方向、取舍选择，也可以是连续的数量水平等；（3）得益或得益函数，即博弈方行为、策略选择的相应后果、结果，必须是数量或者能够折算成数量；（4）博弈次序，即博弈方行为、选择的先后次序或者重复次数等；（5）信息结构，即博弈方相互对其他博弈方行为或最终利益的了解程度；（6）行为逻辑和理性程度，即博弈方是依据个体理性还是集体理性行为，以及理性的程度等。如果设定博弈模型时不专门设定后两

2、个方面，就是隐含假定是完全、完美信息和完全理性的非合作博弈。4、“囚徒的困境”的内在根源是在个体之间存在行为和利益相互制约的博弈结构中，以个体理性和个体选择为基础的分散决策方式，无法有效地协调各方面的利益，并实现整个、个体利益共同的最优。简单地说，“囚徒的困境”问题都是个体理性与集体理性的矛盾引起的。现实中“囚徒的困境”类型的问题是很多的。例如厂商之间价格战、恶性的广告竞争，初中、中等教育中的应试教育等，其实都是“囚徒的困境”博弈的表现形式。5、首先可根据博弈方的行为逻辑，是否允许存在有约束力协议，分为非合作博弈和合作博弈两大类。其次可以根据博弈方的理性层次，分为完全理性博弈和有限

3、理性博弈两大类，有限理性博弈就是进化博弈。第三是可以根据博弈过程分为静态博弈、动态博弈和重复博弈三大类。第四是根据博弈问题的信息结构，根据博弈方是否都有关于得益和博弈过程的充分信息，分为完全信息静态博弈、不完全信息静态博弈、完全且完美信息动态博弈、完全但不完美信息动态博弈和不完全信息动态博弈几类。第五是根据得益的特征分为零和博弈、常和博弈和变和博弈。第六是根据博弈中博弈方的数量，可将博弈分为单人博弈、两人博弈和多人博弈第七是根据博弈方策略的数量，分为有限博弈和无限博弈两类。9、（ a）根据问题的假设，该博弈的得益矩阵和扩展形表示分别如下: 自然赚（35%）亏（65%）开我(300)(

4、100)(0) (100)不开(b) 如果我是风险中性的，那么根据开的期望收益与不开收益的比较：0.35X 300+0.65X 0=105 100肯定会选择开。(c) 如果成功的概率降低到0.3,那么因为这时候开的期望收益与不开的收益比较: 0.30X 300+0.70X 0=90v 100因此会选择不开，策略肯定会变化。(d) 如果我是风险规避的，开的期望收益为：0.9X( 0.35X 300+0.65X 0) =0.9X 105=94.5v 100因此也会选择不开。(e) 如果我是风险偏好的，那么因为开的期望收益为：1.2X( 0.35X 300+0.65X 0) =1.2X 105=12

5、6 100因此这时候肯定会选择开。10、首先需要注意的是，在该博弈方的得益单位不同，逃犯得到的是增加或者减少的刑期(年)，而看守得到的则是奖金(元)，因此除非先利用效用概念折算成相同的单位，否则两博弈方的得益相互之间不能比较和加减。直接采用单位不同的得益，该博弈的得益矩阵如下：逃路线一犯路线二-10，100010，010，0-10，1000看守路线一路线二该博弈的扩展形表示如下:根据上述得益矩阵和扩展形不难清楚，该博弈中两博弈方的利益是对立的。虽然由于两博弈方得益的单位不同，相互之间得益无法相加，因此无法判断是否为零和博弈，但两博弈方关系的性质与猜硬币等博弈相同，也是对立的。因此，该

6、博弈同样没有两博弈方都愿意接受的具有稳定性的策略组合，两博弈方最合理的策略都是以相同的概率随机的选择路线。补充习题：1. 判断下列叙述是否正确，并作简单分析。a) 囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。b）合作博弈就是博弈方采取互相合作态度的博弈。参考答案：a）错误。结论恰恰相反，也就是囚徒的困境博弈中两囚徒之所以处于困境，根源正是因为两囚徒很在乎坐牢的绝对时间长短。此外，我们已开始就假设两囚徒都是理性经济人，而理性经济人都是以自身的（绝对）利益，而不是相对利益为决策目标。b）不正确

7、。合作博弈在博弈论中专门指博弈方之间可以达成和运用有约束力协议限制行为选择的博弈问题，与博弈方的态度是否合作无关。2. 博弈与游戏有什么关系？参考答案：现代博弈论和经济学中的博弈通常指人们在经济、政治、军事等活动中的策略选择，特别是在有各种交互作用、策略互动条件下的策略选择和决策较量。游戏则是指日常生活中的下棋打牌、赌胜博彩，以及田径、球类等各种体育比赛。因此博弈和游戏之间当然是有明显区别的。但博弈和游戏之间其实也有重要的联系，因为博弈与许多游戏之间在本质特征方面有相同的特征：（1）都有一定的规则；（2）都有能用正或负的数值表示，或能按照一定的规则折算成数值的结果；（3）策略至关重

8、要；（4）策略和利益又相互依存性。正是因为存在这些共同的本质特征，因此从研究游戏规律得出的结论可用来指导经济政治等活动中的决策问题，或者把这些决策问题当作游戏问题研究。因此博弈在一定程度上可以理解成就是游戏。其实“博弈”的英文名称“Game”的基本意义就是游戏。3. 一个工人给一个老板干活，工资标准是100元。工人可以选择是否偷懒，老板则选择是否克扣工资。假设工人不偷懒有相当于 50元的负效用，老板想克扣工资则总有借口扣掉60元工资，工人不偷懒老板有150元产出，而工人偷懒是老板只有80元产出, 但老板在支付工资之前无法知道实际产出，这些情况使双方都知道的。请问a）如果老板完全能够看

9、出工人是否偷懒，博弈属于哪种类型？用得益矩阵或扩展形表示该博弈并作简单分析。b）如果老板无法看出工人是否偷懒，博弈属于哪种类型？用得益矩阵或扩展形表示并简单分析。参考答案：a）由于老板在决定是否克扣工资欠可以完全清楚工人是否偷懒，因此这是一个动态博弈，而且是一个完全信息的动态博弈。此外，由于双方都有关于得益的充分信息，因此只是一个完全且完美信息的动态博弈。该博弈用扩展形表示如下：根据上述得益情况可以看出，在该博弈中偷懒对工人总是有利的，克扣对老板也总是有利的，因此在双方都只考虑自己的利益最大化的情况下，该博弈的通常结果应该是工人偷懒和老板克扣。（100，-20）（-10，110）（

10、40， 40）（50，50）b）由于老板在决定是否克扣工资欠无法清楚工人是否偷懒，因此该博弈可以看作静态博弈。由于双方仍然都有关于得益的充分信息，因此是一个完全信息的静态博弈。该博弈用得益矩阵表示如下:工人偷懒40，40100， -20不偷懒-10，11050，50老板克扣不克扣其实，根据该得益矩阵不难得到与上述动态博弈相同的结论，仍然是工人会选择偷懒和老板会选择克扣。这个博弈实际上与囚徒的困境是相似的第二章复习题4，5，7，9，11，12第二章参考答案4、多重纳什均衡不会影响纳什均衡的一致预测性质。这是因为一致预测性不是指各个博弈方有一致的预测，而是指每个博弈方自己的策略选择与自己的预测一

11、致对博弈分析主要的不利影响是，当博弈存在多重纳什均衡，而且相互之间没有明确的优劣之分时，会造成预测分析的困难，影响以纳什均衡为核心的博弈分析的预测能力存在帕累托上策均衡、风险上策均衡、聚点均衡或相关均衡的可能性，并且博弈方相互5、之间有足够的默契和理解时，多重纳什均衡造成的不利影响会较小博弈方2LCR2, 01, 14, 23, 41, 22, 31, 30，23, 0首先，运用严格下策反复消去法的思想，不难发现在博弈方1的策略中，B是相对于T的严格下策，因此可以把该策略从博弈方 1的策略空间中消去。把博弈方1的B策略消去后又可以发现，博弈方 2的策略中C是相对于R的严格下策，从而也可以消

12、去在下面的得益矩阵中相应策略和得益处划水平线和垂直线表示消去了这些策略博弈方1LCRT2, 01, 14, 2:M3, 41, 22, 3BCCD1 , 30, 23, 0博弈方2两个博弈方各消去一个策略后的博弈是如下的两人2X2博弈，已经不存在任何严格下策。再运用划线或箭头法，很容易发现这个2X 2博弈有两个纯策略纳什均衡（M，L ）和（T，R）可编辑版L博弈万2R博T2,04, 2弈方M3,42, 31由于两个纯策略纳什均衡之间没有帕累托效率意义上的优劣关系，双方利益有不一致性，因此如果没有其他进一步的信息或者决策机制，一次性静态博弈的结果不能肯定。由于双方在该博弈中可能采取混合

13、策略，因此实际上该博弈的结果可以是4个纯策略组合中的任何一个。7、我们用反应函数法来分析这个博弈。先讨论博弈方1的选择。根据问题的假设，如果博弈方2选择金额S2 (0 S2 10000)，则博弈方1选择S1的利益为：S1当 S1 10000 -$U(S1)=丿0 当 S1 10000 -S2因此博弈方1采用S1 = 1000 S2时，能实现自己的最大利益U(S1)= S1 = 1000 S2。因此 S1=1000 S2就是博弈方1的反应函数。博弈方2与博弈方1的利益函数和策略选择是完全相似的，因此对博弈方1所选择的任意金额S1,博弈方2的最优反应策略，也就是反应函数是 S2=1000- S1。

14、显然，上述博弈方1的反应函数与博弈方2的反应函数是完全重合的，因此本博弈有无穷多个纳什均衡，所有满足该反应函数，也就是S1+ S2=10000的数组(S1 ，S2)都是本博弈的纯策略纳什均衡。如果我是两个博弈方中的一个，那么我会要求得到5000元。理由是在该博弈的无穷多个纯策略纳什均衡中，(5000，5000)既是比较公平和容易被双方接受的，也是容易被双方同时想到的一个，因此是一个聚点均衡。9、( 1)第i个厂商的利润函数为：n i=pqi-Ciqi=(a-qi-qj)qi-Gqi将利润函数对产量求导并令其为 0得： =a_qj_Ci_2qi=0g解得两个厂商的反应函数为：qj= (a-

15、 q-ci) /2或具体写成：q仁(a-q2-C1)/2q2=(a-q1-C2)/2(2)当0vCiVa/2时，我们根据上述两个厂商的反应函数，直接求出两个厂商的纳什均衡产量分别为：a -2d C23a ci _2c2q2=3当ciC2a+ g时,根据反应函数求出来的厂商 2产量q20。这意味着厂商2不会生产，这时厂商1成了垄断厂商，厂商1的了优产量选择是利润最大化的垄断产量a - Ciqi=q* =-2因此这种情况下的纳什均衡为（a- Ci）/2, 0。11、（ 1）两个候选人竞争时，纯策略纳什均衡为（0.5, 0.5），即两个假选人都宣布自己是中间立场。我们用直接分析法加以证明：首先，如果

展开阅读全文