纳什均衡案例

上传人:人*** 文档编号:561238474 上传时间:2023-12-03 格式:DOC 页数:6 大小:107KB
返回 下载 相关 举报
纳什均衡案例_第1页
第1页 / 共6页
纳什均衡案例_第2页
第2页 / 共6页
纳什均衡案例_第3页
第3页 / 共6页
纳什均衡案例_第4页
第4页 / 共6页
纳什均衡案例_第5页
第5页 / 共6页
点击查看更多>>
资源描述

《纳什均衡案例》由会员分享,可在线阅读,更多相关《纳什均衡案例(6页珍藏版)》请在金锄头文库上搜索。

1、纳什均衡案例奥斯卡获奖电影美丽心灵主角原型、诺贝尔奖得主、美国数学家约翰- 纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸,两人均不幸遇难。纳什在与命运的博弈中找到均衡, 纪念大师最好的方式就是尝试了解博弈论。 纳什均衡的应用是多领域的。 而事实上, 从日常生 活中可以找到很多纳什均衡的经典案例, 让我们普通人也可以尝试了解一下这一世界级的发现 和理论!首先我们先简单看一下纳什均衡的经济学含义: 所谓纳什均衡, 指的是参与人的这样一种 策略组合,在该策略组合上,任何参与人单独改变策略都不会得到好处。换句话说,如果在一 个策略组合上, 当所有其他人都不改变策略时, 没有人会改变自己的策略, 则该

2、策略组合就是 一个纳什均衡。大家可以现有一个简单的印象,结合下面的案例再回来看这个定义。案例一、智猪博弈 猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏 板的猪圈的另一边的投食口就会落下少量的食物。 如果有一只猪去踩踏板, 另一只猪就有机会 抢先吃到另一边落下的食物。 当小猪踩动踏板时, 大猪会在小猪跑到食槽之前刚好吃光所有的 食物;若是大猪踩动了踏板, 则还有机会在小猪吃完落下的食物之前跑到食槽, 争吃到另一半 残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择“搭便车”策略,也就是舒 舒服服地等在食槽边; 而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之

3、间。原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏 板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板 总比不踩强吧,所以只好亲力亲为了。案例二、囚徒困境 ( 1950 年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲 演时,讲到两个囚犯的故事。 )假设有两个小偷 A 和 B 联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两 个房间内进行审讯, 对每一个犯罪嫌疑人, 警方给出的政策是: 如果一个犯罪嫌疑人坦白了罪 行,交出了赃物,于是证据确凿,两人都被判有罪。 如果另一个犯罪嫌疑人也作了坦白, 则两人

4、各被判刑 8年;如果另一个犯罪嫌人没有坦白而是抵赖, 则以妨碍公务罪 (因已有证据 表明其有罪)再加刑 2年,而坦白者有功被减刑 8 年,立即释放。如果两人都抵赖,则警方因 证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱 1 年。囚徒困境博弈A B坦白抵赖坦白-8 ,-80,-10抵赖-10 ,0-1,-1关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1年。但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方都会怀疑对方会出卖自己以求自保、 其次才是亚当斯密的理论,假设每个人都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过

5、程:假如他坦白,如果我抵赖,得坐10年监狱,如果我坦白最多才8年;假如他要是抵赖,如果我也抵赖,我就会被判一年,如果我坦白就可以被释 放,而他会坐10年牢。综合以上几种情况考虑,不管他坦白与否,对我而言都是坦白了划算。 两个人都会动这样的脑筋,最终,两个人都选择了坦白,结果都被判8年刑期。基于经济学中Ratio nal age nt的前提假设,两个囚犯符合自己利益的选择是坦白招供,原 本对双方都有利的策略不招供从而均被判处一年就不会出现。这样两人都选择坦白的策略以及 因此被判8年的结局,纳什均衡”首先对亚当斯密的“看不见的手”的原理提出挑战:按照 斯密的理论,在市场经济中,每一个人都从利己的目

6、的出发,而最终全社会达到利他的效果。 但是我们可以从“纳什均衡”中引出“看不见的手”原理的一个悖论:从利己目的出发,结果 损人不利己,既不利己也不利他。案例三、普通范式博弈G00公司和SAM公司是某手机产品生态的两大重量级参与者,双方在产业链的不同位置上各司其职且关系暧昧,有时也往往因商业利益和产品影响力的争夺而各怀异心。二者的收益也随着博弈的变化而不断更替。SAM合作背叛|合作背叛|5,-3-1,-1上图表格模拟了两家公司的博弈现状,双方各有两个可选策略“合作”与“背叛”,格中的四组数据表示四个博弈结局的分数(收益),每组数据的第一个数字表示GOO公司的收益, 后一个数字表示SAM公司的收益

7、。博弈是同时进行的, 一方参与者必须站在对方的角度上来思考我方的策略选择, 以追求收 益最大化。这在博弈论里称作 Putting yourselves into other peoples shoes。现在我们以GO(公司为第一人称视角来思考应对 SAM公司的博弈策略。假如SAM公司选择 合作,那么我方也选择合作带来的收益是 3,而我方选择背叛带来的收益是 5,基于理性的收 益最大化考虑,我方应该选择背叛,这叫严格优势策略;假如SAM公司选择背叛,那么我方选择合作带来的收益是 -3,而选择背叛带来的收益为 -1,为使损失降到最低, 我方应该选择背叛。 最后,GO(公司的分析结果是,无论SA憾司

8、选择合作还是背叛策略,我方都必须选择背叛策 略才能获得最大化的收益。同理,当SAM公司也以严格优势策略来应对 GO公司的策略选择时, 我们重复上述分析过程,就能得出结论:无论 GOO公司选择合作还是背叛策略,SAM公司都必 须选择背叛策略才能获得最大化收益。 最后我们发现,本次博弈的双方都采取了背叛策略, 各自的收益都为 -1,这是一个比较糟糕的结局, 尽管对任何一方来说都不是最糟糕的那种。 这 种局面就是著名的“囚徒困境” 。但是,博弈的次数往往不止一次,就像COOf SAM公司双方的商业往来也许会有很多机会。 当二者经历了多次背叛策略的博弈之后,发现公式上还有一个( 3, 3)收益的双赢局

9、面,这比 (-1, -1)的收益结果显然要好很多,因此二者在之后的博弈过程中必然会尝试互建信任,从 而驱使双方都选择合作策略。 这里有一个理想化假设,那就是假设双方都知道博弈次数是 无限的话, 也就是说双方的商业往来是无止尽的, 那么二者的策略都将持续选择合作, 最终的 博弈收益将定格在( 3, 3),这就是一个纳什均衡。既然博弈次数是无限的,那么任何一方都 没有理由选择背叛策略去冒险追求 5 点短暂收益, 而招致对方在下一轮博弈中的报复 (这种报 复在博弈论里称作“以牙还牙”策略) 。还有另一种假设情况是, 假使双方都知道博弈次数是有限的, 也许下一次博弈就是最后一 次,那么为了避免对方在最

10、后一轮博弈中选择背叛策略而使我方遭受 -3 的收益损失,于是双 方都重新采取了背叛的策略选择,最后的博弈结果又回到了( -1, -1 ),这就形成了第二个纳 什均衡。由此可见,随着次数(博弈性质)的变化,纳什均衡点也并非唯一,这在下一个例子中有 着更明显的表现。案例四、饿狮博弈题设为 A、B、C、D、E、F 六只狮子(强弱从左到右依次排序)和一只绵羊。假设狮子A吃掉绵羊后就会打盹午睡,这时比 A稍弱的狮子B就会趁机吃掉狮子A,接着B也会午睡,然后狮子C就会吃掉狮子B,以此类推。那么问题来了,狮子 A敢不敢吃绵羊?繼羊 狮子A 師子B 弭子匚 邇子D 師3E娜子F +为简化说明,我们先给出此题的

11、解法。该题须采用逆向分析法,也就是从最弱的狮子F开始分析,依次前推。假设狮子 E睡着了,狮子F敢不敢吃掉狮子E?答案是肯定的,因为在 狮子F的后面已没有其它狮子,所以狮子 F可以放心地吃掉午睡中的狮子 E。继续前推,既 然狮子E睡着会被狮子F吃掉,那么狮子E必然不敢吃在他前面睡着的狮子 D。再往前推, 既然狮子E不敢吃掉狮子D,那么D则可以放心去吃午睡中的狮子 C。依次前推,得出C不吃, B吃,A不吃。所以答案是狮子 A不敢吃掉绵羊。细心的人也许会发现,假如增加或减少狮子的总数,博弈的结果会完全不同。我们用下图 来验证:|- | 不吃“叵j 丄吧脈孑A 昭E 额子匸期孑D 丽孑E 昭F 狮孑&

12、我们在狮子F的后面增加了一只狮子G,总数变成7只。用逆向分析法按照上题步骤再推 一次,很容易得出结论:狮子 G吃,狮子F不吃,E吃,D不吃,C吃,B不吃,A吃。这次的 答案变成了狮子A敢吃掉绵羊。对比两次博弈我们发现,狮子 A敢不敢吃绵羊取决于狮子总数的奇偶性,总数为奇数时, A敢吃掉绵羊;总数为偶数时,A则不敢吃。因此,总数为奇数和总数为偶数的狮群博弈结果 形成了两个稳定的纳什均衡点。案例五、硬币正反你正在图书馆枯坐,一位陌生美女主动过来和你搭讪, 并要求和你一起玩个数学游戏。 美 女提议:“让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,

13、剩下的情况你给我2元就可以了。”那么该不该和这位姑娘玩 这个游戏呢?这基本是废话,当然该。问题是,这个游戏公平吗?每一种游戏依具其规则的不同会存在两种纳什均衡, 一种是纯策略纳什均衡,也就是说玩 家都能够采取固定的策略(比如一直出正面或者一直出反面),使得每人都赚得最多或亏得最少;或者是混合策略纳什均衡,而在这个游戏中,便应该采用混合策略纳什均衡你 美女美女出正面美女出反面你出正面+3, -3-2 , +2你出反面-2, +2+1 , -1假设我们出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y 。为了使利益最大化,应该在对手出正面或反面的时候我们的收益都相等,由

14、此列出方程就是 3x + (-2)*(1-x)=(-2) * x + 1*( 1-x ) 解方程得 x=3/8 。同样,美女的收益,列方程-3y + 2( 1-y)= 2y+ (-1) * ( 1-y)解得y也等于3/8 ,而美女每次的期望收益则是 2(1-y)- 3y = 1/8 元。这告诉我们,在双方都采取最优策略的情况 下,平均每次美女赢 1/8 元。其实只要美女采取了 (3/8,5/8) 这个方案,不论你再采用什么方案, 都是不能改变局面的。如果全部出正面,每次的期望收益是 (3+3+3-2-2-2-2-2)/8=-1/8 元;如果全部出反面,每次 的期望收益也是 (-2-2-2+1+

15、1+1+1+1)/8=-1/8 元。而任何策略无非只是上面两种策略的线性组 合,所以期望还是 -1/8 元。但是当你也采用最佳策略时, 至少可以保证自己输得最少。 否则, 你肯定就会被美女采用的策略针对,从而赔掉更多。案例六、公地悲剧 公地作为一项资源或财产有许多拥有者,他们中的每一个都有使用权,但没有权利阻止 其他人使用,而每一个人都倾向于过度使用,从而造成资源的枯竭。过度砍伐的森林、过度捕 捞的渔业资源及污染严重的河流和空气,都是“公地悲剧”的典型例子。之所以叫悲剧,是因 为每个当事人都知道资源将由于过度使用而枯竭, 但每个人对阻止事态的继续恶化都感到无能 为力。而且都抱着“及时捞一把”的心态加剧事态的恶化。公共物品因产权难以界定而被竞争 性地过度使用或侵占是必然的结果。哈丁在公地的悲剧中设置了这样一个场景:一群牧民一同在一块公共草场放牧。一个 牧民想多养一只羊增加个人收益,虽然他明知草场上羊的数量已经太多了,再增加羊的数目, 将使草场的质量下降。 牧民将如何取舍?如果每人都从自己私利出发, 肯定会选择多养羊获取 收益,因为草场退化的代价由大家负担。 每一位牧民都如此思考时, “公地悲剧”就上演了 草场持续退化,直至无法养羊,最终导致所有牧民破产。公地悲剧在英国是和“圈地运动”联系在一起的。 15, 16 世纪的英国,草地、

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号