LOGO河南工程学院 主讲 陈海堂博弈论与生活中的经济学E-mail: haitangchen@LOGO第四讲最优反应、纳什均衡与其他几个经典案例1.最优反应与纳什均衡2. 电视频道的性别战3. 懦夫博弈Game Theory & Lifehaitangchen@4. 协调博弈5. 多重均衡中最可能的结果6. 没有单纯策略均衡的结果7. 小结LOGOGame Theory & Lifehaitangchen@v我尊重你是因为你尊重我,你尊重我是因为我 尊重你; v我喜欢你是因为你喜欢我,你喜欢我是因为我 喜欢你; v我爱你是因为你爱我,你爱我是因为我爱你 v —佚名LOGO实例在一个长度为1的沙滩上,均匀地分布着三三两两 的游客每个游客将消费一瓶水两个小贩前来 卖水如果每个游客都只在靠自己最近的那个小 贩那里买水,那么两个小贩将如何布局他们的摊 位?在这样一个博弈中,两个小贩会发现,如果 自己摆在沙滩中点以左(或右)的任何位置都是 不好,因为对方可以通过摆在紧邻自己的右(或 左)边即可获得超过1/2的游客消费者,而自己只 能获得少于1/2的游客消费者。
只有自己安置在沙 滩的正中点,这才是最好的LOGO实例v因为无论对方紧邻自己左边还是右边,自己始 终可以得到1/2的游客,其他的位置皆不可能 得到这么多游客于是,两个小贩就紧挨着摊 位都摆在了沙滩的中点上v这个“长滩卖水”的博弈,还可以用于政治选 举中拉票活动的分析,也可以用于解释为什么 卖同类物品的商家都紧挨着布局不过,我们 引用这个例子是为了说明纳什均衡—本章的主 题:在什么样的策略组合下,博弈的双方可以 得到一个稳定的结果就像那两个小贩得到稳 定的摊位布局一样LOGO4.1 最优反应与纳什均衡v囚徒困境中存在优势策略纳什均衡(两个人都选 取优势策略),智猪博弈中有重复剔除劣势策略 纳什均衡(一人有优势,另一人没有)但是, 在很多的博弈中,所有参与人都没有优势策略( 也就不可能有劣势策略)比如下面这个被称为“ 麦琪的礼物”的博弈,我们应如何来求解它的博弈 均衡呢?LOGO4.1 最优反应与纳什均衡v故事模型 …………………………………………… v“麦琪的礼物”博弈改编自欧·亨利的同名小说小 说写的是这样一个故事: v一对经济拮据的夫妻,丈夫吉姆有一只爱不释手 的怀表,却没有表链;而妻子有一头美丽的长发 ,却缺少一把玳瑁梳子。
他俩感情深厚,生活的 美满知足在圣诞前夕,俩人分别悄悄外出为对 方购买礼物结果妻子剪卖自己的长发,为先生 买了条表链,好配他的怀表;而丈夫则卖了怀表 ,为妻子买了一把梳子LOGO我们用赢利表将博弈模型表示如下v把这个故事转化为博弈模型可以表示为: 图4-1麦琪的礼物 0 02 11 20 0妻子 剪发不卖卖表不卖丈夫LOGO4.1 最优反应与纳什均衡v观察这个博弈,表中的数字是这样设计出来的? v如果丈夫卖了表而妻子剪了发,则他们的礼物对 对方都没有价值,他们各自得到效用0; v如果丈夫不卖表而妻子不卖发,则他们都没有钱 买礼物给对方,仍各自得到效用0; v如果丈夫卖表而妻子不剪发,或者丈夫不卖表而 妻子剪发,则他们中有一方可买礼物送给对方, 因为他们如此相爱,送礼方可得到2个单位效用, 受礼方可得到1个单位效用LOGO4.1 最优反应与纳什均衡v这个博弈的稳定结果(或者说均衡)是什么呢? v我们再也无法寻找到他们的优势策略,因此需要 创造出一些新的寻找稳定结果的方法可喜的是 ,我们确有这样的方法,那就是根据纳什均衡的 定义来求LOGO4.1 最优反应与纳什均衡-- 4.1.1最优反应v4.1.1 最优反应 v我们先要介绍最优反应。
最优反应是指,给定 对手选定一个策略,则我选择某个策略比选择 其他策略都要好,那么选择这“某个策略”就 是我对于对手选定策略的最优反应譬如在图4 -1的博弈中,给定妻子剪发,丈夫的最优反应 是不卖表(因为卖表只得到0,不卖表却得到1 ),为了标记出丈夫的最优反应,我们就在( 不卖,剪发)所对应的单元格中丈夫的赢利数 字“1”下面画一条横线(如图4-2所示);给 定妻子不剪发,则丈夫的最优反应是卖表,同 样,为了标记丈夫的最优反应我们在(卖表, 不剪)所对应的单元格中丈夫的赢利数字“2” 下面画一横线 LOGO4.1 最优反应与纳什均衡-- 4.1.1最优反应v同理,我们也可找到妻子对丈夫的任意一个策 略的最优反应,给定丈夫卖表,妻子的最优反 应是不剪发;给定丈夫不卖表,妻子的最优反 应是剪发为了标记妻子的最优反应,我们也 在相应的单元格中妻子的赢利数字下画一横线 (见图4-2)LOGO4.1 最优反应与纳什均衡-- 4.1.1最优反应v图4-2: 麦琪的礼物 0 02 11 20 0妻子不剪剪发不卖卖表丈夫LOGO4.1 最优反应与纳什均衡-- 4.1.2纳什均衡v4.1.2 纳什均衡 v纳什均衡是这样一种状态,在该状态下每个参与 人所采取的策略都是对于其他参与人的策略的最 优反应。
以二人博弈为例,纳什均衡就是一个策 略组合(甲的策略,乙的策略),甲的策略是对 乙的策略的最优反应,而乙的策略也是对甲的策 略的最优反应譬如,在囚徒困境博弈中,我们 说(甲供认,乙供认)是一个纳什均衡,就因为 它满足纳什均衡定义所要求的特性—甲供认是对 乙供认的最优反应,而乙供认是对甲供认的最优 反应LOGO4.1 最优反应与纳什均衡-- 4.1.2纳什均衡v换言之,在纳什均衡状态下,所有参与人都已选 取其最优反应既然如此,我们就可以通过判断 一个策略组合中的策略是否满足成为彼此的最优 反应来确认它是否是纳什均衡在图4-2中,我们 用画线标记出了丈夫和妻子对彼此各个策略的最 优反应,显然,如果可以找到某个单元格中两个 人的赢利数字下皆画了横线,那么就代表该组合 中的策略彼此是最优反应,该策略组合就是我们 要寻找的纳什均衡 v很容易地,我们会在图4-2中发现,(不卖,剪发 )和(卖表,不剪)都满足纳什均衡的条件,即 丈夫不卖表、妻子剪发和丈夫卖表、妻子不剪发 ,这两种情况都是纳什均衡LOGO4.1 最优反应与纳什均衡-- 4.1.2纳什均衡v我们用画线标记出每个人对其他各个策略的最优 反应,然后寻找全部数字都有下划线的单元格来 寻找纳什均衡的方法,叫画线求解法。
对于策略 离散型的二人有限博弈,这个方法都是适用的 v同学们也许会有很多疑问,譬如他们可能会问: 你说(不卖,剪发)和(卖表,不剪)这两种情 况是均衡,是稳定结果;但是小说中实际出现的 结果却是(卖表,剪发)为什么这种情况会出 现,我们在下一章的混合策略中可给出解释LOGO4.1 最优反应与纳什均衡-- 4.1.2纳什均衡v更多策略的情况,我们再用一个例子来复习一下 画线法求解纳什均衡,这样可以巩固学习成果 比如图4-3的例子 v图4-3 画线法求解纳什均衡LOGO4.1 最优反应与纳什均衡-- 4.1.2纳什均衡3 54 45 16 12 81 103 75 84 4李四上下上中张三中下LOGO4.1 最优反应与纳什均衡-- 4.1.2纳什均衡v图4-3看起来比我们前面的例子都要复杂些,因为 前面的例子中每人只有两个可选策略,而这里每 个人有三个可选策略,但画线法求解纳什均衡的 难度并没有增加我们在给定张三的每一个策略 选择下找到李四的最大赢利所对应的每一策略( 显然,应该在张三每个策略对应的行上去找), 然后在最大支付下画一横线;同样地,我们接着 又在给定李四的每一个策略选择下找到张三的最 大赢利所对应的每一策略(显然,应该在李四的 每个策略对应的列上去找),然后在最大支付下 画一横线。
最后,我们将那些张三和李四的赢利 下都画有横线所对应的策略组合找出来,它们就 是纳什均衡LOGO4.1 最优反应与纳什均衡-- 4.1.2纳什均衡v有了画线法,对于任何以赢利表表示的博弈,我 们都可以通过画线法寻找纳什均衡因此我们现 在可以放开手脚,探讨我们感兴趣的博弈,尤其 是以下几个经典的静态博弈模型LOGO4.2 电视频道的性别战v故事模型……………………………………… v有一对夫妻,丈夫喜欢看足球赛节目,妻子喜欢 看肥皂剧节目,但是家里只有一台电视,于是就 产生了争夺频道的矛盾假设双方都同意看足球 赛,则丈夫可得到2单位效用,妻子得到1单位效 用;如果都同意看肥皂剧,则丈夫可得到1单位效 用,妻子可得到2单位效用;如果双方意见不一致 ,结果只好大家都不看,各自只能得到0单位效用 LOGO4.2 电视频道的性别战v 这个博弈的策略式表述如图4-4----性别战:电视频 道争夺 2 10 00 01 2妻子 足球赛丈夫肥皂剧足球赛肥皂剧LOGO4.2 电视频道的性别战v可以用画线法求解该博弈的纳什均衡,均衡结果 是(足球赛,足球赛)和(肥皂剧,肥皂剧)。
这个博弈的一个典型特征是,如果对方一意坚持 ,则顺从对方比与对方抗争要好一方坚持选择 自己喜欢的节目时,顺从至少可以得到1单位效用 ,而抗争则只能得到0单位效用这与现实中的故 事是一致的,夫妻双方一方坚持己见的时候,另 一方常常会迁就一些,做出让步LOGO4.2 电视频道的性别战v性别战博弈具有与麦琪的礼物相同的博弈结构 该博弈结构的显著特点是,博弈有两个均衡,博 弈双方各自会偏爱一个均衡,比如丈夫偏爱(足 球赛,足球赛)均衡,而妻子偏爱(肥皂剧,肥 皂剧)均衡;不过他们还是有一些共同利益的, 因为任何一个均衡中,他们都可以得到比非均衡 状态更多的赢利 v在性别战中,究竟哪一个均衡会出现呢?也许这 取决于夫妻俩在家庭中的地位,如果什么都是丈 夫说了算,那么很可能出现丈夫偏爱的均衡;或 者可能出现轮流做主的情况但更多的时候,在 性别战博弈中建立一个强硬的形象也许是有好处 的LOGO4.2 电视频道的性别战---例 铁腕上司与鹰派下属v铁腕上司与鹰派下属 v性别战博弈的一个现实例子是组织中上下级的博 弈所有在层级组织中工作的人们都知道,组织 中的上下级关系是很微妙的有些组织中上级对 待下属非常强硬,被称为铁腕上司;有些组织里 下级对待上级毫不买账,被称为鹰派下属。
假设 一个上司和其下属进行博弈,他们在某个有争议 的问题上各自都可以选择对彼此的强硬态度和屈 从态度,相关的赢利情况如4-5LOGO4.2 电视频道的性别战---例 铁腕上司与鹰派下属v 图4-5 组织中的政治行为 0 05 22 51 1下属强硬屈从强硬屈从上司LOGO4.2 电视频道的性别战---例 铁腕上司与鹰派下属v通过画线法不难发现,这个博弈中的纳什均衡是 (强硬,屈从)和(屈从,强硬),如果上司强 硬,则下属应屈从;如果下属强硬,上司最好屈 从这与通常所看到的组织中的状况是一样的, 如果上司态度坚决,下属只好委曲求全;如果下 属完全不买账,上司只好做出一些让步 v这个博弈对我们有什么启示呢?在这个博弈中, 如果上司树立起铁腕上司的形象,它就可能从中 获得好处一个粗暴的、不近人情的上司往往令 员工更为畏惧,而不敢与其针锋相对,那么均衡 的结果很可能是(强硬,屈从)反过来,如果 一个下属素有鹰派下属形象,那么上司往往也会 让其三分,均衡结果很可能是(屈从,强硬) LOGO4.2 电视频道的性别战---例 铁腕上司与鹰派下属v当然,我们也可能会说,铁腕上司是常见的,鹰 派下属似乎不大常见。
其实不然,组织中上司被 架空权利的现象并不鲜见,在一。