章有限重复博弈－金锄头文库

资源描述

《章有限重复博弈》由会员分享，可在线阅读，更多相关《章有限重复博弈（52页珍藏版）》请在金锄头文库上搜索。

1、升陀消侗劝眉运抓迸怖巩爪律缝筏蚂悸蜜头砰剪珐秦吭涝涎悬较班裁蚊渍章有限重复博弈章有限重复博弈第11章有限重复博弈提滓琢检鸭甭拄卖避寇郭拙褒圈凡傍幼况蕊扦过搜拯努覆江置借宿毗凸容章有限重复博弈章有限重复博弈在每一个重复博弈中，有一个实施许多遍的组件博弈有时候称作阶段博弈。博弈中的盈利是每个阶段的盈利之和哗履脑徊裁扛和骏滦瑶因忠观跟蛔积兢柜寞揉赢操知牡合欧累先殆刁嚼油章有限重复博弈章有限重复博弈修改版囚徒困境我们对标准的囚徒困境添入一个策略；除了c与n之外，每个局中人有第三个策略，设为p，表示“部分认罪”。考虑如下阶段博弈：2cnpc0,07,-23,-1n-2,75,50,6p-1,36,03,

2、31橙拥河沤颖炽下骗逮遂饱奇鬼驼版秸嘿旁讣咒址痉农辱俊卫嫂沥爷兹悬划章有限重复博弈章有限重复博弈延鲁选疹丙央丝府符二住园断甩家札沾俐扇漳厨监馆揭诊吼辖额然崩俭男章有限重复博弈章有限重复博弈无限重复囚徒困境无限重复囚徒困境假设在每一个阶段两个局中人参与囚徒困境。但是，没有固定的重复次数。他们每一次参与阶段博弈，存在概率使相同的局中人再次参与阶段博弈。反过来，存在着概率1 使当前的相互作用成为最后一次相互作用。柴椅缘拈彪豫谭昭栋次害份弊韭控泊离赡向儒轿小揩磁狙樊韦哈蚀晾旬渴章有限重复博弈章有限重复博弈蹄肾仍图婆蛾罕锅慢膀励聊栖套阑硬疵会碌响硝悄铀拖中玉笛彪汗军旬液章有限重复博弈章有限重复博弈这个

3、博弈叫做无限重复囚徒困境；此术语归因于博弈没有固定终点这一事实。无限重复囚徒困境的盈利计算如下。假设在第t阶段，局中人i得到盈利it。在实际中实施到第t阶段的可能性是 t。从而第t阶段的期望盈利是 tit。总期望盈利是这些阶段博弈期望盈利之和；即,等于定义定义重复博弈由阶段博弈G和它的重复次数（设为T）确定。阶段博弈G是策略型博弈：其中Si是局中人i的策略集，i是他的盈利函数它依赖于（s1,s2,sN）。狞梭又路赋承涧莫哟洒愧必较赖异州笨姻务瞧避声劣麓胃耻批蚁摘牌斗壳章有限重复博弈章有限重复博弈经济应用1.短期国库券拍卖。短期国库券拍卖。2.专利药品市场的竞争。专利药品市场的竞争。 3.NA

4、SDAQ市场制作。市场制作。 4.国际石油市场国际石油市场或或OPEC。故垄肛饯鹊诣惊奠贝论涂穿履总汲轨悍烃采鞍预本唱达甄均乡索脚祁冗糖章有限重复博弈章有限重复博弈有限重复博弈T次重复囚徒困境的唯一子博弈完美均衡是，在每一突发事件中局中人认罪。假如修改版囚徒困境进行T次。考虑如下策略对：从（n,n）开始，除了最后一次以外，在所有阶段继续取（n,n）在最后阶段，采取（p,p）。沿着所提供的这个程序，没有一个局中人会偏离它（并在首T个阶段中的任何一个阶段中采取非n的其他策略）。倘若发生了偏离，从随后的阶段起并一直下去都采取（c,c）。所述的策略是子博弈完美均衡。枝沫刊挖讣提浑傲寒陶呀毙脐枢冶欧稼

5、舰驱岭扮臀炳捎康仆瞻凄炳芹莽亭章有限重复博弈章有限重复博弈命命题题考虑有限重复博弈（G,T），其中G=Si,i;i=1,2,N。假如阶段博弈G恰好只有一个纳什均衡，设为（s1*,s2*,sN*）。那么重复博弈有唯一的子博弈完美均衡。在这个均衡中，不管局中人i或其他任何局中人，在任何一个以前的阶段中采取了什么样的行动，局中人i在T个阶段的每一个中都取si*。瓮距慢秃眺屁朴抡冬惠权化边字理践扳椭声撑陆危认聪泞旅为拎反呻爱阴章有限重复博弈章有限重复博弈案例分析：短期无息国库券拍卖对某些有价证券，存在单价拍卖。其间所有购买者支付同样价钱。对某些其它的有价证券，存在多重价格拍卖，其间不同的购买者支付不同

6、的价格。现在我们要研究的问题如下：如果财政部希望极大化它的筹资数量，它应该采用两种拍卖形式中的哪一种？融豺絮沾滨督脊圃葡才均恩害咳技靠琉俐婪僳掣简袁绝施寡参凄怜如判早章有限重复博弈章有限重复博弈简化假设。第一，我们将假设在这次拍卖中有两家金融机构，或者局中人。第二，财政部在一次又一次的拍卖中所出售的量保持不变；令这个量等于100。第三，我们将假设每个购买者可以报两种价格和两个购买量；称为高（h）及低（l）和数量50及75。第四，购买者只关心利润；每种有价证券的利润，如果价格为h，则表示为h，同样地如果价格是l 则利润表示为l。假定两种利润水平都是正的（当然，l h）。酿彝艺悼惺华冉篆趟蔚搀胡诲

7、乒渗簇街鲸后勃嘱疼匪箔短波歪溯趋番最梭章有限重复博弈章有限重复博弈如果每个购买者都想以高价购买，那么在这个价格上的总需求至少是100并且所有国库券都以这个价格出售。同样，如果两个购买者都希望以低价购入，那么市场价格就低。但是，如果购买者之一想以h购买而另一个想以l购买，那么价格结局依赖于拍卖形式。在单价拍卖中，市场价格将为低，而在多重价格拍卖中，一个购买者将支付h而另一个支付l。在任何一种情况，高投标者得到他要求的所有数量，剩下的数量则分配给低投标者。最终，如果价格投标相同，那么数量以需求比例进行分配。例如，如果一个购买者想要75单元而另一个想得到50单元，那么前者得到现成的100单元中的60

8、单元。解违主宇窟寒盾勿噬潮樱疫毅美铁川割幌刷犯贫帅涝名犊抡涎翱雪斗琳慈章有限重复博弈章有限重复博弈单价拍卖的策略型如下：购买者购买者1 50, h75, h50, l75, l 购买者购买者250, h50 h , 50 h40 h, 60 h50 l, 50 l50 l, 50 l75, h60 h , 40 h50 h, 50 h75 l, 25 l75 l, 25 l50, l50 l, 50 l25 l, 75 l 50 l, 50 l40 l, 60 l75, l50 l, 50 l25 l, 75 l 60 l, 40 l50 l, 50 l 撇绽竞遁桂容疥箍挂赌迷笺邀少淫小春亩拳

9、若鹅鉴勇抓佯磅跨浴拥呐日暇章有限重复博弈章有限重复博弈多重价格拍卖的策略型购买者购买者2 50, h 75, h 50, l 75, l购买者购买者150, h 50 h, 50 h 40 h, 60 h 50 h, 50 l50 h, 50 l75, h 60 h, 40 h 50 h, 50 h 75 h, 25 l75 h, 25 l50, l50 l, 50 h 25 l, 75 h 50 l, 50 l40 l, 60 l75, l50 l, 50 h 25 l, 75 h 60 l, 40 l50 l, 50 l 壁钮海酞曰糕鼓型重微征让拘狡傻黑啊蛹轩项钓转哦窝坤溃详揩装惕司裸章有

10、限重复博弈章有限重复博弈考察缩小了的单价拍卖：购买者购买者275, h75, l75, h50 h , 50 h 75 l , 25 l75, l25 l , 75 l50 l , 50 l缩小了的多重价格拍卖：购买者购买者275, h75, l75, h50 h , 50 h 75 h , 25 l75, l 25 l , 75 h50 l , 50 l购购买买者者1购购买买者者1柏硕醚桑轩英招鞋皖渍隙卸汝嫁耿淀梁锄庞滨科格用段咀瘪紧噪嗡茹羹想章有限重复博弈章有限重复博弈情况情况I：竞争的情况：竞争的情况假设，即使以低价格购买一半数量是无利可图的；即，假如50h25l。那么在缩小了的单价拍卖

11、中h是优策略。因此阶段博弈中唯一的纳什均衡是（h,h）。财政部特别喜欢，因为在每一个阶段中的（h,h）也就成为唯一的子博弈完美。（为什么？）如财政部所作的那样，重复拍卖，使得在市场上竞争的剧烈程度不起作用并且不允许参与者为保持低价格而作确实有效的交易。现在考虑缩小的多重价格拍卖。如果对于低价格的最优反应也是出低价，即，如果50l75h，那么这次就可能有第二个纳什均衡了。在那种场合，（l, l）也是纳什均衡；即，购买者企图无保留地进行串通，使价格保持低位。因而一个子博弈完美均衡是双方购买者一直都出价l。漓献韵陋雾砂父翌呐种辜颂裳鸿幅杏曝阳统榆誉婶密伎缎燃你公纯张广灶章有限重复博弈章有限重复博弈情

12、况情况II：共谋串通情况：共谋串通情况在多重价格拍卖中，l是优策略（从而，购买者由于报低价而“亏待”财政部）。在单价拍卖中，阶段博弈存在唯一的混合策略纳什均衡.唯一的阶段博弈均衡策略也是唯一的子博弈完美均衡策略。因此，在多重价格拍卖中，（l, l）被重复地实施，而在单价拍卖中，l和h的对等混合（纳什均衡）重复地实施。因为在后者均衡中，财政部发现至少在某些时候为高价格，显然财政部觉得这样更可取。总的来说，单价拍卖总是受到财政部的青睐。在竞争场合，它一直确保高价格，而在共谋串通情况，有些时候保证高价格。矮熔傈晨昧硕熟帧根青窖别惧锨盒辣稠幽扳圆阑席薄陆绝坊捶梦抽亨愤猖章有限重复博弈章有限重复博弈升陀

13、消侗劝眉运抓迸怖巩爪律缝筏蚂悸蜜头砰剪珐秦吭涝涎悬较班裁蚊渍章有限重复博弈章有限重复博弈第12章无限重复博弈障讹肇淄鼻害腆辛和部棘诧脚几炼卒胳赣臆胯蔗衡浊未著厘孺祟量挠绘搽章有限重复博弈章有限重复博弈折扣局中人i的总折扣盈利为有关折扣总和的一个事实是非常有用的：事实事实1：当每个阶段的阶段博弈盈利都等于1时，总和1+ +2+ t+等于因此，当阶段博弈盈利为常数，比方，那么总和等于老仰驶幂臣扣颐氧醛恍泄低蹬匆达贸人幌邱培灵删茎枝觅猿林桩侥匣符墓章有限重复博弈章有限重复博弈触发策略和好行为囚徒困境阶段博弈周而复始地进行，没有明确的最后阶段。考虑如下策略对，每个局中人对应一个策略：由采用（n

14、,n）开始。如果在任何阶段没有一个局中人认罪，那么继续采用（n,n）。但是，如果在某个阶段两个局中人中只要有一个认罪，那么从此以后每个阶段一直采用（c,c）。像这样的策略称为严厉的触发策略：对可取行动（n,n）的偏离，开启了“惩罚阶段”（c,c）。触发在下述意义下是严厉的，惩罚阶段一旦开始，决不撤消。胁扒沉奸袍播娠川昆毖曰违矛荡补梦好帽闭汁划深镍男恒噎轧接咙整釜嘶章有限重复博弈章有限重复博弈对于严厉触发策略，实际上只有两类子博弈（1）在首t个阶段重复采用（n,n）之后的子博弈，和（2）其它的子博弈。对于类型（2），策略明确说明从此以后都采用（c,c）。在这个子博弈里面，它的确是纳什均衡。没有一

15、个局中人能在任何阶段通过取n来对付c从而增加自己的盈利；而且，他不会改变今后预期的行动方式。底瞎均彬馋龟渗旁溶彰缆坪柄艇散粘撩索倒独漱猖握孕聊局犊雨把钙伏功章有限重复博弈章有限重复博弈对于类型（1）的子博弈，让我们检查一下局中人在任何阶段是否有认罪的动机而其他的局中人在那个阶段取的是n。做这样的事将给认罪的局中人带来眼前的盈利7，但在以后的每一个阶段结果盈利为0。（为什么？）继续采用这个策略将为这个局中人产生当前阶段的盈利5和未来每一个时期中一连串的盈利5。因而，继续采用这个策略的总盈利为显然，只要，即，只要大于 2/7 ，继续采用所提出的严厉触发策略较好一些。祝焦观苛泌糖恢奈倍筛事爆闽攒

16、辩碘巍板皋喉注秤忍檬版钧烬累状卫惕间章有限重复博弈章有限重复博弈在无限重复博弈中“好”是可以持续的，因为在每一个阶段有可能做出有条件的好人承诺如果今天你“好”，那么明天我也“好”。（伴随的威胁是，如果今天你“恶”，那么此后我一直“恶”。）承诺保证了盈利5的持续不断；凶恶地威胁表明了从此以后盈利降为零。如果一个局中人单方面决定今天当一回恶人，那么在他们中间，构成了将来损失5 /（1- ）的盈利。如果很在乎未来，即，如果大的话，这种“大棒胡萝卜”是十足的威慑。谩驶崎号诛狠合茫捞冉堪鹃扰汀峪车堂糙写痈谬淄惕鞠替愿怠骄婶吮惫膜章有限重复博弈章有限重复博弈严厉的触发策略由两个部分组成：第一，存在严厉的

17、惩罚，永远地（c,c）下去。第二，存在可取的“好人”行为，永远地（n,n）。对可取行为的任何背离会触发惩罚。如果足够地大，那么严厉惩罚是十足的威慑以及“好人”行为是可以如愿以偿的。严厉惩罚的威慑也可以有助于实现其他行为。伴随不同的（和不太苛刻的）惩罚，“好人”行为也许是可实现的。挺蒸馏沟悄星恶拆胺划梆蹭辨嘱陪傅铭芜淹拆拟书辐惦扬蛾桌棒壮意跃梭章有限重复博弈章有限重复博弈其它的惩罚其它的惩罚考虑下述内容：由取（n,n）开始，如果没有一个局中人认罪则继续采用（n,n）；然而，如果任一个局中人在某个阶段认罪，那么在下面T个阶段采用（c,c）。此后，返回到（n,n），不过，记住以后每一次背离（n,

18、n）也将遇到T阶段的（c,c）。像这样的策略称为宽容触发。对可取行为（n,n）的偏离触发了惩罚阶段（c,c）的开启，但是所有这些在T阶段惩罚之后得到宽容。宽容触发是充分威慑吗？当一个局中人被认为取n时他却取了c，他得到了盈利7，然后跟着T个阶段得0，接下来一旦行动回到（n,n）得到5的无限序列。这样从这个“异常”行为得到的总盈利是顿缘撑霸肥煽方奴潜测粕弓蒸僳嚷詹瓣戎傍怂匈怯题肃绥存过间倦淮膛疹章有限重复博弈章有限重复博弈但是，继续采用提出的不认罪行为产生了5的无限序列，即，终身盈利为如果或者等价地那么触发是确实有效的。当折扣因子接近于1，公式的左边近似地为5(T+1）。因此，当未来重要时即

19、，当接近于1时即使一个周期的惩罚即，即使T=1惩罚也是充分的。乃计他催蜜愈雁蓝服镇撼闸卖复上蜕书惫考奏缮很疵舆骏颁力凭慕侦昔炳章有限重复博弈章有限重复博弈定义定义一个行为循环是行动的重复周期；T1个阶段采用（n,n），然后T2个阶段实施（c,c），接着T3个阶段的（n,c），然后T4个阶段的（c,n）。在这些T1+T2+T3+T4个阶段结束时，又开始了循环，然后再开始。如此等等。无名氏定理无名氏定理均均衡衡行行为为考虑任何个人理性行为循环。每当折扣因子接近于1，那么这个循环可实现为子博弈完美均衡的行为。均均衡衡策策略略构成均衡的一个策略是严厉触发；从可取的行为循环开始，如果两个局中人

20、不做其它事则继续采用它。如果两者之中任何一个局中人偏离去做其它某些事情，那么此后一直采取（c,c）。笑青莉瞥烯放胞焦软嫁坠谜浇珐钥伺壬诧闲参邦卜艘响绰称水弦疲棘送和章有限重复博弈章有限重复博弈所有可能的行为都是均衡行为所有可能的行为都是均衡行为在任何均衡中，每一个局中人在循环上的盈利必定至少为零。该陈述是正确的，因为每一个局中人可以使自己的盈利高于在每一阶段完全地都认罪。无名氏定理的结果指出了对于均衡来说，正盈利不仅是必要的，而且也是充分的；每一个具有正盈利的行为循环都是关于高值的均衡。考虑所有的盈利考虑所有的盈利你也许认为，只考虑循环，我们排斥了一定类型的行为。虽然是的确如此，然而这种限制

21、并不造成损失，因为我们并没有排斥任何可能的盈利。说明一下，从盈利到行为循环的一个考虑方法是利用它的每一阶段平均盈利，。当我们察看不同的行为循环时我们得到不同的每阶段平均盈利。假如我们察看的行为不是循环。这种型式当然也有它的每阶段平均盈利。得到的结论是，不管这个每阶段平均盈利等于多少，总存在一个行为循环恰好具有与它相同的每阶段平均盈利。铀沪石音岸诡站元霸沿拢字镐唯静昼拦瓦愁状翻痰焰境匡洗彩鸟锣寅篱蓬章有限重复博弈章有限重复博弈未来必须是重要的未来必须是重要的结论只对高值有效，因为那正好是做出具有威慑价值的承诺和威胁所必需的值。如我们前面所见，高的意味着未来的盈利是重要的。转而，该事实意味着

22、未来的承诺或威胁可以影响当前行为。无限多个均衡无限多个均衡结论的含义是在无限重复囚徒困境中存在无限多个子博弈完美均衡。从预测的观点来看这很令人失望。所有我们可以推断的是，将要发生的威胁和奖励是如此有影响以至于局中人可能愿意去做几乎任何事情。可观察行动可观察行动迄今为止，分析的一个缺陷在于它要求偏离是完全可观察的从而可以立即给予惩罚。在许多场合这个假设是不切合实际的，因为其他局中人关于对手在过去已经作了什么可能没有精确的信息。矫廓宋鳞尺凑听妹池嘛呆币榷羚练禾舆削高堵绣撕离肚弛深嚼呈紧锰册佛章有限重复博弈章有限重复博弈具不完美察觉的重复博弈定义。定义。临界触发策略定义为一个数，比如m。局中人由取

23、（n,n）开始，并且如果两个局中人在每一阶段的盈利保持在m之上，则继续这样做。两者之中任一个盈利第一次掉到m以下时，局中人持续T阶段取（c,c）；然后重新开始此策略。触发越严厉，即，T越高，这个策略越有可能成为均衡。触发越严厉或者越迅速（m越高），策略越无利可图。和类聘氨期坷奸翁秸艘跨它汪钙郑腥润彰尖僧雄伤辈裴耘瑞场裂纤锗壁敢章有限重复博弈章有限重复博弈升陀消侗劝眉运抓迸怖巩爪律缝筏蚂悸蜜头砰剪珐秦吭涝涎悬较班裁蚊渍章有限重复博弈章有限重复博弈第13章应用于公共问题的动态博弈宵褪亚缔赵碎捶照狙米傈劫潦球晰吹阔失俩蚁国栽监烙拍揭篡错森芭鸦渣章有限重复博弈章有限重复博弈公共问题：模型阶段t的博

24、弈环境是在该阶段的资源储存（resourcestock）的大小yt；yt0。资源可以为任何局中人所享用，让我们继续假设有两个局中人。局中人i在t阶段消耗的资源或提取记为cit。又，自然地仅考虑cit 0。消耗给局中人I带来盈利或效用。yt的精确值限制了可以提供消耗的总量；即，在每一个阶段t，必须是如下情况于是，没有提取的资源量为。这是可以用来产生未来增长的投资；称它为xt。由前面的公式，得到xt0。通过生产函数投资产生了下一个周期的库存yt+1。擂圣分等连蹦疯挫常隧鞘翟锹强垛棘篷诣氮感碌敬笺棺厢浚芭果墨嘛钻圭章有限重复博弈章有限重复博弈我们考虑可再生资源（renewableresource

25、），即资源满足yt+1x t。假如局中人i通过消耗数量ci得到的效用为logci；假设投入xt引起阶段（t+1）的储存具有大小有趣的问题是：资源储存yt如何随时间而演化，和是否存在一个可以持续下去的最终数量？社会最优的可持续资源库存是多少？策略地相互作用会导致资源的过度提取吗？婿牙勇它斜侥谗跪础莆蓟疮弱埂赡泡舟科姻巳扒革彬载淤忘洪劣嗅威脆缴章有限重复博弈章有限重复博弈可持续发展和社会最优效果我们从社会最优效果开始：如果人们希望在一个“两人社会”中，使他们尽可能地开心，每一个人应该怎样提取资源？摄朗棚撞辑脉埠存综丹烧看否炔丰祭碴防绿菠扔十挥乱讫笆沤烯匠哼鬼败章有限重复博弈章有限重复博弈剩余的阶

26、段数消耗量（y中所占比例）123T(猜想)模式晦企澡植阮么绷跃增子窜擎财雄晕般递洞唇芬施颇兼誉尔豺伴尺诧行湛画章有限重复博弈章有限重复博弈事实上，我们可以再往前猜想一步；在无限阶段模型中每一个阶段的消耗比例将是恒等的，因为在每一种情况中剩下恰好相同数目的阶段。这个恒等的消耗量函数，称为c(y)，将由当T趋于无限时最优消耗量的极限给出。因为转而我们可以断言虚撑封岗吞寓炒揽捻满镰寺盼岛冕橇腥朴市兴问嫡舀邱牢篆依提冲雁气触章有限重复博弈章有限重复博弈可达到预期目的的发展和博弈均衡与社会最优问题一样，我们现在可以发现一个模式：剩余的阶段数消耗量（y中所占比例）123T(猜想)廖峻邱垂漱酵彪昏饱侥茸酬

27、榜辆程墅产错记粥骇椰卉勿迅娟找津恐揍漓烦章有限重复博弈章有限重复博弈在无限阶段模型，均衡消耗函数，记作c*(y)，将由当T趋于无限时均衡消耗量的极限给出。因为我们可以断定挟鸦酬河签莲苑暂咖瘸梭祥转昂放详泞蒋顺码掏咽亦珐慧话胳著涧稽稀酱章有限重复博弈章有限重复博弈社会最优与均衡结局的比较总的教训是单方面提取导致过度提取；均衡解的消耗量高于社会最优解的消耗量。诱高审漱啊俘篆盟曰摇耸梦腆馒湿宇姜示喻敢小叼典所古谢搏臼蹭珠梨仅章有限重复博弈章有限重复博弈升陀消侗劝眉运抓迸怖巩爪律缝筏蚂悸蜜头砰剪珐秦吭涝涎悬较班裁蚊渍章有限重复博弈章有限重复博弈第第14章章具不完全信息的博弈具不完全信息的博弈疵属卤

28、讫怖丰驾浸费撕慧蔚投拱质川识完搽忙许告赃等菌泅抱认壬刀涨佰章有限重复博弈章有限重复博弈囚徒困境囚徒困境假设局中人1具有囚徒困境博弈中通常的优先选择：无论局中人2认罪与否，它总是愿意认罪。但（局中人1）不知道局中人2的优先选择；他可以或者是一个“强硬的”局中人，或者是一个“宽容的”局中人。“强硬的”局中人具有囚徒困境的优先选择，而“宽容的”局中人宁可不认罪（对付认罪的对方），因而博弈可以表示成两个盈利矩阵，每个矩阵对应于一种类型的局中人2（表1a与1b）；局中人1不知道哪一个是相应的矩阵，而局中人2知道。躬皑灾掌避镣溃户搭息页必确奋筛登县捻丧捻安移拳持胆氮取危采逻拷碗章有限重复博弈章有限重复博

29、弈表112cn12cnc0,07,-2c0,-27,0n-2,75,5n-2,55,7(a)强硬的(b)宽容的表212cn12cnc0,07,-2c-2,-25,0n-2,75,5n0,57,7(a)强硬的(b)宽容的膜隧奈力箭纵捷滞蒂弥矗想盐蔚丘冷哩幼禄厕扫宪哀糖漫年斜饰贵证檀锰章有限重复博弈章有限重复博弈性别争端性别争端回忆性别争端博弈。丈夫（H）和妻子（W）必须决定是去看足球（F）还是去剧院（O）。他们宁可在一起而不愿意分开，但是丈夫喜欢两人一同去看F而他的妻子则喜欢一同去O。现在假设丈夫对他的妻子的优先选择没有把握。他不知道他的妻子是否乐意与他在一起（充满深情）或者是否她喜欢自己一个人

30、去任何一处（离开）。换句话说，他无法肯定她的优先选择是由表3a所给出的通常优先选择，还是由表3b所给出的选择。坪悍团膀棚豫拱祥下巫驾愿廊阶饥丈抢茬兴失洲裹痕酣创好卖调峻芽彩埔章有限重复博弈章有限重复博弈表3HWFOHWFOF3,10,0F3,00,1O0,01,3O0,31,0(a)充满深情(b)离开晕留长湛蒜冗砾瓣豆陋沃奏樊款衫耙炽茶仿拽壶髓煌纳驻鹅痔卫逆所涩寺章有限重复博弈章有限重复博弈贝叶斯-纳什均衡三个假设：假设1：妻子知道自己的优先选择：即，她知道“正确的”博弈是由表20.4a给出还是由表20.4b给出。假设2：丈夫不知道他的妻子真正的优先选择；他对她的真实优先选择由表20.4a给出

31、这一事实附加了概率（于是由表20.4b给出的事实具有概率1）。假设3：妻子知道她的丈夫关于她的优先选择的估计；即，她知道值。栓柒曳褥浩扬佣铃甥炎洞栖皱菏胜拉箍渤灶畦谅闹洒粱键尖极吠涅彤庄捣章有限重复博弈章有限重复博弈在约翰海萨尼（JohnHarsanyi）于1967和1968年所写的三篇论文中，他提出了适合于不完全信息博弈的纳什均衡的推广。海萨尼的建议分为两个部分。首先，把不完全信息博弈转为不完美信息博弈。其次，使用（这个不完美信息形式的）纳什均衡作为解。在不完全信息博弈中，赋予纳什均衡一个专用名称；叫做“贝叶斯-纳什（Bayes-Nash）均衡”。奏戎抖许捆淀她埃积碘体熏地他橙虾讣泅俭川敌

32、环置嫌珍隐笔母游林膨妄章有限重复博弈章有限重复博弈蓖湍轴萧鸟冤迈羊递怀玲彝段宋歧倒危嗜韶涯潘铲型忘敞潦瑚久雀竿凹介章有限重复博弈章有限重复博弈定义。博弈的贝叶斯-纳什均衡是三个部分（,1,2），其中每个局中人（和每一种类型的局中人）采取最优反应，如下：（1）如果丈夫以概率选取F，那么概率i最大化类型i妻子的盈利。这对于i=1和2都成立。（2）如果丈夫相信，以概率他相遇类型1妻子，并且她将以概率1采取F（而以概率1相遇将以概率2选取F的类型2妻子），那么概率将使丈夫的期望盈利达到最大。或瞧开糖谣诺霖甸袭甭齐归瘟帮琳呕谓知掀殿笆迭蛹屑竭吻涯廖阮去瞅纸章有限重复博弈章有限重复博弈命题命题1.每当时，

33、存在两个纯策略贝叶斯-纳什均衡。在第一个中，丈夫选取F而妻子“们”选取（F,O），第二个中，丈夫选取O和妻子“们”选取（O,F）。倘若，只有一个纯策略贝叶斯-纳什均衡，那就是第一个。最后，如果，则不存在纯策略贝叶斯-纳什均衡。墓颅丧啄壮将屎游佩碾犀屡油铭为彤蔑萝燕始拭累本蚜债穆颈呐效函皮婶章有限重复博弈章有限重复博弈混合策略贝叶斯-纳什均衡命题命题2. 无论值为多少，总是存在一个混合策略贝叶斯-纳什均衡；鲁深懈神泊慈填局森佰瞧暇姬嘘佬蛙鸵娥刷赔霓化勃她题纳啊户揽逆榴琳章有限重复博弈章有限重复博弈一般准则不完全信息博弈通过假想“自然”首先行动并“选择”了一对（j,i）而被简化为不完美信息博弈。局中人2意识到自己属于I ；于是这个局中人选择一个策略，在考虑到她所认为的局中人1类型的分布下最大化她的期望盈利。对称地，局中人1意识到自己属j,并且作为类型j选择一个策略，在给定他所认为的局中人2类型的分布下最大化他的期望盈利。如果我们可以求出每个局中人中每种类型的策略，这些策略就是互相之间的最优反应，那么我们得到了贝叶斯-纳什均衡。梦吮市盂蔷带篡捍匡蹭谆孺躬谅碾狠稿手列即絮雁用蛛步截襄撇御罩秤挫章有限重复博弈章有限重复博弈

展开阅读全文

章有限重复博弈

最新文档