9不完全信息与声誉

上传人:枫** 文档编号:570084218 上传时间:2024-08-01 格式:PPT 页数:32 大小:119KB
返回 下载 相关 举报
9不完全信息与声誉_第1页
第1页 / 共32页
9不完全信息与声誉_第2页
第2页 / 共32页
9不完全信息与声誉_第3页
第3页 / 共32页
9不完全信息与声誉_第4页
第4页 / 共32页
9不完全信息与声誉_第5页
第5页 / 共32页
点击查看更多>>
资源描述

《9不完全信息与声誉》由会员分享,可在线阅读,更多相关《9不完全信息与声誉(32页珍藏版)》请在金锄头文库上搜索。

1、不完全信息重复博弈与声誉1有限次重复博弈n证明,只要未来足够重要,合作行为可以是无限次重复博弈的精炼纳什均衡。n但是,现实中许多博弈是有限次的,不是无限次的。n如果博弈重复的次数是有限的,无论重复多少次,合作都不会出现。2“连锁店悖论”(chain-store paradox)nSelten (1978);进入者进入者在位者在位者进入不进入默许斗争(40,50)(-10,0)(0,100)3逆向归纳n假定在位者有20个市场。直观告诉我们,如果进入者在第一个市场进入,在位者应该选择斗争,因为尽管从一个市场看,斗争是不值得的,但这样做可以遏止进入者在其他市场上的进入。n唯一的精炼纳什均衡是:进入者

2、总是进入;在位者总是默许。4Axelrod 实验nAxelrod(1981)实验表明:即使在有限次博弈中,合作行为也频繁出现。5问题在哪里?n一个可能的原因在于:我们前面假定不仅参与人的理性是共同知识,而且每个参与人可以选择的战略和效用函数都是共同知识。但现实不是这样。n可能性:逆向归纳方法的问题(理性共识);信息不完全;n如果信息是完全的,谈判一开始就达成协议,但现实中的谈判不是这样,原因在于信息不对称。6不完全信息nKMRW模型(1982);n如果参与人对其他参与人的效用函数和战略空间的信息不完全,即使博弈重复的次数是有限的,人们也有积极性建立一个合作的声誉(reputation),合作会

3、出现。7单方不完全信息n假定有两个参与人,A和B,进行囚徒困境博弈。如下图。n参与人A有两种可能的类型:“非理性”型:只有一种战略,tit-for-tat (TFT),或者grim strategy, 概率为p; “理性”型:可以选择任何战略,概率为(1-p);n参与人B有一种类型:理性型。8对“非理性”的解释n特殊的成本函数或效用函数;n讲义气、重情谊的人;内在化了 reciprocity 社会规范的人;n认知问题;9 囚徒困境博弈合作背叛合作背叛3,3-1,44,-10,0AB10博弈重复两次t=1t=2A非理性(p)理性型(1-p)B (理性型)合作X背叛背叛X背叛11第2阶段n参与人A

4、:如果是理性的,选择“背叛”;如果是非理性的,选择B在第1阶段的行动(X);n参与人B:选择“背叛”。t=1t=2A非理性(p)理性型(1-p)B (理性型)合作X背叛背叛X背叛12第1阶段n参与人A:如果是非理性的,选择“合作”;如果是理性的,选择“背叛”;n参与人B:如果选择合作,面临被背叛的风险,但如果A是非理性的,可以换来第2阶段的合作。t=1t=2A非理性(p)理性型(1-p)B (理性型)合作X背叛背叛X背叛13B在第2阶段的选择n选择合作,期望效用是:n3p+(-1)(1-p)+4p+0(1-p)=8p-1n如果选择背叛,期望效用函数是:n4p+0(1-p)+0=4pn最优选择是

5、合作,如果:p=0.25;n结论:如果B认为A非理性的概率不小于0.25, B在第1阶段会选择合作,即使博弈只重复两次。t=1t=2A非理性(p)理性型(1-p)B (理性型)合作X背叛背叛X背叛合作背叛合作背叛3,3-1,44,-10,0AB14博弈重复3次t=1t=2A非理性(p)理性型(1-p)B (理性型)合作X?背叛XXt=3X背叛背叛15参与人A(理性)的选择n如果如果A是理性的,在第是理性的,在第2阶段和第阶段和第3阶段一定会选择背叛,但第阶段一定会选择背叛,但第1阶阶段也可能选择合作,因为建立一段也可能选择合作,因为建立一个合作的形象可以换取个合作的形象可以换取B在第在第2阶阶

6、段的合作;段的合作;n如果如果p=0.25, 并且并且A认为认为B在第在第1阶段会合作,给定阶段会合作,给定A在第在第1阶段阶段合作的话合作的话B在在第在在第2阶段也会合作阶段也会合作(后验概率不变),那么(后验概率不变),那么A选择选择合作得到:合作得到:3+4+0=5;n如果如果A选择背叛,得到:选择背叛,得到:4+0+0=4;n所以合作是最优的。所以合作是最优的。合作背叛合作背叛3,3-1,44,-10,0ABt=1t=2A非理性(p)理性型(1-p)B (理性型)合作X?背叛XXt=3X背叛背叛16参与人B的选择nB有四种战略:n(合作,合作,背叛);n(合作,背叛,背叛);n(背叛,

7、背叛,背叛);n(背叛,合作,背叛)17(合作,合作,背叛)t=1t=2A非理性(p)理性型(1-p)B (理性型)合作X=合作合作背叛X=合作X=合作t=3X=合作背叛背叛3+ 3p+(-1)(1-p)+ 4p+0=8p+2预期效用=合作背叛合作背叛3,3-1,44,-10,0AB18(合作,背叛,背叛)t=1t=2A非理性(p)理性型(1-p)B (理性型)合作X=合作合作背叛X=合作X=背叛t=3X=背叛背叛背叛3+ 4p+0(1-p)+ 0= 4p+3预期效用=19(背叛,背叛,背叛)t=1t=2A非理性(p)理性型(1-p)B (理性型)合作X=背叛合作背叛X=背叛X=背叛t=3X=

8、背叛背叛背叛4+ 0 +0= 4预期效用=20(背叛,合作,背叛)t=1t=2A非理性(p)理性型(1-p)B (理性型)合作X=背叛合作背叛X=背叛X=合作t=3X=合作背叛背叛4+ (-1) +4p+0(1-p)= 4p+3预期效用=21P=18p+2 (合作,合作,背叛)0.254p+3 (合作,背叛,背叛) (背叛,合作,背叛)=4(背叛,背叛,背叛)22结论n只要p=0.25, 下表所列战略组合是一个精炼纳什均衡:n理性型A在第1阶段选择合作,然后在第2和第3阶段选择背叛;nB在第1和第2阶段选择合作,然后在第3阶段背叛。23精炼纳什均衡t=1t=2A非理性(p)理性型(1-p)B

9、(理性型)合作X=合作合作背叛X=合作X=合作t=3X=合作背叛背叛24一般结论n可以证明:如果博弈重复T次,只要p=0.25, 对于所有的T=3, 下列战略组合构成一个精炼纳什均衡:理性型A在t=1.T-2阶段选择合作,在T-1和T阶段选择背叛;B在t=1.T-1阶段选择合作,在最后阶段T选择背叛。n背叛只在最后两阶段出现。25双方不完全信息n在单方不完全信息下,只要p=4;nT*=(5-p)/p;n所以,无论p多小,只要博弈重复的次数足够大,一开始就选择背叛不是最优的。28KMRW定理n在不完全信息的情况下,只要博弈重复的次数足够长,参与人就有积极性在博弈的早期建立一个“合作”的声誉;只是

10、在博弈的后期,才会选择背叛;并且,非合作阶段的数量只与p有关,而与博弈的次数T无关。n看似不理性的行为其实是理性的;29KMRW定理的直观解释n尽管每一个囚徒在选择合作时冒着被其他囚徒出卖的风险(从而可能得到一个较低的现阶段支付),但如果他选择不合作,就暴露了自是非合作型的,从而失去了获得长期合作受益的可能,如果对方是合作型的话。n如果博弈重复的次数足够多,未来收益的损失就超过短期被出卖的损失,因此在博弈得开始,每一个参与人都想树立一个合作的形象,即使他本性上并不是合作型的;只有博弈快结束时,参与人才会一次性的把自己过去建立的声誉利用尽,合作才会终止。30解开“连锁店悖论”nSelten (1978);进入者进入者在位者在位者进入不进入默许斗争(40,50)(-10,0)(0,100)31声誉的积累32

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号