博弈论(教案)2012

上传人:F****n 文档编号:88016392 上传时间:2019-04-16 格式:PPT 页数:58 大小:707.50KB
返回 下载 相关 举报
博弈论(教案)2012_第1页
第1页 / 共58页
博弈论(教案)2012_第2页
第2页 / 共58页
博弈论(教案)2012_第3页
第3页 / 共58页
博弈论(教案)2012_第4页
第4页 / 共58页
博弈论(教案)2012_第5页
第5页 / 共58页
点击查看更多>>
资源描述

《博弈论(教案)2012》由会员分享,可在线阅读,更多相关《博弈论(教案)2012(58页珍藏版)》请在金锄头文库上搜索。

1、,023-65111708 13452378728 http:/ 本章内容: 1 博弈论的基本思想 2 博弈论的引入案例 A 海盗分宝石 B 两个公司城市建立三个长途汽车站 C 模拟若漫底战役 D 解释社会现象:鲜花插在牛粪上 E 万州案例 F 囚徒博弈 二 教学目的: 掌握博弈论的基本原理和分析方法 三 本章重点:博弈的收益矩阵 四 本章难点:应用博弈论的基本原理分析解释社会现象 五 计划学时:4-6,例题:个海盗抢到了颗宝石,每一颗都一样的大小和价值连城。他们决定这么分: 第一步,抽签决定自己的号码(、); 第二步,首先,由号提出分配方案,然后个人进行表决,当且仅当超过半数的人同意时,按

2、照他的提案进行分配,否则他将被扔入大海喂鲨鱼; 第三步,号死后,再由号提出分配方案,然后人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则他将被扔入大海喂鲨鱼; 第四步,以此类推。 条件:每个海盗都是很聪明的人,都能很理智的判断得失,从而做出选择。 问题:最后的分配结果如何?纳什均衡解。 提示:海盗的判断原则:保命;尽量多得宝石;尽量多杀人。 参考答案:推理的关键是找对思路。,首先讨论一个案例-海盗分宝石,推理过程: 从后向前推,如果号强盗都喂了鲨鱼,只剩号和号的话,号一定投反对票让号喂鲨鱼,以独吞全部金币。所以,号惟有支持号才能保命。号知道这一点,就会提(,)的分配方案,对号

3、、号一毛不拔而将全部金币归为已有,因为他知道号一无所获但还是会投赞成票,再加上自己一票,他的方案即可通过。不过,号推知到号的方案,就会提出(,)的方案,即放弃号,而给予号和号各一枚金币。由于该方案对于号和号来说比在号分配时更为有利,他们将支持他而不希望他出局而由号来分配。这样,号将拿走枚金币。不过,号的方案会被号所洞悉,号并将提出(,)或(,)的方案,即放弃号,而给号一枚金币,同时给号(或号)枚金币。由于号的这一方案对于号和号(或号)来说,相比号分配时更优,他们将投号的赞成票,再加上号自己的票,号的方案可获通过,枚金币可轻松落入囊中。这无疑是号能够获取最大收益的方案了!可以看出,这个推理过程就

4、先考虑简化的极端情况,从而顺藤摸瓜,得出最后的结果。另外,这其实是经济学中的博弈问题,号提出的方案就是这种情况下的纳什均衡。,海盗分宝石,第十二章:博弈及其应用,量化战略决策: 如图,某城市被三条河分割成为A, B, C 三个区,城市人口A区占40,B区占30,C区占30。 目前,该城市没有长途汽车站,甲乙两个公司计划建长途汽车站,甲公司计划建两个长途汽车站,乙公司计划建一个长途汽车站,每个公司都知道:如果某区有两个长途汽车站,那么这两个长途汽车站将平分该区业务;如果某区只有一个长途汽车站,那么这个长途汽车站将独占该区业务,如果某区没有长途汽车站,那么该区业务将平均分配到城市的三个长途汽车站每

5、个公司都希望更多的市场份额。 甲,乙两个公司的最优策略是什么?双方最优策略时两个公司市场份额各为多少?,第十二章:博弈及其应用,解:(1) 显然,公司甲不会把两个溜冰场建在同一个区。所以,两个公司策略各有三种:,公司甲,公司乙,第十二章:博弈及其应用,答案:公司甲的最优策略是在A区, B区各建一个长途汽车站或者在在A区, C区各建一个长途汽车站; 公司乙的最优策略是 在A区建一个长途汽车站。,策略1 A,策略3 C,策略2 B,如果公司乙采用策略1,则甲最高可能收益70,如果公司甲采用策略1,则无论乙如何,甲最低 可能收益70,公司甲的 损益,如果公司乙C区,甲B C区甲收益72,第十二章:博

6、弈及其应用,(2 )这个对策有两个鞍点a11 和 a21 公司甲的最优纯策略是 策略1 或者 策 略2,即在A区, B区各建一个溜冰场或者在在A区, C区各建一个溜冰场; 公司乙的最优纯策略是 策略1, 即在A区建一个溜冰场。 对策值V=70, 双方最优策略时甲公司市场份额为70,乙公司市场份额为30,Max Min aij = Min Max aij = a11 = a21 =70,第十二章:博弈及其应用,从扑克游戏到诺贝尔奖,Introduction to Game Theory,第十二章:博弈及其应用,博弈论(game theory)是由美国数学家冯诺依曼(Von. Neumann)和经

7、济学家摩根斯坦(Morgenstern)于1944年创立的带有方法论性质的学科,它被广泛应用于经济学、军事、政治科学、人工智能、生物学、火箭工程技术等。在1994年,三位博弈论专家即数学家纳什(Nash,他的故事被好莱坞拍成了电影美丽心灵,该影片获得了2002年奥斯卡金像奖的四项大奖)、经济学家海萨尼(Harsanyi)和泽尔滕(Selten)因在博弈论及其在经济学中的应用研究上所作出巨大贡献而获得诺贝尔经济学奖。,第十二章:博弈及其应用,三位大师主要的贡献,1950年和1951年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解,并证明了均衡

8、解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。因为在现实世界中,非合作博弈要比合作博弈普遍得多。,Selten and Harsanyi,泽尔腾(1965)将纳什均衡的概念引入了动态分析,提出了“精炼纳什均衡”概念;以及进一步刻画不完全信息动态博弈的“完备贝叶斯纳什均衡”,而海萨尼则发展了刻画不完全信息静态博弈的“贝叶斯纳什均衡”(19671968)。总之,他俩进一步将纳什均衡动态化,加入了接近实际的不完全信息条件。他们的工作为后人继续发展博弈论,提供了基本思路和模型,三位大师主要的贡献,1996年,两位将博弈论应用于不对称信息下机制设计的经济学家莫里斯(Mirrlee

9、s)和维克里(Vickrey)、以及2001年三位经济学家阿克洛夫(Akerlof)、斯蒂格利茨(Stiglitz)和斯宾塞(Spence)因运用博弈论研究信息经济学所取得的成就而成为这两个年度的诺贝尔经济学奖得主。专家预计,近几年还会有更多的博弈论专家可能获得诺贝尔经济学奖。,第十二章:博弈及其应用,为什么博弈论在经济学领域会产生如此大的影响呢?这是因为博弈论改变了传统微观经济学的某些基本假设,从一个独特的视角帮助我们更加深刻地理解和把握经济现象,并指导更加有效的经济政策制订。博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。,第十二章:博弈及其应用,什么是博弈论:从“囚徒困境”

10、谈起,(引例)著名的“囚徒问题”:一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人甲和乙,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们1年刑期。但是,我可以和你做个交易。如果你单独坦白杀人的罪行,我只判你3个月的监禁,但你的同伙要被判10年刑。如果你拒不坦白,而被同伙检举,那么你就将被判10年刑,他只判3个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。” 显然最好的策略是

11、双方都抵赖,这样大家都只被判1年。 但是由于两人处于隔离的情况下无法串供。于是两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。 因为,每一方在选择策略时都没有“共谋”(串供),他们 只是选择对自己最有利的策略,而不考虑社会福利 或任何其他对手的利益。,双方最佳结果是:抗拒从宽。 实际结果往往是:坦白从宽, 牢底住穿,第十二章:博弈及其应用,甲,乙,乙,坦白,不坦白,坦白,不坦白,坦白,不坦白,(甲判刑1年,乙判刑1年),(甲判刑0.25年, 乙判刑10年),(甲判刑10年, 乙判刑0.25年),(甲判刑5年乙判刑5年) “纳什均衡”,对乙来说 ,尽管他不知道甲是选

12、择了“招”还是“不招”,他发现他自己选择“招”都是比选择“不招”为好的。因此,“不招”是相对于“招”的劣战略,他不会选择劣战略。所以,乙会选择“招”。 同样,根据对称性,甲也会选择“招”,结果是甲乙两人都“招”。甲和乙都不会选择劣战略“不招”,称为“剔除劣战略的占优战略均衡”。其中“招”是占优于(优于)“不招”的占优战略。,分类和主要思想,博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议。倘若不能,则称非合作博弈 。 合作博弈强调的是集体主义,团体理性 ,是效率、公平、公正;,第十二章:博弈及其应用,非合作博弈,而

13、非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果是有时有效率,有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡。,第十二章:博弈及其应用,非合作博弈例子,比如两家企业、合作建设一条的生产线,协议由方提供生产的技术,方则提供厂房和设备。在对技术和设备进行资产评估时就形成非合作博弈,因为每一方都试图最大化己方的评估值,这时方如果能够获得方关于技术的真实估价或参考报价这类竞争情报,则可以使自己在评估中获得优势;同理,方也是一样。至于自己的资产评估是否会影响合作企

14、业的总体运行效率这样的“集体利益“,则不会非常重视。这就是非合作博弈,参与人在选择自己的行动时,优先考虑的是如何维护自己的利益。,第十二章:博弈及其应用,博弈的分类及对应的均衡,第十二章:博弈及其应用,第十二章:博弈及其应用,囚徒困境博弈虽然简单,但是却体现了非合作博弈的基础,称(招,招)为 “纳什均衡”。纳什均衡是局中人策略选择上构成的一种“僵局”,给定其他局中人的选择不变,任何一个局中人的选择是最好的,他也不会改变其策略选择。所以,可以预期(招,招)是甲乙最终完成的稳定的选择。 同时囚徒困境也是西方经济学中个人理性与集体理性冲突的一个例证。 我们可以利用这个道理来分析日常生活中的许多不合作

15、现象,第十二章:博弈及其应用,类似的例子还有: 渤海中的鱼愈来愈少了,工业化中的大气及河流污染,森林植被的破坏等。解决公共资源过度利用的出路是政府制订相应的规制政策加强管理,如我国政府规定海洋捕鱼中,每年有一段时间的“休渔期”,此时禁止捕鱼,让小鱼苗安安静静地生长,大鱼好好地产卵,并对鱼网的网眼大小作出规定,禁用过小网眼的捕网打鱼,保护幼鱼的生存。又如在三峡库区,为了保护库区水体环境,关闭了前些年泛滥成灾的许多小造纸厂等。,第十二章:博弈及其应用,公共地养羊,MAX 养羊数量,每只羊产生的效益,养羊数量,囚徒模型的应用:十字路口两个家用电器商店,相同产品,独立定价,双方按高价比双方按低价获利大,但比不上单方降价。本来双方商定按高价,但实际可能单方降价,第十二章:博弈及其应用,对甲来说 ,尽管他不知道乙是选择了“降”还是“不降”,他发现他自己选择“降

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > PPT模板库 > PPT素材/模板

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号