博弈论基础知识幻灯片

上传人:子 文档编号:51963647 上传时间:2018-08-17 格式:PPT 页数:80 大小:403.50KB
返回 下载 相关 举报
博弈论基础知识幻灯片_第1页
第1页 / 共80页
博弈论基础知识幻灯片_第2页
第2页 / 共80页
博弈论基础知识幻灯片_第3页
第3页 / 共80页
博弈论基础知识幻灯片_第4页
第4页 / 共80页
博弈论基础知识幻灯片_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《博弈论基础知识幻灯片》由会员分享,可在线阅读,更多相关《博弈论基础知识幻灯片(80页珍藏版)》请在金锄头文库上搜索。

1、经济博弈论方法 第四部分1第六章 完全信息静态博弈n博弈的基本概念n纳什均衡n纳什均衡应用n混合策略和混合策略纳什均衡2n伐木工人的决策和一个将军的决策有什 么不同?n木头没有反抗。n将军的每一步计划都会引来抵抗,他必 须克服这种抵抗。n你!你的对手、竞争者都是聪明有主见 的!3n社会科学研究策略性决策制定过程的分 支称为 博弈论。n严格讲,博弈论不是经济学的一个分支 ,它是一种方法,涉及到很多领域:n实际上,博弈论是数学的一个分支。4策略故事n妙手传奇n给猫拴个铃铛n多管齐下n三思而后行5引言n博弈论n诺贝尔经济学奖n纳什(Nash) (1950-1951)n泽尔腾(selten) (196

2、5,1975)n海萨尼(Harsanyi) (1967-1968)n共同获得1994年诺贝尔经济学奖6数学界的梵高“疯子天才”纳什 7三位大师主要的贡献1950年和1951年纳什的两篇关于非合作 博弈论的重要论文,彻底改变了人们对 竞争和市场的看法。他证明了非合作博 弈及其均衡解,并证明了均衡解的存在 性,即著名的纳什均衡。从而揭示了博 弈均衡与经济均衡的内在联系。因为在 现实世界中,非合作博弈要比合作博弈 普遍得多。 8Selten and Harsanyin泽尔腾(1965)将纳什均衡的概念引入了动 态分析,提出了“精炼纳什均衡”概念;以及 进一步刻画不完全信息动态博弈的“完备贝叶 斯纳什

3、均衡”。n而海萨尼则发展了刻画不完全信息静态博弈 的“贝叶斯纳什均衡”(19671968)。总之 ,他俩进一步将纳什均衡动态化,加入了接 近实际的不完全信息条件。他们的工作为后 人继续发展博弈论,提供了基本思路和模型 。9诺贝尔经济学奖n1968年,瑞典中央银行成立300周 年,是为了纪念诺贝尔奖奖金提供 者,设立诺贝尔经济学奖。n1969年开始颁发。10从游戏到博弈n游戏的特点:下棋,打牌,赌胜,田径 ,球类等等,共同的特点是策略 策略的好坏决定游戏的结果n游戏的特征:规则,结果,策略,策略 和利益的依存性11什么是博弈论?n博弈论:就是关于包含相互依存情况中理 性行为的研究。n相互依存 :

4、通常是指博弈中的任何一个局 中人受到其他局中人的行为的影响,反过 来,他的行为也影响到其他局中人。 n相互依存的另一个方面是局中人可以有某 些共同的兴趣或利益所在。 n“理性行为”的说明:博弈论中的所谓理性 ,一般不是指道德标准。 12博弈三要素n博弈方(局中人)-参与博弈但利益不完 全一致者。有二人博弈与多人博弈之分。n策略集-每个局中人都会有一系列的策略 可选,称为对应于每个局中人的策略集。 有限和无限个对策。n得益-在每策略组合下每一局中人的得益 情况,是选择策略的标准,称为得益函数 或支付函数。13博弈的关键局中人理性地采取或选择自己的策略 行为,在相互制约相互影响的依存关系 中,尽可

5、能的提高自己的利益所得,这 样,博弈论就是关于包含相互依存情况 中理性行为的研究。相互依存 理性行为14博弈的四种分类情况n完全信息静态博弈n完全信息动态博弈n不完全信息静态博弈n不完全信息动态博弈15博弈的分类及对应的均衡静态动态 完全 信息完全信息静态博弈; 纳什均衡; Nash(1950)完全信息动态博弈; 子博弈精炼纳什均衡 ;泽尔腾(1965)不完 全信 息不完全信息静态博弈; 贝叶斯纳什均衡; 海萨尼(1967-1968)不完全信息动态博弈 , 精炼贝叶斯纳什均衡 ; 泽尔腾(1975) Kreps,Wilson(1982), Fudenberg,Tirole(1991)16纳什均

6、衡n纳什均衡的定义n纳什均衡的一致预测性n纳什均衡与严格下策反复消去法17纳什均衡的定义各博弈方都不愿或不会单独改变自己 策略的策略组合,只要这种策略组合 存在且是唯一的,博弈就有绝对确定 的解。这种各博弈方都不愿单独改变 策略的策略组合就是博弈论中最重要 的一个概念“纳什均衡”。18我们常用G表示一个博弈; 如G有n个博 弈方,每个博弈方的全部可选策略的集 合我们称策略空间,分别用 表示 ; 用 表示博弈方i的第j个策略,其 中j可取有限个值(有限策略博弈),也可 取无限个值(无限策略博弈);博弈方i的 得益则用 表示, 是各博弈方策略的多 元函数。n个博弈方的博弈G常写成19定义在博弈 中

7、,如果 由各个博弈方的各一个策略组成的某个策略组 合 中,任一博弈方i的策略 ,都 是对其余博弈方策略的组合的最佳策略,即对任意 都成立,则称 为G 的一个“纳什均衡”。 20纳什均衡的一致预测性如果所有博弈方预测到一个特定的纳什 均衡将会出现,那么,没有人有兴趣作 不同的选择。纳什均衡的特征:博弈方预测到均衡, 博弈方预测到其他博弈方预测到均衡, 等等。一致性预测,并不意味着纳什均衡一定 是一个好的预测。 21纳什均衡应用两个嫌犯受到指控,但除非至少一个招认 ,否则警方不能将二人判有罪。警察把二 人分别带到不同的房间,告之后果:如果二人均不坦白,将被判入狱一年。如果双方均坦白,将被判入狱5年

8、。如果一方坦白,另一方不坦白,坦白一 方立即释放,另一方判入狱8年。 22囚徒2囚徒1不坦白坦白不坦白1,18, 0坦白0,85,523囚徒困境说明了什么n在(坦白、坦白)这个组合中,和都不能 通过单方面的改变行动增加自己的收益,于是 谁也没有动力游离这个组合,因此这个组合是 纳什均衡,也叫非合作均衡。n囚徒困境反映了个人理性和集体理性的矛盾。 如果和都选择不坦白,各判刑年,显然 比都选择坦白各判刑年好得多。当然,和 可以在被警察抓到之前订立一个“攻守同盟” ,但是这可能不会有用,因为它不构成纳什均 衡,没有人有积极性遵守这个协定,显然最好 的策略是双方都不坦白。 24囚徒困境的意义“囚徒的两

9、难选择”有着广泛而深刻的意 义。个人理性与集体理性的冲突,各人 追求利己行为而导致的最终结局是一个“ 纳什均衡”,也是对所有人都不利的结局 。他们两人都是在坦白与不坦白策略上 首先想到自己,这样他们必然要服长的 刑期。只有当他们都首先替对方着想时 ,或者相互合谋(串供)时,才可以得到 最短时间的监禁的结果。 25双寡头削价竞争寡头2高价 低价 寡 高价 头 2 低价100,10020,150150,2070,7026对经典经济学的冲击n“纳什均衡”首先对亚当斯密的“看不见 的手”的原理提出挑战。按照斯密的理论 ,在市场经济中,每一个人都从利己的 目的出发,而最终全社会达到利他的效 果。n国富论

10、:“通过追求(个人的)自身利 益,他常常会比其实际上想做的那样更 有效地促进社会利益。”27n从“纳什均衡”我们引出了“看不见的手” 的原理的一个悖论:从利己目的出发, 结果损人不利己,既不利己也不利他。 两个囚徒的命运就是如此。从这个意义 上说,“纳什均衡”提出的悖论实际上动 摇了西方经济学的基石。 28研究囚徒困境问题的目的利用这种困境达到有利于社会的目 的政府在经济活动中的组织协调工作 的必要性避免囚徒困境29混合策略纳什均衡n混合策略n混合策略博弈n混合策略纳什均衡n混合策略和严格下策反复消去法30许多现实中决策问题构成的博弈中根本 不存在具有稳定性的各博弈方都接受的 纳什均衡策略组合

11、如猜硬币博弈和齐威 王田忌赛马,而另一些博弈却有多于一 个的纳什均衡策略组合,如夫妻之争博 弈。这两类博弈如果只进行一次,实际 结果如何确实取决于机会和运气,如果 多次独立反复进行这些博弈,这样博弈 方决策的好坏就会从平均得益上反映出 来,策略运用得当平均收益会较理想, 至少是不吃亏,否则平均得益就会很差 。31概念的引进32在这种博弈中各博弈方决策的第一个 原则:自己的策略选择千万不能预先 被另一方侦知或猜到。这就是说博弈方必须随机地选择策略 。其次,在本博弈中,如果盖硬币方虽 然是随机决定出正面还是反面,但如 果在总体上出正面多于出反面,即出 正面的概率大于出反面的概率,则猜 硬币方还是有

12、机可乘。33设盖硬币方出正面的概率为p,则出反 面的概率为1-p出正面多于出反面 ,即p1-p或p12。在这种情况 下,如猜硬币方全猜正面,则他的期 望得益:即平均来讲,猜硬币方一定是赢多输少 。34双方都按照上述概率随机选择策略,即 在本博弈中,博弈方的决策内容不是确 定性的具体的策略,而是在一些策略中 随机选择的概率分布,这样的决策我们 称为“混合策略”。35定义在博弈 中;博 弈方i的策略空间为 ,则 博弃方i以概率分布 随 机在其k个可选策略中选择的“策略”,称 为一个“混合策略”,其中 都成立,且36相对于这种以一定概率分布在一些策略 中随机选择的混合策略,确定性的具 体的策略我们称

13、为“纯策略”,而我们原 来意义上的纳什均衡,即任何博弈方 都不愿单独改变策略的纯策略组成的 策略组合现在可称为“纯策略纳什均衡” 。当然,纯策略也可以看作混合策略 的特例。 37纯策略可以看作,选择相应纯策略 的概率为1,选择其余纯策略的概率 为0的混合策略。混合策略可以看作 纯策略的扩展。38引进了混合策略的概念以后,我们可将 纳什均衡的概念扩大到包括混合策略 的情况。对各博弈方的一个策略组合 ,不管它是纯策略组成的还是混合策 略组成的,只要满足各博弈方都不会 想要单独偏离它,我们就称之为一个 纳什均衡。如果确实是一个严格意义 上的混合策略组合构成的纳什均衡, 称为“混合策略纳什均衡”。 3

14、9猜硬币博弈中两博弈方都以(1/2,1/2)的概 率分布随机选择正面和反面的混合策略组合, 就是一个混合策略纳什均衡。期望得益:零和博弈!40应用例子41本博弈中两博弈方决策的第一个原则是 不能让对方知道或猜到自己的选择,因 而必须在决策时利用随机性。第二个原 则是他们选择每种策略的概率一定要恰 好使对方无机可乘。42设博弈方1选A的概率为pA,选B的概率为pB ,博弃方2选C的概率为pC,选D的概率为 pD。根据上述第二个原则,博弈方1选A和B 的概率,一定要使博弈方2选C的期望得益和 选D的期望得益相等,即:这是博弈方1的混合策略。 43同理,博弈方2的混合策略为博弈方1以(0.8,0.2

15、)的概率随机选择A和 B,博弈方2以(0.8,0.2)的概率随机选择 C和D,由于这时谁都无法通过改变自 己的混合策略(概率 分布)而改善自己的 得益(期望得益)、因此这样的混合策略 组合是稳定的,是一个混合策略纳什均 衡。44该混合策略纳什均衡的期望结果(即双方 的期望得益)分别为: 45虽然单独一次博弈的结果可能是四 组得益中的任何一组但是多次独 立重复博弈的平均结果却应该是双 方各得2.6。 46混合策略和混合策略均衡的概念不仅 可用在不存在纯策略纳什均衡的博弈 问题中(这种问题各博弈方之间的利益 总是有一定的对立性),在没有确定性 结果的博弈、即存在多个纯策略纳什 均衡的博弈(这种博弈中博弈方之间的 利益有相当的一致性)中也可运用。 47第七章 完全信息动态博弈n完全且完美信息动态博弈n子博弈完美纳什均衡n应用举例48动态博弈的表示法和特点n 阶段和表示法n动态博弈的基本特点49阶段动态博弈中一个博弈方的一次行为称为 一个“阶段”。由于每

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号