博弈论与信息经济学初步剖析.

上传人:今*** 文档编号:107178751 上传时间:2019-10-18 格式:PPT 页数:240 大小:3.92MB
返回 下载 相关 举报
博弈论与信息经济学初步剖析._第1页
第1页 / 共240页
博弈论与信息经济学初步剖析._第2页
第2页 / 共240页
博弈论与信息经济学初步剖析._第3页
第3页 / 共240页
博弈论与信息经济学初步剖析._第4页
第4页 / 共240页
博弈论与信息经济学初步剖析._第5页
第5页 / 共240页
点击查看更多>>
资源描述

《博弈论与信息经济学初步剖析.》由会员分享,可在线阅读,更多相关《博弈论与信息经济学初步剖析.(240页珍藏版)》请在金锄头文库上搜索。

1、导言 博弈论概述,引言,博弈的思想古已有之 博弈理论是当代经济学不可或缺的重要组成部分 博弈思想及理论已被广泛应用于对各类经济和社会现象的分析中 博弈理论丰富了人们认识世界的角度和工具,第一节:博弈的定义和实例,博弈论(Game Theory)又名对策论 博弈理论原本是运筹学的一个重要分支。 目前博弈论已发展为一门备受关注的独立学科。 博弈的定义 “博弈”指当两个或多个决策主体之间存在相互作用,任何一方的决策策略(Strategy)都不能完全独立于其他各方策略时,各方的决策过程及均衡问题。,博弈实例1:锤头、剪刀、布,博弈参与者:两名同学 博弈过程: 两人在“锤子、剪刀、布”三种策略中选择一种

2、。 如果两人的策略一样,则平局。 出“锤子”一方胜过出“剪刀”一方。 出“剪刀”一方胜过出“布”一方 出“布”一方胜过出“锤子”一方 博弈双方策略相互依赖,不独立。,博弈实例2:聚会,博弈参与者:两个人 博弈过程: 两人在校门口集合,一起逛博物馆 博弈策略和结果 两人都去南门,成功碰面 两人都去北门,成功碰面 同学甲去南门,同学乙去北门,两人错过 同学甲去北门,同学乙去南门,两人错过 博弈双方策略相互依赖,不独立。,其他博弈实例,棋类比赛:象棋、围棋等。古人“对弈”。 寡头市场: 产量博弈模式 价格博弈模式 领先者、跟随者博弈模式 大国之间关于汇率政策的博弈 经典博弈实例:囚徒困境(Priso

3、ners Dilemma),囚徒困境,警方逮捕了甲、乙两名犯罪嫌疑人 警方分开审讯两人 根据“坦白从宽、抗拒从严”的原则: 如甲、乙均坦白,则两人将分别被判处 5 年有期徒刑 如甲坦白、乙不坦白,则甲被判 1 年、乙被判 10 年徒刑 如甲不坦白、乙坦白,则甲被判 10 年、乙被判 1 年徒刑 如甲、乙均不坦白,则两人将分别被判处 2 年有期徒刑,甲、乙二人独立决策 对甲而言,不管乙选择坦白还是不坦白,甲的最优策略都是坦白。 对乙而言,不管甲选择坦白还是不坦白,乙的最优策略都是坦白。 结果:甲、乙均选择坦白,分别被判处 5 年有期徒刑 甲、乙如均不坦白,则分别被判处 2 年有期徒刑 个体理性与

4、集体理性的冲突 囚徒困境,中国古人思想中的“博弈”智慧,战国策:田忌赛马 马分为上、中、下三等 我方上等马 vs. 对方中等马 我方中等马 vs. 对方下等马 我方下等马 vs. 对方上等马 三局两胜,田忌胜出 正确运用战略,也是取胜的重要因素之一,第二节:博弈的构成要素,完整的博弈通常包含四个构成要素 博弈参与者(Player) 博弈策略(Strategy) 博弈的收益(Payoff) 博弈的均衡(Equilibrium),一、博弈参与者(Player) 博弈参与者指参与博弈的主体 在“锤头、剪刀、布”博弈中,博弈参与者是玩游戏的两个人 两名同学去相约去博物馆博弈中,博弈参与者是两名同学 在

5、“囚徒困境”博弈中,博弈参与者是两名犯罪嫌疑人 博弈参与者可能是单个的个人,也可能是组织或集体 企业、社会团体、国家 博弈参与者可能多于两方,三方或多方博弈参与者,二、博弈策略(Strategy) 博弈策略指博弈参与者可以采取的行动 在“锤头、剪刀、布”博弈中,博弈参与者所能采取的博弈策略均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中,博弈参与者所能采取的博弈策略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中,博弈参与者所能采取的博弈策略均为“坦白”或“不坦白”,三、博弈的收益(Payoff) 博弈收益指不同博弈策略给博弈参与者带来的利益 在“锤头、剪刀、布”博

6、弈中,博弈参与者得到的收益是:赢、平局、输三种可能的结果。 两名同学去相约去博物馆博弈中,博弈参与者得到的收益是:能够相遇、不能够相遇两种可能的结果。 在“囚徒困境”博弈中,博弈参与者得到的收益是 如果甲、乙都坦白,则甲、乙均得到 5 年徒刑 如果甲、乙都不坦白,则甲、乙均得到 2 年徒刑 如果甲坦白、乙不坦白,则甲得到 1 年、乙得到 10 年有期徒刑 如果甲不坦白、乙坦白,则甲得到 10 年、乙得到 1年有期徒刑,四、博弈的均衡(Equilibrium) 博弈的均衡指所有参与者最优策略的组合 两名同学去相约去博物馆博弈中,博弈均衡有两个 两个同学都去学校南门 两个同学都去学校北门 在“囚徒

7、困境”博弈中,博弈均衡有一个 嫌疑人甲和嫌疑人乙都坦白,博弈的思想古已有之 孙子兵法、三国演义等中国古典名著都蕴含着丰富的博弈智慧 当代博弈理论的研究源于西方 一、博弈理论的发展历史 20 世纪初,塞梅鲁(Zermelo)、鲍罗(Borel)和冯 诺依曼(Von Neumann)开始研究博弈的数学表达方式,第三节:博弈论的发展历史和分类,一、博弈理论的发展历史(续) 1944 年,冯 诺依曼( Von Neumann)和经济学家奥斯卡 摩根斯坦(Oskar Morgenstern)合作发表了博弈理论与经济行为一书,使博弈的理论和思想进入经济学领域。 1950、1951 年,约翰 纳什(John

8、 Nash)利用不动点定理证明了博弈均衡的存在性,为博弈论奠定了坚实的理论基础。 20 世纪 70 年代,约翰 海萨尼(John Harsanyi)和莱因哈德 泽尔腾(Reinhard Selten)等将不完全信息理论融入到博弈论的研究中。 20 世纪 90 年代之后,博弈论作为一种方法被普遍运用到经济学、政治学、生物学、军事学、统计学等领域中。 博弈理论已成为当代经济学理论不可分割的重要组成部分。,根据博弈参与者能否达成相互合作的和约束性协议 合作博弈(Cooperative Games) 非合作博弈(Non-Cooperative Games) 完全信息静态博弈(Static Game w

9、ith Complete Information) 完全信息动态博弈( Dynamic Game with Complete Information) 不完全信息静态博弈(Static Game with Incomplete Information) 不完全信息动态博弈( Dynamic Game with Incomplete Information),二、博弈的分类,约翰 纳什(John Nash)1928 年 6 月出生于美国一个中产阶级家庭 纳什自幼便显露出过人的数学天赋 1948 年,纳什在普林斯顿大学攻读博士学位 1950 年至 1953 年,纳什撰写了多篇在博弈论研究领域颇具开

10、创性和奠基性的论文。 纳什的论文对合作博弈和非合作博弈进行了明确定义和区分,博弈论大师约翰 纳什简介,纳什对非合作博弈均衡进行了独到精辟的阐述 对合作博弈的博弈过程及策略选择进行了系统的归纳和证明 纳什的思想对日后博弈理论的发展影响深远 以纳什的名字命名的“纳什均衡” 尽管不得不时常与医院、药物和孤独为伴,但纳什仍然一如既往的进行着他所痴迷的研究工作。 1994 年,因为在博弈理论方面的突出贡献,纳什获得了当年度的诺贝尔经济学奖,1多人博弈的均衡(Equilibrium points in n-person games) 国家科学院学报(Proceedings National Academy

11、 of Sciences),36: 48 49,1950年。 2非合作博弈(Non-cooperative games),纳什就读于普林斯顿大学数学系的博士毕业论文,1950年。 3讨价还价问题(The bargaining problem)。计量经济学杂志(Econometrica)18: 155 162,1950年。 4非合作博弈(Non-cooperative games)数学年报(Annals of Mathematics),54: 286 295,1951年。 5两人合作博弈(Two-person cooperative games)。计量经济学杂志(Econometrica),21

12、: 128 140,1951年。,纳什的代表作,第一部分 完全信息静态博弈,在完全信息静态博弈中,博弈各参与方同时行动,且对博弈相关信息完全了解。 “划横线法”是求解完全信息静态博弈的常用方法。 通常说来,完全信息静态博弈都存在“纳什均衡”或“混合策略纳什均衡”。,第一节 定义和求解方法,一、完全信息静态博弈的定义和实例 完全信息静态博弈指:博弈各方同时决策,任何博弈参与者对博弈信息均完全了解。博弈信息包括:博弈过程、博弈结果、博弈各方的策略集、收益等。 可以通过支付矩阵(Payoff Matrix)寻找完全信息静态博弈的均衡。 以“囚徒困境”为例,介绍支付矩阵的构造方法和应用。,1囚徒困境,

13、在“囚徒困境”博弈中,有两个博弈参与者:嫌疑人甲和嫌疑人乙。 将嫌疑人甲标识在支付矩阵左侧,将嫌疑人乙标识在支付矩阵上方 。 嫌疑人甲有两个策略可以选择:坦白、不坦白。将嫌疑人甲可能的策略纵向排列在博弈支付矩阵左侧。 嫌疑人乙也有两个策略可以选择:坦白、不坦白。将嫌疑人乙可能的策略横向排列在博弈支付矩阵上方。,“囚徒困境”博弈的支付矩阵,矩阵左上方的(5,5)表示:当嫌疑人甲选择“坦白”、嫌疑人乙选择“坦白”时,两名嫌疑人能够得到的收益。按照惯例,括号内逗号前面的数字“5”表示嫌疑人甲的收益。括号内逗号后面的数字“5”表示嫌疑人乙的收益。,矩阵左下方的(10,1)表示:当嫌疑人甲选择“不坦白”

14、、嫌疑人乙选择“坦白”时,两名嫌疑人能够得到的收益。 矩阵右上方的(1,10)表示:当嫌疑人甲选择“坦白”、嫌疑人乙选择“不坦白”时,两名嫌疑人能够得到的收益。 矩阵右下方的(2,2)表示:当嫌疑人甲选择“不坦白”、嫌疑人乙选择“不坦白”时,两名嫌疑人能够得到的收益。,2智猪博弈,猪栏里养了两头猪,一头大猪、一头小猪。 在猪圈的一端有一个盛食槽。 在猪圈的另一端有一个按压式开关。 开关每被按压一次,就有固定数量的食物出现在盛食槽中。 大猪和小猪都在思考是否去按压开关。,如果大猪和小猪都去按压开关,然后两头猪从开关处奔向猪圈另一端的盛食槽。由于大猪跑的快,小猪跑得慢,因此大猪会比小猪早到达盛食槽

15、并把盛食槽内的食物吃光。小猪付出了按压开关的劳动却没有吃到食物。在此种情况下,大猪的收益为 5,小猪的收益为 -1。 如果大猪去按压开关,小猪在盛食槽旁等待。那么当大猪按下开关后,盛食槽内出现食物,小猪立即开始吃,大猪则需要花一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后,身强力壮的大猪会把小猪挤到一旁,吃光剩余的食物。在这种情况下,大猪得到的收益是 4,小猪得到的收益是 2。,如果小猪去按压开关,大猪在盛食槽旁等待。那么当小猪按下开关后,大猪开始吃,即使当小猪从开关处跑到盛食槽旁后,大猪仍然会霸占着食物,将食物全部吃光,小猪只能无可奈何地被挤在一旁。在这种情况下,大猪可以不劳而获,得到的收

16、益为 10。小猪徒劳无功,看到大猪不劳而获,更增加了小猪的郁闷,小猪得到收益 -2。 如果大猪和小猪都不去按压开关,则大猪和小猪都无法吃到食物,大猪和小猪均得到收益 0。,“智猪博弈”的支付矩阵,二、划横线法,1通过“划横线法”求解“囚徒困境”博弈的均衡,如果嫌疑人乙选择坦白,那么嫌疑人甲应该如何选择? 理性的嫌疑人甲会选择坦白。 在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。 类似可分析其他情况,2通过“划横线法”求解“智猪博弈”的均衡,如果大猪选择按开关,那么小猪应该如何选择? 理性的小猪会选择等待。 在小猪选择等待所对应的收益“2”的下方划一道短横线。 类似可分析其他情况,第二节 纳什均衡,一、纳什均衡的定义 给定其他参与者在博弈均衡时的策略,任何博弈参与者都没有动机改变自己在博弈均衡时的策略选择。这样的均衡被称为“纳什均衡”(Nash Equilibrium)。,“囚徒困境”博弈的纳什均衡为:(嫌疑人甲选择坦白、嫌疑人乙选择坦白)。 给定嫌疑人乙在纳什均衡的策略选择:坦白;嫌疑

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号