博弈论与信息经济学初步剖析.

资源描述

《博弈论与信息经济学初步剖析.》由会员分享，可在线阅读，更多相关《博弈论与信息经济学初步剖析.（240页珍藏版）》请在金锄头文库上搜索。

1、导言博弈论概述,引言,博弈的思想古已有之博弈理论是当代经济学不可或缺的重要组成部分博弈思想及理论已被广泛应用于对各类经济和社会现象的分析中博弈理论丰富了人们认识世界的角度和工具,第一节：博弈的定义和实例,博弈论（Game Theory）又名对策论博弈理论原本是运筹学的一个重要分支。目前博弈论已发展为一门备受关注的独立学科。博弈的定义 “博弈”指当两个或多个决策主体之间存在相互作用，任何一方的决策策略（Strategy）都不能完全独立于其他各方策略时，各方的决策过程及均衡问题。,博弈实例1：锤头、剪刀、布,博弈参与者：两名同学博弈过程：两人在“锤子、剪刀、布”三种策略中选择一种

2、。如果两人的策略一样，则平局。出“锤子”一方胜过出“剪刀”一方。出“剪刀”一方胜过出“布”一方出“布”一方胜过出“锤子”一方博弈双方策略相互依赖，不独立。,博弈实例2：聚会,博弈参与者：两个人博弈过程：两人在校门口集合，一起逛博物馆博弈策略和结果两人都去南门，成功碰面两人都去北门，成功碰面同学甲去南门，同学乙去北门，两人错过同学甲去北门，同学乙去南门，两人错过博弈双方策略相互依赖，不独立。,其他博弈实例,棋类比赛：象棋、围棋等。古人“对弈”。寡头市场：产量博弈模式价格博弈模式领先者、跟随者博弈模式大国之间关于汇率政策的博弈经典博弈实例：囚徒困境（Priso

3、ners Dilemma）,囚徒困境,警方逮捕了甲、乙两名犯罪嫌疑人警方分开审讯两人根据“坦白从宽、抗拒从严”的原则：如甲、乙均坦白，则两人将分别被判处 5 年有期徒刑如甲坦白、乙不坦白，则甲被判 1 年、乙被判 10 年徒刑如甲不坦白、乙坦白，则甲被判 10 年、乙被判 1 年徒刑如甲、乙均不坦白，则两人将分别被判处 2 年有期徒刑,甲、乙二人独立决策对甲而言，不管乙选择坦白还是不坦白，甲的最优策略都是坦白。对乙而言，不管甲选择坦白还是不坦白，乙的最优策略都是坦白。结果：甲、乙均选择坦白，分别被判处 5 年有期徒刑甲、乙如均不坦白，则分别被判处 2 年有期徒刑个体理性与

4、集体理性的冲突囚徒困境,中国古人思想中的“博弈”智慧,战国策：田忌赛马马分为上、中、下三等我方上等马 vs. 对方中等马我方中等马 vs. 对方下等马我方下等马 vs. 对方上等马三局两胜，田忌胜出正确运用战略，也是取胜的重要因素之一,第二节：博弈的构成要素,完整的博弈通常包含四个构成要素博弈参与者（Player）博弈策略（Strategy）博弈的收益（Payoff）博弈的均衡（Equilibrium）,一、博弈参与者（Player）博弈参与者指参与博弈的主体在“锤头、剪刀、布”博弈中，博弈参与者是玩游戏的两个人两名同学去相约去博物馆博弈中，博弈参与者是两名同学在

5、“囚徒困境”博弈中，博弈参与者是两名犯罪嫌疑人博弈参与者可能是单个的个人，也可能是组织或集体企业、社会团体、国家博弈参与者可能多于两方，三方或多方博弈参与者,二、博弈策略（Strategy）博弈策略指博弈参与者可以采取的行动在“锤头、剪刀、布”博弈中，博弈参与者所能采取的博弈策略均为“锤头”、“剪刀”或“布” 两名同学去相约去博物馆博弈中，博弈参与者所能采取的博弈策略均为“去学校南门集合”或“去学校北门集合” 在“囚徒困境”博弈中，博弈参与者所能采取的博弈策略均为“坦白”或“不坦白”,三、博弈的收益（Payoff）博弈收益指不同博弈策略给博弈参与者带来的利益在“锤头、剪刀、布”博

6、弈中，博弈参与者得到的收益是：赢、平局、输三种可能的结果。两名同学去相约去博物馆博弈中，博弈参与者得到的收益是：能够相遇、不能够相遇两种可能的结果。在“囚徒困境”博弈中，博弈参与者得到的收益是如果甲、乙都坦白，则甲、乙均得到 5 年徒刑如果甲、乙都不坦白，则甲、乙均得到 2 年徒刑如果甲坦白、乙不坦白，则甲得到 1 年、乙得到 10 年有期徒刑如果甲不坦白、乙坦白，则甲得到 10 年、乙得到 1年有期徒刑,四、博弈的均衡（Equilibrium）博弈的均衡指所有参与者最优策略的组合两名同学去相约去博物馆博弈中，博弈均衡有两个两个同学都去学校南门两个同学都去学校北门在“囚徒

7、困境”博弈中，博弈均衡有一个嫌疑人甲和嫌疑人乙都坦白,博弈的思想古已有之孙子兵法、三国演义等中国古典名著都蕴含着丰富的博弈智慧当代博弈理论的研究源于西方一、博弈理论的发展历史 20 世纪初，塞梅鲁（Zermelo）、鲍罗（Borel）和冯诺依曼（Von Neumann）开始研究博弈的数学表达方式,第三节：博弈论的发展历史和分类,一、博弈理论的发展历史（续） 1944 年，冯诺依曼（ Von Neumann）和经济学家奥斯卡摩根斯坦（Oskar Morgenstern）合作发表了博弈理论与经济行为一书，使博弈的理论和思想进入经济学领域。 1950、1951 年，约翰纳什（John

8、 Nash）利用不动点定理证明了博弈均衡的存在性，为博弈论奠定了坚实的理论基础。 20 世纪 70 年代，约翰海萨尼（John Harsanyi）和莱因哈德泽尔腾（Reinhard Selten）等将不完全信息理论融入到博弈论的研究中。 20 世纪 90 年代之后，博弈论作为一种方法被普遍运用到经济学、政治学、生物学、军事学、统计学等领域中。博弈理论已成为当代经济学理论不可分割的重要组成部分。,根据博弈参与者能否达成相互合作的和约束性协议合作博弈（Cooperative Games）非合作博弈（Non-Cooperative Games）完全信息静态博弈（Static Game w

9、ith Complete Information）完全信息动态博弈（ Dynamic Game with Complete Information）不完全信息静态博弈（Static Game with Incomplete Information）不完全信息动态博弈（ Dynamic Game with Incomplete Information）,二、博弈的分类,约翰纳什（John Nash）1928 年 6 月出生于美国一个中产阶级家庭纳什自幼便显露出过人的数学天赋 1948 年，纳什在普林斯顿大学攻读博士学位 1950 年至 1953 年，纳什撰写了多篇在博弈论研究领域颇具开

10、创性和奠基性的论文。纳什的论文对合作博弈和非合作博弈进行了明确定义和区分,博弈论大师约翰纳什简介,纳什对非合作博弈均衡进行了独到精辟的阐述对合作博弈的博弈过程及策略选择进行了系统的归纳和证明纳什的思想对日后博弈理论的发展影响深远以纳什的名字命名的“纳什均衡” 尽管不得不时常与医院、药物和孤独为伴，但纳什仍然一如既往的进行着他所痴迷的研究工作。 1994 年，因为在博弈理论方面的突出贡献，纳什获得了当年度的诺贝尔经济学奖,1多人博弈的均衡（Equilibrium points in n-person games）国家科学院学报（Proceedings National Academy

11、 of Sciences），36: 48 49，1950年。 2非合作博弈（Non-cooperative games），纳什就读于普林斯顿大学数学系的博士毕业论文，1950年。 3讨价还价问题（The bargaining problem）。计量经济学杂志（Econometrica）18: 155 162，1950年。 4非合作博弈（Non-cooperative games）数学年报（Annals of Mathematics），54: 286 295，1951年。 5两人合作博弈（Two-person cooperative games）。计量经济学杂志（Econometrica），21

12、: 128 140，1951年。,纳什的代表作,第一部分完全信息静态博弈,在完全信息静态博弈中，博弈各参与方同时行动，且对博弈相关信息完全了解。 “划横线法”是求解完全信息静态博弈的常用方法。通常说来，完全信息静态博弈都存在“纳什均衡”或“混合策略纳什均衡”。,第一节定义和求解方法,一、完全信息静态博弈的定义和实例完全信息静态博弈指：博弈各方同时决策，任何博弈参与者对博弈信息均完全了解。博弈信息包括：博弈过程、博弈结果、博弈各方的策略集、收益等。可以通过支付矩阵（Payoff Matrix）寻找完全信息静态博弈的均衡。以“囚徒困境”为例，介绍支付矩阵的构造方法和应用。,1囚徒困境,

13、在“囚徒困境”博弈中，有两个博弈参与者：嫌疑人甲和嫌疑人乙。将嫌疑人甲标识在支付矩阵左侧，将嫌疑人乙标识在支付矩阵上方。嫌疑人甲有两个策略可以选择：坦白、不坦白。将嫌疑人甲可能的策略纵向排列在博弈支付矩阵左侧。嫌疑人乙也有两个策略可以选择：坦白、不坦白。将嫌疑人乙可能的策略横向排列在博弈支付矩阵上方。,“囚徒困境”博弈的支付矩阵,矩阵左上方的（5，5）表示：当嫌疑人甲选择“坦白”、嫌疑人乙选择“坦白”时，两名嫌疑人能够得到的收益。按照惯例，括号内逗号前面的数字“5”表示嫌疑人甲的收益。括号内逗号后面的数字“5”表示嫌疑人乙的收益。,矩阵左下方的（10，1）表示：当嫌疑人甲选择“不坦白”

14、、嫌疑人乙选择“坦白”时，两名嫌疑人能够得到的收益。矩阵右上方的（1，10）表示：当嫌疑人甲选择“坦白”、嫌疑人乙选择“不坦白”时，两名嫌疑人能够得到的收益。矩阵右下方的（2，2）表示：当嫌疑人甲选择“不坦白”、嫌疑人乙选择“不坦白”时，两名嫌疑人能够得到的收益。,2智猪博弈,猪栏里养了两头猪，一头大猪、一头小猪。在猪圈的一端有一个盛食槽。在猪圈的另一端有一个按压式开关。开关每被按压一次，就有固定数量的食物出现在盛食槽中。大猪和小猪都在思考是否去按压开关。,如果大猪和小猪都去按压开关，然后两头猪从开关处奔向猪圈另一端的盛食槽。由于大猪跑的快，小猪跑得慢，因此大猪会比小猪早到达盛食槽

15、并把盛食槽内的食物吃光。小猪付出了按压开关的劳动却没有吃到食物。在此种情况下，大猪的收益为 5，小猪的收益为 -1。如果大猪去按压开关，小猪在盛食槽旁等待。那么当大猪按下开关后，盛食槽内出现食物，小猪立即开始吃，大猪则需要花一定时间从猪圈一端跑到另一端。当大猪到达盛食槽后，身强力壮的大猪会把小猪挤到一旁，吃光剩余的食物。在这种情况下，大猪得到的收益是 4，小猪得到的收益是 2。,如果小猪去按压开关，大猪在盛食槽旁等待。那么当小猪按下开关后，大猪开始吃，即使当小猪从开关处跑到盛食槽旁后，大猪仍然会霸占着食物，将食物全部吃光，小猪只能无可奈何地被挤在一旁。在这种情况下，大猪可以不劳而获，得到的收

16、益为 10。小猪徒劳无功，看到大猪不劳而获，更增加了小猪的郁闷，小猪得到收益 -2。如果大猪和小猪都不去按压开关，则大猪和小猪都无法吃到食物，大猪和小猪均得到收益 0。,“智猪博弈”的支付矩阵,二、划横线法,1通过“划横线法”求解“囚徒困境”博弈的均衡,如果嫌疑人乙选择坦白，那么嫌疑人甲应该如何选择？理性的嫌疑人甲会选择坦白。在嫌疑人甲选择坦白所对应的收益“5”的下方划一道短横线。类似可分析其他情况,2通过“划横线法”求解“智猪博弈”的均衡,如果大猪选择按开关，那么小猪应该如何选择？理性的小猪会选择等待。在小猪选择等待所对应的收益“2”的下方划一道短横线。类似可分析其他情况,第二节纳什均衡,一、纳什均衡的定义给定其他参与者在博弈均衡时的策略，任何博弈参与者都没有动机改变自己在博弈均衡时的策略选择。这样的均衡被称为“纳什均衡”（Nash Equilibrium）。,“囚徒困境”博弈的纳什均衡为：（嫌疑人甲选择坦白、嫌疑人乙选择坦白）。给定嫌疑人乙在纳什均衡的策略选择：坦白；嫌疑

展开阅读全文