《信息经济学之信息经济学研究方法》由会员分享,可在线阅读,更多相关《信息经济学之信息经济学研究方法(84页珍藏版)》请在金锄头文库上搜索。
1、信息经济学信息经济学X第三章第三章 信息经济学研究方法信息经济学研究方法博弈论博弈论基本概念基本概念规范研究规范研究实证研究实证研究非线性规划非线性规划基础模型基础模型其他例证例证基本类型基本类型信息经济学信息经济学的研究方法的研究方法例证例证信息经济学信息经济学X一、一、信息经济学的信息经济学的规范研究规范研究假设条件假设条件与现实不违背 条件之间不矛盾基本模型基本模型构造合理推导简洁、正确结论结论不可批判性 与现实吻合或合理复杂模型复杂模型(扩展或推广)复杂化 应用评论评论规范分析的基本框架规范分析的基本框架 经济学研究的经济学研究的“四步曲四步曲” ?- 假设条件、模型、分析或结论,评论
2、假设条件、模型、分析或结论,评论经济学研究的经济学研究的“八股文八股文” ?第第一一节节 信息经济学基本方法信息经济学基本方法信息经济学信息经济学X1. 假设条件假设条件在信息经济学之前,微观经济学假设中几乎都包括经济人假人假设和完全完全信息假信息假设这两个最基本的假设。经济人假人假设也称为理性人假设,是指经济决策主体(消费者、生产者等)的经济行为都是理性的或合乎理性的,他们在经济活动中不会感情用事,而是精于判断和计算,总是以利己为动机,力图以最小的经济代价去追逐和获得自身的最大利益。 完全信息假完全信息假设是指经济活动的所有当事人都拥有充分的和相同的信息,而且获取信息不需要支付任何成本。其它
3、假其它假设:完全竞争假设、稀缺性假设(资源不能够满足人们不断增长的需求)、制度假设(既定的市场经济制度)、交易成本为零的假定第第一一节节 信息经济学基本方法信息经济学基本方法信息经济学信息经济学X完全信息完全信息不完全信息不完全信息 阿克洛夫首先提出的不对称信息市场更好的贴近了现实,更为准确地反映了市场上商品的异质性。 古典假古典假设的的错误? 经济学规范研究的模型假设两方面要求:一是与现实不违背,二是条件之间不矛盾。 完全信息假设可以满足这两方面要求,甚至可以说,正是这种由简单到复杂的假设扩展过程使经济学的发展更为平稳和完备。第第一一节节 信息经济学基本方法信息经济学基本方法信息经济学信息经
4、济学X2. 模型建立的典范模型建立的典范 一般均衡分析一般均衡分析里昂里昂瓦尔拉斯瓦尔拉斯(Leon Walras,18341910) 里昂瓦尔拉斯,法国经济学家,边际革命领导人,洛桑学派创始人。19世纪50年代开始研究政治经济学,1870年被聘为洛桑大学政治经济学教授。瓦尔拉斯是边际效用价值论的创建人之一,他把边际效用称为“稀少性”,并在经济学中使用了数学,研究了使一切市场(不是一种商品的市场,而是所有商品的市场)都处于供求相等状态的均衡,即一般均衡,从而成为数理经济学和一般均衡理论的创建者和主要代表,他的一般均衡分析方法被经济学所普遍使用。瓦尔拉斯把自由竞争的资本主义看作最理想的制度,但也
5、主张国家根据正义原则干预经济。第第一一节节 信息经济学基本方法信息经济学基本方法信息经济学信息经济学X实证研究实证研究的步骤的步骤理论分析理论分析提出假说构建模型实证分析实证分析收集数据数据处理计量检验结论结论作出预测给出问题的对策文献综述文献综述研究方法研究结论讨论讨论反映现实反映现实 ?预测未来预测未来 ?实证研究能够实现:实证研究能够实现:讨论区讨论区第第一一节节 信息经济学基本方法信息经济学基本方法二二、信息经济学的信息经济学的实证研究实证研究信息经济学信息经济学X第二节第二节 信息经济学基本方法信息经济学基本方法 博弈论博弈论经济学研究的基本问题:经济学研究的基本问题: 资源的有效配
6、置资源的有效配置 人的行为人的行为经济学的基本假设:人是理性的经济学的基本假设:人是理性的 理性人:在一定的约束条件下,使自己的收益最大化。理性人:在一定的约束条件下,使自己的收益最大化。第三章第三章 信息经济学研究方法信息经济学研究方法信息经济学信息经济学X新古典经济学:新古典经济学:新古典经济学:新古典经济学:价格制度价格制度每个参与者的决策是独立的。每个参与者的决策是独立的。基本假设基本假设:(:(1)市场是竞争的)市场是竞争的 (2)信息是完全的)信息是完全的 (3)产品是独立的)产品是独立的个人决策的分析:个人决策的分析:收入收入支出(价格),收支出(价格),收益最大化益最大化博弈论
7、:博弈论:博弈论:博弈论:基本假设:基本假设: (1)市场是不完全竞争的)市场是不完全竞争的 (2)信息是不完全的)信息是不完全的特征:特征: 每个参与者的决策是相互影响的每个参与者的决策是相互影响的 现代西方经济学的系统性发展源自亚当斯密,中经大卫李嘉图、西斯蒙第、穆勒、萨伊等,逐渐形成了一个经典的经济学理论体系,这就是古典经济学(Classical Economics)。在20世纪以后,现代西方经济学历经了“张伯伦革命”、“凯恩斯革命”和“预期革命”等所谓三次大的革命,形成了包括微观经济学和宏观经济学的基本理论框架,这个框架被称为新古 典 经 济 学 ( Neoclassical Econ
8、omics),以区别于先前的古典经济学。新古典经济学集中而充分地反映了现代西方主流经济学过去100年间的研究成果和发展特征,它在研究方法上更注重证伪主义的普遍化、假定条件的多样化、分析工具的数理化、研究领域的非经济化、案例使用的经典化、学科交叉的边缘化。第二节第二节 博弈论博弈论信息经济学信息经济学X博弈:博弈:博弈:博弈:国家之间、企业之间、人与人之间国家之间、企业之间、人与人之间生活中的博弈:生活中的博弈: 打牌、下棋打牌、下棋 宿舍打扫卫生宿舍打扫卫生 宿舍买电风扇宿舍买电风扇 家庭装修家庭装修 挤公共汽车挤公共汽车第二节第二节 博弈论博弈论信息经济学信息经济学X一、经济博弈论的产生与发
9、展一、经济博弈论的产生与发展 通常,人们将数学家冯通常,人们将数学家冯 诺依曼(诺依曼(von Neumann)于)于1928年提出的二年提出的二人零和博弈的极小化极大定理作为博弈论奠基的标志。人零和博弈的极小化极大定理作为博弈论奠基的标志。 1944年,数学家冯年,数学家冯 诺依曼(诺依曼(von Neumann)和经济学家摩根斯坦恩)和经济学家摩根斯坦恩(Morgenstern)合作发表了)合作发表了博弈论和经济行为博弈论和经济行为一书,被认为是应用一书,被认为是应用博弈论进行经济分析的开始。博弈论进行经济分析的开始。 20世纪世纪50-60年代,博弈论确立了发展的基础。年代,博弈论确立了
10、发展的基础。1950-1951年,年,Nash发发表了两篇关于非合作博弈的重要论文。表了两篇关于非合作博弈的重要论文。1950年,年,Tucker定义了定义了“囚犯难题囚犯难题”(prisoners dilemma) 。Nash和和Tucker的工作基本奠定了现代博弈论的工作基本奠定了现代博弈论的基础。的基础。 20世纪世纪60年代,泽尔腾(年代,泽尔腾( Selten )将纳什均衡的概念引入了动态分析。)将纳什均衡的概念引入了动态分析。1967-1968年,海萨尼(年,海萨尼(Harsanyi)发表了具有不完全信息的由)发表了具有不完全信息的由Bayesian局中人所进行的博弈。此后,他们两
11、人长期合作,发展了非合作博弈理局中人所进行的博弈。此后,他们两人长期合作,发展了非合作博弈理论论第二节第二节 博弈论博弈论信息经济学信息经济学X 1994年诺贝尔经济学奖获得者:年诺贝尔经济学奖获得者: 美国数学家美国数学家John F. Nash,德国经济学家,德国经济学家Reinhard Selten,美籍匈牙利,美籍匈牙利经济学家经济学家John C. Harsanyi。 1928年年Nash出生于美国,出生于美国,1950年获年获Princeton大学数学博士学大学数学博士学位,曾先后任教于位,曾先后任教于MIT和和Princeton大学。其博士论文大学。其博士论文非合作博非合作博弈弈
12、首次区分了合作博弈与非合作博弈,并且提出了非合作博弈的首次区分了合作博弈与非合作博弈,并且提出了非合作博弈的所谓所谓Nash均衡概念。均衡概念。 1930年年 Selten出生于现属于波兰的德出生于现属于波兰的德国城市,国城市,1961年获法兰克福大学数学博士年获法兰克福大学数学博士学位,曾先后任教于柏林自由大学、比勒学位,曾先后任教于柏林自由大学、比勒菲尔特大学和波恩大学。其主要贡献是在菲尔特大学和波恩大学。其主要贡献是在博弈论中引入了动态分析。博弈论中引入了动态分析。 1920年年Harsanyi出生于匈牙利,出生于匈牙利,1947年获布达佩斯大学博士年获布达佩斯大学博士学位,后到美国,学
13、位,后到美国,1954年获斯坦福大学博士学位,曾先后任教于年获斯坦福大学博士学位,曾先后任教于澳大利亚国立大学、加州伯克利分校。于澳大利亚国立大学、加州伯克利分校。于2000年去世。他的贡献年去世。他的贡献是将不完全信息引入了博弈论的研究。是将不完全信息引入了博弈论的研究。第二节第二节 博弈论博弈论信息经济学信息经济学X二、经济博弈论主要概念及表述二、经济博弈论主要概念及表述(一)博弈的基本概念(一)博弈的基本概念(一)博弈的基本概念(一)博弈的基本概念 局中人局中人局中人局中人(playersplayers):指做决策的个体。每个局中人的目标都是):指做决策的个体。每个局中人的目标都是通过选
14、择行动来使自己的效用最大化。通过选择行动来使自己的效用最大化。 虚拟局中人(虚拟局中人(pseudo-playerspseudo-players):指以一种纯机械的方式来采取):指以一种纯机械的方式来采取行动的个体。行动的个体。“自然自然”是一种虚拟局中人,它在博弈的特定时点上以是一种虚拟局中人,它在博弈的特定时点上以特定的概率随机选择行动。特定的概率随机选择行动。 例如:例如: 你要出门,要决策是否带伞你要出门,要决策是否带伞 打牌打牌 联通进入市场,移动的成本情况就是一个随机变量。(相对)联通进入市场,移动的成本情况就是一个随机变量。(相对)第二节第二节 博弈论博弈论信息经济学信息经济学X
15、 行动行动行动行动(actionsactions):是指局中人的决策变量。):是指局中人的决策变量。 局中人局中人i i的行动以的行动以a ai i表示,是他所能做的某一选择。局表示,是他所能做的某一选择。局中人中人i i的行动集(的行动集(action setaction set)是其可以采用的全部行动的)是其可以采用的全部行动的集合。一个行动组合(集合。一个行动组合(action profileaction profile)是一个由博弈中)是一个由博弈中的的n n个局中人每人选择一个行动所组成的有序集。个局中人每人选择一个行动所组成的有序集。 例如:例如: 出门:带伞出门:带伞 或或 不带
16、伞不带伞 打牌:出牌打牌:出牌第二节第二节 博弈论博弈论信息经济学信息经济学X 信息信息信息信息(information)指局中人在博弈中的知识,特别是)指局中人在博弈中的知识,特别是有关其他局中人(竞争者或对手)的特征和行动的知识。有关其他局中人(竞争者或对手)的特征和行动的知识。 一般地,信息是以信息集(一般地,信息是以信息集(information set)的概念来)的概念来模型化的。可以将局中人的信息集看成是其在特定时点对于模型化的。可以将局中人的信息集看成是其在特定时点对于不同变量的取值的了解程度。不同变量的取值的了解程度。例如:例如: 对天气的判断(出门)对天气的判断(出门) 对其
17、他人的判断(打牌)对其他人的判断(打牌) 对产品了解的程度(装修)对产品了解的程度(装修)第二节第二节 博弈论博弈论信息经济学信息经济学X 战略或策略战略或策略战略或策略战略或策略(strategies),是局中人选择行动的规则,),是局中人选择行动的规则,它告诉局中人在什么时候选择什么行动。它告诉局中人在什么时候选择什么行动。例如:例如: “人不犯我,我不犯人;人若犯我,我必犯人人不犯我,我不犯人;人若犯我,我必犯人” 三个和尚没水喝三个和尚没水喝第二节第二节 博弈论博弈论信息经济学信息经济学X 收收收收益益益益或或或或支支支支付付付付(payoff):指指每每个个参参与与人人从从博博弈弈中
18、中获获得得的的效效用用水水平平。既既可可以以指指实实际际支支付付,也也可可以以用用来来指指期期望望支支付付。它它是是所所有局中人战略或行动的函数,是每个局中人关注的核心问题。有局中人战略或行动的函数,是每个局中人关注的核心问题。例如:例如: 出出门门带带伞伞的的成成本本为为2,如如果果下下雨雨,有有伞伞获获得得的的收收益益为为6,则实际得到的效用为,则实际得到的效用为4。 均均均均衡衡衡衡(equilibrium)是是指指所所有有局局中中人人的的最最优优战战略略组组合合或或行行动动组组合合,或或者者均均衡衡s*=(s1*, sn*)是是指指由由博博弈弈中中的的n个个局局中人每人选取的最佳战略所
19、组成的一个战略组合。中人每人选取的最佳战略所组成的一个战略组合。 结结结结果果果果(outcome)是是指指在在博博弈弈结结束束后后,建建立立博博弈弈模模型型者者从从行行动动、支支付付和和其其他他变变量量的的取取值值中中所所挑挑选选出出来来的的他他所所感感兴兴趣趣的的要要素素的集合。的集合。第二节第二节 博弈论博弈论信息经济学信息经济学X在一个博弈过程中,无论对方的策略选择如何,局中人一方都会选在一个博弈过程中,无论对方的策略选择如何,局中人一方都会选择某个确定的策略,则该策略被称为择某个确定的策略,则该策略被称为支配性策略支配性策略。如果两个博弈的。如果两个博弈的局中人的策略组合分别构成各自
20、的支配性策略,那么,这个组合就局中人的策略组合分别构成各自的支配性策略,那么,这个组合就被定义为被定义为纳西均衡纳西均衡(Nash equilibrium)。)。第二节第二节 博弈论博弈论信息经济学信息经济学X小小小小 结:结:结:结: 一个博弈中需要的要素包括:局中人、行动、信息、战一个博弈中需要的要素包括:局中人、行动、信息、战略或策略、支付、结果和均衡。略或策略、支付、结果和均衡。 其中,对一个博弈的描述至少必须包括:局中人、战略其中,对一个博弈的描述至少必须包括:局中人、战略和支付。和支付。 局中人、行动和结果合起来统称为博弈规则(局中人、行动和结果合起来统称为博弈规则(rules o
21、f the game),博弈分析的目的在于运用博弈规则来确定均衡。),博弈分析的目的在于运用博弈规则来确定均衡。 惟一性惟一性惟一性惟一性(uniqueness):公认的均衡概念并不能保证惟):公认的均衡概念并不能保证惟一性,缺乏惟一性是博弈论的主要缺陷或问题。例如,可能一性,缺乏惟一性是博弈论的主要缺陷或问题。例如,可能存在多种均衡,或者根本就没有均衡。存在多种均衡,或者根本就没有均衡。 解决方案:看重博弈的规则,而不是均衡概念。解决方案:看重博弈的规则,而不是均衡概念。第二节第二节 博弈论博弈论信息经济学信息经济学X(二)博弈的基本表述(二)博弈的基本表述(二)博弈的基本表述(二)博弈的基
22、本表述 双变量矩阵表:双变量矩阵表:双变量矩阵表:双变量矩阵表:双变量指在两个局中人的博弈中,每一双变量指在两个局中人的博弈中,每一单元格都有两个数字单元格都有两个数字分别表示两个局中人的收益。分别表示两个局中人的收益。 局中人局中人B 左左 右右 上上 2, 1 0, 0局中人局中人A 下下 0, 0 1, 2博弈表述的基本要素包括:局中人、战略和支付博弈表述的基本要素包括:局中人、战略和支付博弈表述的基本要素包括:局中人、战略和支付博弈表述的基本要素包括:局中人、战略和支付第二节第二节 博弈论博弈论信息经济学信息经济学X(三)划分博弈的主要概念(三)划分博弈的主要概念(三)划分博弈的主要概
23、念(三)划分博弈的主要概念1. 1. 1. 1. 合作博弈与非合作博弈合作博弈与非合作博弈合作博弈与非合作博弈合作博弈与非合作博弈 合作博弈(合作博弈(cooperative game):是以局中人整体的可):是以局中人整体的可能联合行动集合为基本要素。通俗地说,如果局中人能够能联合行动集合为基本要素。通俗地说,如果局中人能够达成有约束力的协议或合约,则该博弈称为合作博弈。合达成有约束力的协议或合约,则该博弈称为合作博弈。合作博弈强调的是集体理性。作博弈强调的是集体理性。 非合作博弈(非合作博弈(non-cooperative game):是以单个局中):是以单个局中人的可能行动集合为基本要素
24、的博弈。通俗地说,如果局人的可能行动集合为基本要素的博弈。通俗地说,如果局中人不能在博弈中达成有约束力的协议或合约,则称该博中人不能在博弈中达成有约束力的协议或合约,则称该博弈为非合作博弈。非合作博弈强调的是个体理性。弈为非合作博弈。非合作博弈强调的是个体理性。 信息经济学主要研究的是非合作博弈。信息经济学主要研究的是非合作博弈。第二节第二节 博弈论博弈论信息经济学信息经济学X2. 2. 2. 2. 零和博弈与非零和博弈零和博弈与非零和博弈零和博弈与非零和博弈零和博弈与非零和博弈 按照博弈的收益分配结果划分,博弈可以划分为零和博按照博弈的收益分配结果划分,博弈可以划分为零和博弈和非零和博弈。弈
25、和非零和博弈。 零和博弈指在博弈中一组局中人所得到的支付(或收益)零和博弈指在博弈中一组局中人所得到的支付(或收益)恰好是另一组局中人的损失。通俗地说,博弈结果总和为零恰好是另一组局中人的损失。通俗地说,博弈结果总和为零的博弈称为零和博弈。的博弈称为零和博弈。 非零和博弈指所有局中人的支付(或收益)的代数和不非零和博弈指所有局中人的支付(或收益)的代数和不为零。为正或为负。为零。为正或为负。 例如:赢钱与输钱为零和博弈;例如:赢钱与输钱为零和博弈; 工会与厂方达成增加工资的协议双方获得工会与厂方达成增加工资的协议双方获得“双赢双赢”。反。反之,罢工导致之,罢工导致“两败俱伤两败俱伤”。3. 3
26、. 3. 3. 自然假设与自然参与博弈自然假设与自然参与博弈自然假设与自然参与博弈自然假设与自然参与博弈第二节第二节 博弈论博弈论信息经济学信息经济学X4. 4. 根据信息结构划分根据信息结构划分根据信息结构划分根据信息结构划分 对称信息对称信息对称信息对称信息(symmetric information):指博弈中任一局):指博弈中任一局中人都至少包含与其他每个局中人的信息集相同的元素。中人都至少包含与其他每个局中人的信息集相同的元素。 非对称信息非对称信息非对称信息非对称信息(asymmetric information):指至少有一个):指至少有一个局中人拥有私人信息(局中人拥有私人信息
27、(private information)。)。 完全信息完全信息完全信息完全信息(complete information):指局中人完全了解):指局中人完全了解其他局中人的收益或收益函数。通俗地说,局中人完全了解其他局中人的收益或收益函数。通俗地说,局中人完全了解其他局中人的特征、战略空间及支付函数。其他局中人的特征、战略空间及支付函数。 不完全信息不完全信息不完全信息不完全信息(incomplete information):指至少有一个):指至少有一个局中人不完全了解其他局中人的收益或收益函数。局中人不完全了解其他局中人的收益或收益函数。 第二节第二节 博弈论博弈论信息经济学信息经济学
28、X完备信息完备信息完备信息完备信息(perfect information):指一个参与人对其):指一个参与人对其他参与人的行动选择有准确的了解。他参与人的行动选择有准确的了解。不完备信息不完备信息不完备信息不完备信息(Imperfect information):指博弈中至少):指博弈中至少有一个局中人不了解其他局中人的行动选择。有一个局中人不了解其他局中人的行动选择。完完完完 全全全全 信信信信 息息息息如如如如“ “石头、剪刀、布石头、剪刀、布石头、剪刀、布石头、剪刀、布” ”游戏游戏游戏游戏不完全信息不完全信息不完全信息不完全信息如打牌如打牌如打牌如打牌完完完完 备备备备 信信信信 息
29、息息息“石头、剪刀、布石头、剪刀、布石头、剪刀、布石头、剪刀、布” ”游戏中,你知道对游戏中,你知道对游戏中,你知道对游戏中,你知道对方方方方40%40%出石头,出石头,出石头,出石头,30%30%出布,出布,出布,出布,30%30%出剪刀出剪刀出剪刀出剪刀第二节第二节 博弈论博弈论信息经济学信息经济学X5. 5. 根据行动结构划分根据行动结构划分根据行动结构划分根据行动结构划分 静态博弈静态博弈静态博弈静态博弈(static game):博弈中局中人同时选择行动,):博弈中局中人同时选择行动,或虽然不是同时行动但后行动者并不了解前行动者采取了或虽然不是同时行动但后行动者并不了解前行动者采取了
30、什么具体行动。什么具体行动。 例如:例如: “石头、剪刀、布石头、剪刀、布”的游戏的游戏 应聘者演讲(轮流,但其他人在外等候)应聘者演讲(轮流,但其他人在外等候) 讨论:讨论:讨论:讨论: 1 1)田忌赛马的博弈是否属于静态博弈?)田忌赛马的博弈是否属于静态博弈? 2 2)企业中有哪些属于静态博弈的例子?)企业中有哪些属于静态博弈的例子? 3 3)当你知道对方)当你知道对方40%40%出石头,出石头,30%30%出布和出布和30%30%出剪刀,但不知出剪刀,但不知道组合的顺序,你的最优策略是什么?道组合的顺序,你的最优策略是什么?第二节第二节 博弈论博弈论信息经济学信息经济学X 动态博弈动态博
31、弈动态博弈动态博弈(dynamic game):指局中人的行动有先后顺序,且后行动):指局中人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。者能够观察到先行动者所选择的行动。 例如:例如: 下棋、打牌等游戏下棋、打牌等游戏 应聘者演讲(轮流,但后者可以听前者的演讲)应聘者演讲(轮流,但后者可以听前者的演讲) 博士答辩的安排顺序博士答辩的安排顺序 政府政策与企业行为之间政府政策与企业行为之间“上有政策,下有对策上有政策,下有对策”博弈:博弈: 关税水平与走私、税收与逃税之间的博弈;关税水平与走私、税收与逃税之间的博弈; 政府与企业之间政府与企业之间“鞭打快牛鞭打快牛”的博弈;的博弈
32、; 政府官员政府官员“四菜一汤四菜一汤”规定的博弈。规定的博弈。 第二节第二节 博弈论博弈论信息经济学信息经济学X基于信息结构和行动结构来划分博弈的结果:基于信息结构和行动结构来划分博弈的结果:基于信息结构和行动结构来划分博弈的结果:基于信息结构和行动结构来划分博弈的结果: 博弈的类型及对应的均衡概念博弈的类型及对应的均衡概念 行动顺序行动顺序 静态结构静态结构 动态结构动态结构 信信 息息 (战略博弈)(战略博弈) (扩展博弈)(扩展博弈) 完全信息静态博弈完全信息静态博弈 完全信息动态博弈完全信息动态博弈 完全信息结构完全信息结构 Nash均衡均衡 子博弈精练子博弈精练Nash均衡均衡 N
33、ash(1950,1951) Selten(1965) 不完全信息静态博弈不完全信息静态博弈 不完全信息动态博弈不完全信息动态博弈不完全信息结构不完全信息结构 贝叶斯贝叶斯Nash均衡均衡 精练贝叶斯精练贝叶斯Nash均衡均衡 Harsanyi(1967-1968) Selten(1975)等等第二节第二节 博弈论博弈论信息经济学信息经济学X 信息结构与行动结构框架图信息结构与行动结构框架图 静态结构静态结构 动态结构动态结构 (战略博弈)(战略博弈) (扩展博弈)(扩展博弈) 完全信息结构完全信息结构 石头石头/剪刀剪刀/布布 围棋、象棋围棋、象棋 不完全信息结构不完全信息结构 赌赌 博博
34、黔驴技穷黔驴技穷第二节第二节 博弈论博弈论信息经济学信息经济学X6. 6. 博弈类型的另一种划分方法:博弈类型的另一种划分方法:博弈类型的另一种划分方法:博弈类型的另一种划分方法: 局中人局中人 1人博弈人博弈 2人博弈人博弈 多人博弈多人博弈 (个人与自然)(个人与自然) 零和零和 A C E博弈结果博弈结果 非零和非零和 B D F第二节第二节 博弈论博弈论信息经济学信息经济学X1 1人博弈:个人与自然人博弈:个人与自然人博弈:个人与自然人博弈:个人与自然 假设一位花农需要决定种植花的品种,但无法知道明年的天气假设一位花农需要决定种植花的品种,但无法知道明年的天气情况,通过经验和资料得知明
35、年各种天气类型出现的可能性是:情况,通过经验和资料得知明年各种天气类型出现的可能性是:S1=0.2,S20.1,S30.4,S40.3。可以选择的花的品种为。可以选择的花的品种为3种。种。 不同的花在不同的气候条件下的收成为:不同的花在不同的气候条件下的收成为:S1S2S3S4A1121090A28844A3161232概率概率0.20.10.40.3如果只能选择一种花的话,花农应该选择种哪种花?如果只能选择一种花的话,花农应该选择种哪种花?期望值(期望值(A1)、大中最大()、大中最大(A3)、小中最大()、小中最大(A2)天天 气气品品 种种第二节第二节 博弈论博弈论信息经济学信息经济学X
36、三、经典博弈思想及其应用三、经典博弈思想及其应用(一)完全信息静态博弈:(一)完全信息静态博弈:(一)完全信息静态博弈:(一)完全信息静态博弈:NashNash均衡均衡均衡均衡1. Nash1. Nash均衡的概念均衡的概念均衡的概念均衡的概念 通俗地说,通俗地说,Nash均衡是指由全部局中人的均衡是指由全部局中人的最优战略最优战略组成组成的均衡。在其他局中人战略既定的情况下,没有任何单个局的均衡。在其他局中人战略既定的情况下,没有任何单个局中人会选择其他战略,从而没有任何局中人会打破这种均衡。中人会选择其他战略,从而没有任何局中人会打破这种均衡。 Nash 均衡是一个稳定状态的解。在这个(均
37、衡是一个稳定状态的解。在这个(“僵局僵局”)状态下,每个局中人的决策依赖于均衡的知识。状态下,每个局中人的决策依赖于均衡的知识。第二节第二节 博弈论博弈论信息经济学信息经济学X2. Nash2. Nash均衡的主要特征均衡的主要特征均衡的主要特征均衡的主要特征(1)Nash均衡可能是高成本的均衡可能是高成本的(2)可能不存在纳什均衡)可能不存在纳什均衡(3)Nash均衡可能有多重解均衡可能有多重解 第二节第二节 博弈论博弈论信息经济学信息经济学X3. Nash3. Nash均衡:囚犯难题均衡:囚犯难题均衡:囚犯难题均衡:囚犯难题 张张 三三 坦坦 白白 不坦白不坦白 坦坦 白白 -3, -3
38、0, -6 李李 四四 不坦白不坦白 -6, 0 -1, -1第二节第二节 博弈论博弈论信息经济学信息经济学X 囚犯难题的推论:囚犯难题的推论: 1)可能不是帕累托最优;)可能不是帕累托最优; 2)个体理性与集体理性的不一致性;)个体理性与集体理性的不一致性; 3)表明制度安排的重要性;)表明制度安排的重要性; 4)在现实政治经济中,合作具有积极普遍的意义。)在现实政治经济中,合作具有积极普遍的意义。 囚犯难题的应用:囚犯难题的应用:囚犯难题的应用:囚犯难题的应用: 军备竞赛军备竞赛 企业员工企业员工 交通堵塞交通堵塞 经济改革经济改革 投票选举投票选举第二节第二节 博弈论博弈论信息经济学信息
39、经济学X囚犯难题应用囚犯难题应用囚犯难题应用囚犯难题应用1 1:军备竞赛:军备竞赛:军备竞赛:军备竞赛 20多多年年前前,美美、苏苏两两国国是是两两个个超超级级大大国国,他他们们相相互互对对垒垒。假假设设他他们们有有两两种种策策略略选选择择:扩扩军军或或裁裁军军。双双方方选选择择的的支支付付如如下:下: 苏苏 联联 扩扩 军军 裁裁 军军 扩扩 军军 -2000,-2000 8000,- 美美 国国 裁裁 军军 - ,8000 0,0 第二节第二节 博弈论博弈论信息经济学信息经济学X囚犯难题应用囚犯难题应用囚犯难题应用囚犯难题应用2 2:环境保护:环境保护:环境保护:环境保护 两两个个企企业业
40、(u1,u2)被被问问:是是否否同同意意建建造造一一个个新新的的下下水水管管道道以以使使地地下下水水不不被被污污染染。假假设设建建造造下下水水管管道道需需要要投投资资120万万。如同意各承担如同意各承担50%,下水管道对企业的价值分别是,下水管道对企业的价值分别是80万。万。 说说明明:产产权权界界定定与与环环境境保保护护的的制制度度建建设设对对于于公公共共资资源源的的保护是十分必要的。保护是十分必要的。第二节第二节 博弈论博弈论信息经济学信息经济学X囚犯难题应用囚犯难题应用囚犯难题应用囚犯难题应用3 3:搭便车分析:搭便车分析:搭便车分析:搭便车分析 假设:学生假设:学生A和和B各有财产各有
41、财产300元;对风扇的福利评价分元;对风扇的福利评价分别为别为100元,风扇价格为元,风扇价格为160元,合伙买风扇的收益为元,合伙买风扇的收益为200-160 =40元。元。 学生学生B 买风扇买风扇 不买风扇不买风扇 买风扇买风扇 320,320 240,400 学生学生A 不买风扇不买风扇 400,240 300,300第二节第二节 博弈论博弈论信息经济学信息经济学X现实中的搭便车现象:现实中的搭便车现象: 灯塔、路灯等公共设施;灯塔、路灯等公共设施; 污染等环境问题;污染等环境问题; 各种滥竽充数的广告、产品或服务。各种滥竽充数的广告、产品或服务。搭便车问题的主要解决方案:搭便车问题的
42、主要解决方案: 中央集权制;中央集权制; 投票制:少数服从多数;投票制:少数服从多数; 征收克拉克税(如汽油税、过桥费)。征收克拉克税(如汽油税、过桥费)。第二节第二节 博弈论博弈论信息经济学信息经济学X4. 4. 不存在不存在不存在不存在NashNash均衡:保安与小偷均衡:保安与小偷均衡:保安与小偷均衡:保安与小偷基本假设:策略;预期效益。基本假设:策略;预期效益。基本假设:策略;预期效益。基本假设:策略;预期效益。 小小 偷偷 不不 偷偷 偷偷 不睡觉不睡觉 0, 0 0, -1 保安保安 睡睡 觉觉 1, 0 -1, 3第二节第二节 博弈论博弈论信息经济学信息经济学X猜硬币博弈:猜硬币
43、博弈:猜硬币博弈:猜硬币博弈:每个局中人的战略空间为(正面,背面)每个局中人的战略空间为(正面,背面) 局中人局中人2 正面正面 背面背面 正面正面 -1, 1 1, -1 局中人局中人1 背面背面 1, -1 -1, 1 在博弈中,一旦每个局中人都竭力猜测其他局中人的战在博弈中,一旦每个局中人都竭力猜测其他局中人的战略选择,就不存在略选择,就不存在Nash均衡(至少不存在前面定义的标准均衡(至少不存在前面定义的标准的的Nash均衡)。因为这时局中人的最优行动是不确定的,均衡)。因为这时局中人的最优行动是不确定的,而博弈的结果必然要包含这种不确定性。而博弈的结果必然要包含这种不确定性。例如:股
44、票市场例如:股票市场例如:股票市场例如:股票市场 第二节第二节 博弈论博弈论信息经济学信息经济学X5. Nash5. Nash均衡:智猪博弈均衡:智猪博弈均衡:智猪博弈均衡:智猪博弈(boxed pigs) 假设按一下按钮要支付假设按一下按钮要支付2个单位成本,有个单位成本,有10个单位猪食进入猪槽。个单位猪食进入猪槽。又假设:又假设:1)大猪和小猪同时赶到,大猪吃)大猪和小猪同时赶到,大猪吃7个单位,小猪吃个单位,小猪吃3个单位;个单位;2)大猪和小猪同时按按钮又同时赶到猪槽,扣除)大猪和小猪同时按按钮又同时赶到猪槽,扣除2个单位成本后,大猪个单位成本后,大猪支付水平为支付水平为7- -2=
45、5,小猪支付水平为,小猪支付水平为3- -2=1。3)大猪按按钮,小猪等待,)大猪按按钮,小猪等待,小猪先赶到,小猪吃小猪先赶到,小猪吃4个单位,大猪吃个单位,大猪吃6个单位。大猪支付水平为个单位。大猪支付水平为6- -2=4,小猪支付水平为,小猪支付水平为4- -0=4。4)小猪按按钮,大猪等待,大猪先赶到,大)小猪按按钮,大猪等待,大猪先赶到,大猪吃猪吃9个单位,小猪吃个单位,小猪吃1个单位。大猪支付水平为个单位。大猪支付水平为9- -0=9,小猪为,小猪为1- -2= - -1。 大大 猪猪 按按 等等 待待 按按 1, 5 -1, 9 小猪小猪 等待等待 4, 4 0, 0第二节第二节
46、 博弈论博弈论信息经济学信息经济学X智猪博弈表明:能者多劳,但多劳者未必多得。智猪博弈表明:能者多劳,但多劳者未必多得。智猪博弈表明:能者多劳,但多劳者未必多得。智猪博弈表明:能者多劳,但多劳者未必多得。在每个行业中龙头企业都要承担三个在每个行业中龙头企业都要承担三个“大猪成本大猪成本”:1)市场开拓成本)市场开拓成本群狼策略;群狼策略;2)人才培训成本)人才培训成本猎头策略;猎头策略;3)商业模式创新成本)商业模式创新成本模仿策略。模仿策略。例如,例如,“大猪控股大猪控股”和和“小猪有限小猪有限”都计划引进一种新产品,但为了获都计划引进一种新产品,但为了获得公众的认同,须投入广告费用。如大猪
47、控股打头阵,小猪有限跟进也得公众的认同,须投入广告费用。如大猪控股打头阵,小猪有限跟进也可以获得一部分市场。相反,如小猪有限先进入,大猪控股就会后发制可以获得一部分市场。相反,如小猪有限先进入,大猪控股就会后发制任,独占市场。任,独占市场。 现实生活中的智猪博弈例子:现实生活中的智猪博弈例子: 领头企业与小企业(麦当劳与小快餐店)领头企业与小企业(麦当劳与小快餐店) 股票市场上的大户与小户股票市场上的大户与小户 企业的大股东和小股东企业的大股东和小股东 公共设施或基础设施投资:富人与穷人的博弈公共设施或基础设施投资:富人与穷人的博弈第二节第二节 博弈论博弈论信息经济学信息经济学X6. Nash
48、6. Nash均衡:性别之战均衡:性别之战均衡:性别之战均衡:性别之战(battle of the sexes)假设条件:假设条件: 1)联合行动收益大于非联合行动收益;)联合行动收益大于非联合行动收益; 2)非合作基础:影响力或影响因子相同。)非合作基础:影响力或影响因子相同。 丈丈 夫夫 足足 球球 芭芭 蕾蕾 足足 球球 2, 3 -1, - 1 妻妻 子子 芭芭 蕾蕾 1, 1 3, 2第二节第二节 博弈论博弈论信息经济学信息经济学X评论评论评论评论:在性别之战中,任一:在性别之战中,任一Nash均衡都是帕累托最优,其均衡都是帕累托最优,其他任一战略组合都不可能在不降低其他局中人支付的
49、条件他任一战略组合都不可能在不降低其他局中人支付的条件下提高另一局中人的支付。下提高另一局中人的支付。问题问题问题问题:在性别之战的两个:在性别之战的两个Nash均衡中,究竟最终是哪个?均衡中,究竟最终是哪个? 情形一:彼此不沟通,出现非联合行动;情形一:彼此不沟通,出现非联合行动; 情形二:可以通过博弈的重复进行形成共同知识情形二:可以通过博弈的重复进行形成共同知识(common knowledge),也有可能出现),也有可能出现Nash均衡;均衡; 情形三:局中人不沟通,但每晚重复进行这一博弈,情形三:局中人不沟通,但每晚重复进行这一博弈,他们将最终稳定在某一他们将最终稳定在某一Nash均
50、衡上。均衡上。第二节第二节 博弈论博弈论信息经济学信息经济学X性别之战应用:菜市场早市性别之战应用:菜市场早市性别之战应用:菜市场早市性别之战应用:菜市场早市/ /夜市博弈夜市博弈夜市博弈夜市博弈 假假设设两两个个相相互互竞竞争争的的蔬蔬菜菜市市场场可可以以自自己己决决定定是是开开早早市市还还是是开开夜夜市市,但但每每个个市市场场一一天天只只能能开开一一次次。如如果果是是开开夜夜市市,蔬蔬菜菜就就可可以以通通过过船船运运,如如果果是是开开早早市市,就就必必须须通通过过货货车车运运输输。船船运运会会比比车车运运便便宜宜。中中国国家家庭庭主主妇妇虽虽然然传传统统上上习习惯惯早早上上买买菜菜,但但如
51、如果果菜菜价价在在夜夜市市便便宜宜许许多多,她她们们也也有有可可能能到到夜市买菜。无论如何一户一天只买一次菜(数学上称为不重叠组合)。夜市买菜。无论如何一户一天只买一次菜(数学上称为不重叠组合)。 问问题题:两两个个菜菜市市场场如如何何决决定定开开早早市市还还是是开开夜夜市市,在在决决定定之之前前是是否否应应该相互合作?各种支付如下图。该相互合作?各种支付如下图。第二节第二节 博弈论博弈论信息经济学信息经济学X性别之战策略:性别之战策略:性别之战策略:性别之战策略:(1)先动优势)先动优势 A企业企业 民用市场民用市场 军用市场军用市场 民用市场民用市场 -10, -10 30, 15 B企业
52、企业 军用市场军用市场 15, 30 -10,-10(2)公平性合作战略)公平性合作战略(3)补偿性合作战略)补偿性合作战略(4)随机行动策略()随机行动策略(“李王庄李王庄”车站)车站)第二节第二节 博弈论博弈论信息经济学信息经济学X7. Nash7. Nash均衡:勇士博弈均衡:勇士博弈均衡:勇士博弈均衡:勇士博弈 勇勇士士博博弈弈是是反反映映20世世纪纪50年年代代美美国国青青年年的的行行为为特特征征,并并通通过过Jame Dean主主演演的的电电影影典典型型地地表表现现出出来来:某某个个青青年年集集团团中中有有A和和B两两人人争争斗斗集集团团头头领领。他他们们将将通通过过一一个个勇勇气
53、气的的测测验验来来决决定定谁谁更更勇勇敢敢,勇勇敢敢者者就就可可以以当头领。当头领。 测测验验规规则则如如下下:A与与B各各自自驾驾驶驶自自己己的的小小车车在在一一条条道道路路上上面面对对面面朝朝对对方方高高速速开开去去,谁谁第第一一个个让让开开谁谁就就输输掉掉。让让开开者者被被称称为为胆胆小小鬼鬼(chicken)而而不不能能当当头头领领。如如果果两两人人都都不不让让开开,结结果果是是车车毁毁人人亡亡。如如果果两两人人同同时时让让开开,结结果果是是平平局局。如如果果一一方方让让开开一一方方不不让让,让让开开者者则则既既丢面子,又当不成头领。丢面子,又当不成头领。 勇士博弈的支付矩阵如下。勇士
54、博弈的支付矩阵如下。第二节第二节 博弈论博弈论信息经济学信息经济学X勇士博弈模型:勇士博弈模型: 局中人局中人B 前前 进进 避避 让让 前进前进 0, 0 8, 2 局中人局中人A 避让避让 2, 8 6, 6现实生活中的勇士博弈例子:现实生活中的勇士博弈例子: 警察与游行队伍警察与游行队伍 夫妻吵架夫妻吵架 产品销售中的竞争产品销售中的竞争勇士博弈中的有效策略:恫吓或威慑勇士博弈中的有效策略:恫吓或威慑第二节第二节 博弈论博弈论信息经济学信息经济学X课堂讨论:课堂讨论:课堂讨论:课堂讨论:路灯维修路灯维修道路铺设道路铺设囚徒博弈囚徒博弈智猪博弈智猪博弈勇士博弈勇士博弈第二节第二节 博弈论博
55、弈论信息经济学信息经济学X8. Nash8. Nash均衡:市场进入阻挠均衡:市场进入阻挠均衡:市场进入阻挠均衡:市场进入阻挠(entry deterrance) 假设局中人假设局中人A为潜在市场进入者,局中人为潜在市场进入者,局中人B为现有市场的为现有市场的占有者。具体博弈模型如下所示:占有者。具体博弈模型如下所示: 局中人局中人B:占有者:占有者 接接 纳纳 竞竞 争争 进入进入 20, 30 -10, 0 局中人局中人A: 进入者进入者 不进入不进入 0, 100 0, 100第二节第二节 博弈论博弈论信息经济学信息经济学X9. Nash9. Nash均衡:聚点均衡:聚点均衡:聚点均衡:
56、聚点(focal points) 在以下的选择中,如果你的选择与其他局中人的选择一致的次数越多,在以下的选择中,如果你的选择与其他局中人的选择一致的次数越多,你就赢得越多,那么,你在博弈中将采取什么战略?你就赢得越多,那么,你在博弈中将采取什么战略? (1)选择下述一个数并画圈:)选择下述一个数并画圈:7,100,13,261,99,666。 (2)你要在中山大学与一个没有来过中山大学的高中同学会面,应在什)你要在中山大学与一个没有来过中山大学的高中同学会面,应在什么时间、什么公共地点碰面?么时间、什么公共地点碰面? (3)选择下述一个数并画圈:)选择下述一个数并画圈:14,15,16,17,
57、18,100。 (4)你与另外一人一起分蛋糕,你们各自报出期望分到的比例,但如果)你与另外一人一起分蛋糕,你们各自报出期望分到的比例,但如果你们报的比例之和超过你们报的比例之和超过100%,大家都将一无所获。,大家都将一无所获。 (5)假设你到一个热带岛国去做市场营销,只允许带一样产品,你会选)假设你到一个热带岛国去做市场营销,只允许带一样产品,你会选择带什么产品?择带什么产品?第二节第二节 博弈论博弈论信息经济学信息经济学X 聚点:聚点:聚点:聚点:就是出于心理或其他非理性原因受到人们共同关注的那些就是出于心理或其他非理性原因受到人们共同关注的那些Nash均衡。均衡。 评论评论评论评论1 1
58、:在上述博弈中,每一个题目都有许多在上述博弈中,每一个题目都有许多Nash均衡。但是,在均衡。但是,在这些这些Nash均衡中,总有一些看起来或多或少可能性会更大一些。这些均衡中,总有一些看起来或多或少可能性会更大一些。这些特点的战略组合就称为聚点。特点的战略组合就称为聚点。 评论评论评论评论2 2:在重复博弈中,以往的经历或做法通常就确定了聚点的位在重复博弈中,以往的经历或做法通常就确定了聚点的位置。例如,如果我们第一次分蛋糕,往往彼此可能会同意五五分成。但置。例如,如果我们第一次分蛋糕,往往彼此可能会同意五五分成。但是,如果曾经按四六分成过,这个比例就为这次划分蛋糕提供了一个聚是,如果曾经按
59、四六分成过,这个比例就为这次划分蛋糕提供了一个聚点。点。 现实生活中聚点的例子:现实生活中聚点的例子: 企业承包分成比例企业承包分成比例 成行成市成行成市 沙滩零售店沙滩零售店第二节第二节 博弈论博弈论信息经济学信息经济学X 评评评评论论论论3 3:边边界界(boundary)是是一一种种特特殊殊的的聚聚点点。在在边边界界外外的的行行为为存存在在极极度度的的不不确确定定性性。边边界界一一旦旦确确定定就就具具有有重重要要的的作作用用和和公公共共约约束束力力,如共同知识成为一种边界后,就构成行动规则。如共同知识成为一种边界后,就构成行动规则。 例如:例如: 在在商商业业领领域域,两两家家生生产产不
60、不益益于于健健康康的的产产品品的的公公司司可可能能会会达达成成某某种默契,彼此都不在广告中提及各自产品对健康的影响程度。种默契,彼此都不在广告中提及各自产品对健康的影响程度。 家庭分工家庭分工 评评评评论论论论4 4:在在没没有有明明确确的的聚聚点点之之前前,调调解解(mediation)和和沟沟通通(communication)是十分重要的两种手段。)是十分重要的两种手段。 例如:例如: 商业纠纷或家庭财产纠纷中的律师或法庭商业纠纷或家庭财产纠纷中的律师或法庭第二节第二节 博弈论博弈论信息经济学信息经济学X( 二二二二 ) 完完完完 全全全全 信信信信 息息息息 动动动动 态态态态 博博博博
61、 弈弈弈弈 : 子子子子 博博博博 弈弈弈弈 精精精精 练练练练 NashNash均均均均 衡衡衡衡(subgame perfect Nash equilibrium)1. 1. 问题的提出问题的提出问题的提出问题的提出 (1)如如前前述述,在在多多个个 Nash均均衡衡中中,究究竟竟哪哪个个均均衡衡会会成成为为最最后后的的均衡?均衡? (2)在在Nash均均衡衡中中,局局中中人人不不考考虑虑自自己己的的选选择择如如何何影影响响其其他他局局中中人人的的战战略略(因因为为是是静静态态结结构构)。但但在在动动态态结结构构中中,后后者者会会根根据据前前者者的的行行动动来来调调整整自自己己的的战战略略
62、,因因此此,会会考考虑虑自自己己的的选选择择对对其其他他局局中中人的影响。人的影响。 (3)由由于于不不考考虑虑自自己己选选择择对对其其他他局局中中人人选选择择的的影影响响,Nash均均衡衡允许存在不可信威胁(在现实中这是不真的)。允许存在不可信威胁(在现实中这是不真的)。第二节第二节 博弈论博弈论信息经济学信息经济学X所有动态博弈的核心问题是所有动态博弈的核心问题是可信任性可信任性可信任性可信任性 手雷博弈模型手雷博弈模型手雷博弈模型手雷博弈模型第一步:局中人第一步:局中人A选择支付选择支付1000元给局中人元给局中人B还是一分不给;还是一分不给;第第二二步步:局局中中人人B观观察察局局中中
63、人人A的的选选择择,然然后后决决定定是是否否引引爆爆一一颗颗手手雷雷将两个人一起炸死。将两个人一起炸死。 假假设设局局中中人人B威威胁胁局局中中人人A,如如果果他他不不支支付付1000元元就就引引爆爆手手雷雷,如如果果局局中中人人A相相信信这这个个威威胁胁,其其最最优优反反应应是是支支付付1000元元;如如果果局局中中人人A不不相相信信这这个个威威胁胁,他他认认为为即即使使给给局局中中人人B一一个个机机会会,让让他他将将威威胁胁付付诸诸实实施施,局局中中人人B也也不不会会选选择择去去实实施施,这这样样,局局中中人人A就就会会一一分分不不给。给。第二节第二节 博弈论博弈论信息经济学信息经济学X2
64、. 2. 威胁与威慑威胁与威慑威胁与威慑威胁与威慑不可信与可信威胁不可信与可信威胁 设局中人设局中人A为潜在市场进入者,局中人为潜在市场进入者,局中人B为现有市场的占为现有市场的占有者。博弈模型如下:有者。博弈模型如下: 局中人局中人B:占有者:占有者 接接 纳纳 竞竞 争争 进入进入 20, 30 -10, 0 局中人局中人A: 进入者进入者 不进入不进入 0, 100 0, 100第二节第二节 博弈论博弈论信息经济学信息经济学X假设:假设: U1 为实施威胁的收益为实施威胁的收益 U2 为不实施威胁的收益为不实施威胁的收益可信威胁:可信威胁:U1 U2 ; 不可信威胁:不可信威胁: U2
65、U1例如:例如: 英国农民的故事英国农民的故事 母亲对儿子(不做作业)母亲对儿子(不做作业) 父亲对女儿(谈恋爱)父亲对女儿(谈恋爱)* 威胁与威慑的区别:明确与潜在的进攻或制裁信号。威胁与威慑的区别:明确与潜在的进攻或制裁信号。第二节第二节 博弈论博弈论信息经济学信息经济学X3. 3. 子博弈精练子博弈精练子博弈精练子博弈精练NashNash均衡的概念均衡的概念均衡的概念均衡的概念 Selten(1965)通过对动态博弈的分析完善了)通过对动态博弈的分析完善了Nash均衡的概念,并定义了均衡的概念,并定义了子博弈精练子博弈精练Nash均衡的含义,将均衡的含义,将Nash均衡中包含不可信威胁的
66、战略剔除出去,均衡中包含不可信威胁的战略剔除出去,使均衡战略不再包含不可信的威胁。这样,就要求局中人的选择在任何时点上使均衡战略不再包含不可信的威胁。这样,就要求局中人的选择在任何时点上都是最优的,局中人需要都是最优的,局中人需要“随机应变随机应变”或或“随需而变随需而变”,而不能因循守旧。,而不能因循守旧。 由于剔除了不可信威胁的战略,因而在多数情况下精练由于剔除了不可信威胁的战略,因而在多数情况下精练Nash均衡缩小了均衡缩小了Nash均衡的数量,这对于预测具有重要意义。均衡的数量,这对于预测具有重要意义。 通俗地说,子博弈(通俗地说,子博弈(subgame)指包含在一个博弈模型中的一个或
67、若干个)指包含在一个博弈模型中的一个或若干个阶段博弈。阶段博弈。 出国读出国读例如:例如: 考研考研 本科毕业本科毕业 在国内读在国内读 就业就业第二节第二节 博弈论博弈论信息经济学信息经济学X 子博弈的定义:子博弈的定义:子博弈的定义:子博弈的定义: 子博弈是一个对于所有局中人的信息集而言都是单结子博弈是一个对于所有局中人的信息集而言都是单结的结,这个结的后续结以及在相应的终点结处的支付三个的结,这个结的后续结以及在相应的终点结处的支付三个要素所组成的博弈。要素所组成的博弈。 如果满足下列条件,一个战略组合就是一个子博弈精如果满足下列条件,一个战略组合就是一个子博弈精练练Nash均衡(均衡(
68、subgame perfect Nash equilibrium):): 1)它是整个博弈的)它是整个博弈的Nash均衡;均衡; 2)它的相关行动规则在每个子博弈上都是)它的相关行动规则在每个子博弈上都是Nash均衡。均衡。 评论:评论:评论:评论:一个精练均衡首先必须是一个一个精练均衡首先必须是一个Nash均衡,但均衡,但Nash均衡不一定是精练均衡。只有那些剔除了不可信威胁均衡不一定是精练均衡。只有那些剔除了不可信威胁的的Nash均衡才是精练均衡才是精练Nash均衡。均衡。 第二节第二节 博弈论博弈论信息经济学信息经济学X 序惯理性序惯理性序惯理性序惯理性(sequential ratio
69、nal):指一个局中人在博):指一个局中人在博弈的每一个点上都重新优化自己的选择,并且将自己在未弈的每一个点上都重新优化自己的选择,并且将自己在未来会重新优化其选择这一点纳入到考虑之中。来会重新优化其选择这一点纳入到考虑之中。 承承承承诺诺诺诺行行行行动动动动(commitment):指指局局中中人人使使自自己己的的威威胁胁战战略略变变得得可可信信的的行行动动。通通过过承承诺诺行行动动,局局中中人人可可以以明明确确地地告告诉其他局中人其威胁是可信的威胁,而不是不可信的威胁。诉其他局中人其威胁是可信的威胁,而不是不可信的威胁。 例如:例如: 企业威胁(宣布降价)企业威胁(宣布降价) 破釜沉舟破釜
70、沉舟第二节第二节 博弈论博弈论信息经济学信息经济学X4. 4. 应用:房地产开发博弈应用:房地产开发博弈应用:房地产开发博弈应用:房地产开发博弈 两个房地产商两个房地产商A和和B,他们要作出是否在,他们要作出是否在H市进行开发的市进行开发的决策。他们面临两种市场需求的情况。决策。他们面临两种市场需求的情况。 高需求情况高需求情况 B 开发开发 不开发不开发 A 开发开发 4000,4000 8000,0 不开发不开发 0,8000 0,0 低需求情况低需求情况 B 开发开发 不开发不开发 A 开发开发 -3000,-3000 1000,0 不开发不开发 0,1000 0,0 第二节第二节 博弈
71、论博弈论信息经济学信息经济学X博弈树的表述:博弈树的表述:博弈树的表述:博弈树的表述: N 高高 低低 A A 开发开发 不不 开发开发 不不 B B B B 开开 不不 开开 不不 开开 不不 开开 不不 (4,4) (8,0)()(0,8)()(0,0)()(-3,-3)()(1,0)()(0,1)()(0,0)第二节第二节 博弈论博弈论信息经济学信息经济学X5. Selten5. Selten连锁店博弈模型连锁店博弈模型连锁店博弈模型连锁店博弈模型 假假设设有有一一家家连连锁锁店店(局局中中人人A)在在20个个城城镇镇中中有有分分店店,其其编编号号为为1,2,20。同同时时,在在每每一一
72、个个城城镇镇都都有有一一个个潜潜在在的的竞竞争争者者,即即有有一一家家公公司司可可能能通通过过银银行行贷贷款款建建立立同同样样类类型型和和规规模模的的商商店店,第第k个个城城镇镇的的潜潜在在竞竞争争者者被被称称为为局局中中人人k。这这样样,就就形形成成了了一一个个局局中中人人A与与它它的的20个个潜潜在在竞竞争争者者,即即局局中人中人k,k=1,20之间的一场博弈。之间的一场博弈。 如如果果从从传传统统的的博博弈弈论论来来考考虑虑问问题题,结结论论应应该该是是每每个个潜潜在在竞竞争争者者在在条条件件许许可可下下,都都会会采采取取“进进入入”策策略略,即即开开设设一一家家与与连连锁锁店店同同类类
73、型型的的商商店店,而而连连锁锁店店则则应应该该对对新新开开设设的的商商店采取店采取“接纳接纳”策略,以便取得更多的收益。策略,以便取得更多的收益。第二节第二节 博弈论博弈论信息经济学信息经济学X 然而,这个结论与实际情况并不符合。几乎所有的人都然而,这个结论与实际情况并不符合。几乎所有的人都会认为,连锁店应该对新开设的商店采取会认为,连锁店应该对新开设的商店采取“攻击攻击”策略,以策略,以保持其垄断地位。另一种方案是连锁店对前面保持其垄断地位。另一种方案是连锁店对前面N家商店采取家商店采取“攻击攻击”策略,而对后策略,而对后20-N家采取家采取“合作合作”策略。这种方案策略。这种方案似乎更符合
74、实际。似乎更符合实际。 Selten对这个对这个“连锁店博弈悖论连锁店博弈悖论”进行了深入分析,提出进行了深入分析,提出了分层次的理性抉择的概念,认为人们对察觉到的理性解决了分层次的理性抉择的概念,认为人们对察觉到的理性解决方案,不一定会采取行动。方案,不一定会采取行动。第二节第二节 博弈论博弈论信息经济学信息经济学XSelten连锁店博弈模型的应用:连锁店博弈模型的应用: 爱情博弈模型:爱情博弈模型:n个小伙子同时爱上一位姑娘,每个个小伙子同时爱上一位姑娘,每个小伙子的占有策略是什么?小伙子的占有策略是什么? 对于任意局中人对于任意局中人i,竞争者均为,竞争者均为n-1个。个。 毛泽东抗日战
75、争与解放战争时期的策略:毛泽东抗日战争与解放战争时期的策略: * 抗日战争时期:抗日民族统一战线抗日战争时期:抗日民族统一战线 * 解放战争时期:除国民党顽固派之外的所有力量解放战争时期:除国民党顽固派之外的所有力量 春秋战国时期:秦国春秋战国时期:秦国“远交近攻远交近攻”策略策略 市场竞争策略市场竞争策略第二节第二节 博弈论博弈论信息经济学信息经济学X6. 6. 重复博弈重复博弈重复博弈重复博弈(repeated play) 重复博弈,即是战略依存的厂商(局中人)在长期内相重复博弈,即是战略依存的厂商(局中人)在长期内相互竞争的状态。互竞争的状态。 在现实中,寡头垄断厂商之间存在重复博弈。重
76、复博弈在现实中,寡头垄断厂商之间存在重复博弈。重复博弈将改变局中人对博弈的观点,并产生基于长期考虑的新战略,将改变局中人对博弈的观点,并产生基于长期考虑的新战略,即重复博弈的一种可能结果是产生合作行为。即重复博弈的一种可能结果是产生合作行为。 典型的重复博弈包括:典型的重复博弈包括: 公开串谋(公开串谋(explicit collusion) 暗中串谋(暗中串谋(tacit collusion) 毛泽东博弈(针锋相对)毛泽东博弈(针锋相对) 中国帝王的激励机制中国帝王的激励机制(一人得道,鸡犬升天;一人犯法,株连九族)(一人得道,鸡犬升天;一人犯法,株连九族)第二节第二节 博弈论博弈论信息经济
77、学信息经济学X重复博弈应用:军备竞赛(重复博弈应用:军备竞赛(重复博弈应用:军备竞赛(重复博弈应用:军备竞赛(2 2) 假假设设美美苏苏两两国国现现在在还还有有第第三三种种策策略略选选择择:有有限限军军备备。这这样,双方选择的支付改变为:样,双方选择的支付改变为: 苏苏 联联 扩扩 军军 有有 限限 裁裁 军军 扩扩 军军 -2000,-2000 -1600,-1500 8000,- 美美 国国 有有 限限 -1500,-1600 -500,-500 9500,- 裁裁 军军 - ,8000 -,9500 0,0 第二节第二节 博弈论博弈论信息经济学信息经济学X(三)不完全信息静态博弈:贝叶斯
78、(三)不完全信息静态博弈:贝叶斯(三)不完全信息静态博弈:贝叶斯(三)不完全信息静态博弈:贝叶斯NashNash均衡均衡均衡均衡 (Bayesian Nash equilibrium) 有时,人们将不完全信息博弈称为贝叶斯博弈。在完全有时,人们将不完全信息博弈称为贝叶斯博弈。在完全信息博弈中,局中人的支付函数是共同知识。在不完全信息信息博弈中,局中人的支付函数是共同知识。在不完全信息博弈中,至少有一个局中人不能确定另一局中人的支付函数。博弈中,至少有一个局中人不能确定另一局中人的支付函数。 密封报价拍卖、工程招标等都是常见的不完全信息静态密封报价拍卖、工程招标等都是常见的不完全信息静态博弈的例
79、子。博弈的例子。1. 1. 不完全信息的市场进入博弈不完全信息的市场进入博弈不完全信息的市场进入博弈不完全信息的市场进入博弈 在市场进入博弈中,潜在进入企业决定是否进入一个在市场进入博弈中,潜在进入企业决定是否进入一个新市场,但不了解现有企业的成本函数,不了解现有企业决新市场,但不了解现有企业的成本函数,不了解现有企业决定接纳还是竞争。定接纳还是竞争。第二节第二节 博弈论博弈论信息经济学信息经济学X 假设现有企业有两种可能的成本函数:高成本和低成本。假设现有企业有两种可能的成本函数:高成本和低成本。对应两种成本情况的不同战略组合的支付矩阵如下:对应两种成本情况的不同战略组合的支付矩阵如下: 现
80、有企业现有企业 高成本情况高成本情况 低成本情况低成本情况 接纳接纳 竞争竞争 接纳接纳 竞争竞争 进入进入 40,50 -10, 0 30,80 -10,100 进入企业进入企业 不进入不进入 0, 300 0,300 0,400 0, 400 在该模型中,进入企业对有关现有企业的成本信息掌握是不完全的,但现有在该模型中,进入企业对有关现有企业的成本信息掌握是不完全的,但现有企业了解进入企业的成本函数。如果现有企业是高成本,当进入企业进入时最优企业了解进入企业的成本函数。如果现有企业是高成本,当进入企业进入时最优选择是选择是接纳接纳;如果是低成本,则最优选择是;如果是低成本,则最优选择是竞争
81、竞争。 在不完全信息条件下,进入企业的最优选择依赖于它在多大程度上认为现有在不完全信息条件下,进入企业的最优选择依赖于它在多大程度上认为现有企业是高成本还是低成本。企业是高成本还是低成本。第二节第二节 博弈论博弈论信息经济学信息经济学X 假设进入企业认为现有企业是高成本的概率是假设进入企业认为现有企业是高成本的概率是p,低成本的概率是,低成本的概率是1-p。进入企业选择进入的期望利润是。进入企业选择进入的期望利润是p(40)+(1-p)()(-10),选择不),选择不进入的期望利润是进入的期望利润是0。 因此,进入企业的最优选择是:因此,进入企业的最优选择是: 1)如果)如果p大于等于大于等于
82、1/5,则进入;,则进入; 2)如果)如果p小于小于1/5,则不进入(当,则不进入(当p=1/5时,进入企业在进入与不进时,进入企业在进入与不进入之间无差异,假定其进入)。入之间无差异,假定其进入)。 评论:评论:评论:评论:在该模型中,进入企业似乎是在与两个不同的现有企业博弈,一个在该模型中,进入企业似乎是在与两个不同的现有企业博弈,一个是高成本的现有企业,另外一个是低成本的现有企业。一般地,如果现有企业是高成本的现有企业,另外一个是低成本的现有企业。一般地,如果现有企业有有T种可能的不同成本函数,进入企业似乎是在与种可能的不同成本函数,进入企业似乎是在与T个不同的现有企业博弈。在个不同的现
83、有企业博弈。在1967年以前,博弈论学者认为这样的不完全信息博弈无法分析,因为当一个局年以前,博弈论学者认为这样的不完全信息博弈无法分析,因为当一个局中人不了解他在与谁博弈时,博弈的规则是无法确定的。中人不了解他在与谁博弈时,博弈的规则是无法确定的。第二节第二节 博弈论博弈论信息经济学信息经济学X2. Bayes2. Bayes博弈模型博弈模型博弈模型博弈模型 设设博博弈弈中中有有N个个局局中中人人,每每个个局局中中人人i都都有有一一个个行行动动集集Ci,一一个个可可能能的的类类型型集集Ti,一一个个概概率率函函数数pi以以及及一一个个效效用用函函数数ui,那么,这就构成了一个,那么,这就构成
84、了一个Bayes博弈的模型。博弈的模型。 这这种种Bayes博博弈弈的的典典型型例例子子是是商商业业谈谈判判。局局中中人人是是买买方方和和卖卖方方,商商品品对对双双方方都都有有个个底底价价,但但这这点点并并不不为为对对方方所所掌掌握握。假设商品的价格可能是假设商品的价格可能是10元直到元直到100元。元。 如如果果双双方方报报价价,按按常常规规,如如果果买买方方的的报报价价高高于于卖卖方方的的报报价价,那那么么,他他们们就就在在两两者者的的中中间间价价成成交交;否否则则,就就不不成成交交。于是,这就构成了一个于是,这就构成了一个Bayes博弈。博弈。第二节第二节 博弈论博弈论信息经济学信息经济
85、学X3. Harsanyi3. Harsanyi转换转换转换转换 1967年,海萨尼(年,海萨尼(John Harsanyi)指出,所有在原来定)指出,所有在原来定义下的不完全信息博弈都可以在不改变其本质的前提下被重义下的不完全信息博弈都可以在不改变其本质的前提下被重新模型化为一个完全但不完备的信息博弈。这一切只需要增新模型化为一个完全但不完备的信息博弈。这一切只需要增加一个由自然在不同规则集合中进行选择的初始行动就可以加一个由自然在不同规则集合中进行选择的初始行动就可以了。在转换后的博弈中,全体局中人都了解新的可变的规则。了。在转换后的博弈中,全体局中人都了解新的可变的规则。 Harsany
86、i的思想可以表述为:的思想可以表述为: 引入一个虚拟的局中人引入一个虚拟的局中人“自然自然自然自然”,自然首先行动决定,自然首先行动决定局中人的特征,局中人了解自己的特征,但其他局中人不了局中人的特征,局中人了解自己的特征,但其他局中人不了解。解。第二节第二节 博弈论博弈论信息经济学信息经济学X N 自然选择不同行动的概率自然选择不同行动的概率 高高 低低 pp 进入企业进入企业 1-p1-p 不进入不进入 进入进入 不进入不进入 进入进入 现有企业现有企业 现有企业现有企业 (0,300) (0,400) 接纳接纳 竞争竞争 接纳接纳 竞争竞争 (40,50) (-10,0) (30,80)
87、 (-10,100)Harsanyi转换后的市场进入博弈转换后的市场进入博弈第二节第二节 博弈论博弈论信息经济学信息经济学X4. 4. 贝叶斯纳什均衡:求爱博弈贝叶斯纳什均衡:求爱博弈贝叶斯纳什均衡:求爱博弈贝叶斯纳什均衡:求爱博弈 假假设设当当有有人人向向你你求求爱爱时时,你你是是否否接接受受依依赖赖于于对对求求爱爱者者品品德德的的判判断断。假假设设如如果果你你准准确确知知道道求求爱爱者者品品德德良良好好,则则选选择择接接受受;反反之之则则不不接接受受。但但是是,你你可可能能并并不不准准确确地地知知道道求求爱爱者者的的品品德德。这这时时,你你的的决决策策依依赖赖于于你你在在多多大大程程度度上
88、上相相信信他他是是一一个个品品德德优优良良(或或恶恶劣劣)的的人人。下下面面分分别别是是两两种种情情况况下的支付矩阵。下的支付矩阵。 假设:无论求爱者品德如何,只要他求爱你接受,他就得到假设:无论求爱者品德如何,只要他求爱你接受,他就得到100。但你的支付依赖于求爱。但你的支付依赖于求爱者的类型,接受一个品德良好的求爱者得者的类型,接受一个品德良好的求爱者得100,反之则损失,反之则损失100。求爱者(不论类型如何)在。求爱者(不论类型如何)在你拒绝时损失你拒绝时损失50。第二节第二节 博弈论博弈论信息经济学信息经济学X 讨讨讨讨论论论论:假假设设你你认认为为求求爱爱者者品品德德优优良良的的概
89、概率率为为p。求求爱爱者者也也知知道道这这个个p为为多多少少,那那么么,他他求求爱爱你你接接受受时时你你的的预预期期效效用用为为100p+(-100)(1-p),不不接接受受时时的的预预期期效效用用为为零零。当当p1/2时时,接接受受才才是是最最优优选选择择。如如果果p确确实实大大于于1/2,贝贝叶叶斯斯(纳纳什什)均均衡衡是是:求求爱爱者者求求爱爱,你你接接受受。反反之之,如如果果p=支出成本最小投入=资源存量价值最大投入=资源存量第二节第二节 非线性规划理论非线性规划理论信息经济学信息经济学X 本章小结本章小结1.规范研究和实证研究是信息经济学研究的基本方法。规范研究和实证研究是信息经济学
90、研究的基本方法。2.信信息息经经济济学学在在经经济济学学的的基基础础上上将将经经典典假假设设完完全全信信息息改改变变为为不不完完全全信信息息,并并由由此此构构建建的的模模型型与与经经典典均均衡衡理理论论不不同同,得得到到的的市市场场效效率率机机制制也也就就不不同同。在在这这一一规规范范研研究究得得出出理理论论的的基基础础上上,实实证证对对此此作作出出进进一一步步的的检检验验说明。说明。3.博弈论是信息经济学的主流研究方法之一博弈论是信息经济学的主流研究方法之一4.依依据据博博弈弈信信息息结结构构的的不不同同,博博弈弈可可分分为为完完全全信信息息静静态态博博弈弈、不不完完全全信信息息静静态态博博
91、弈弈、完完全全信信息息动动态态博博弈弈、不不完完全全信信息息动动态态博博弈弈四四大大类类,这这分分别与四类均衡结果相对应。别与四类均衡结果相对应。5.除除了了运运用用博博弈弈论论的的数数理理推推导导之之外外,信信息息经经济济学学引引入入了了广广为为经经济济学学界界运运用用的的非非线线性性规规划划理理论论,以以及及规规范范分分析析、实实证证分分析析方方法法。这这些些分分析析都都为为信息经济学的发展提供了较博弈论更为广阔的研究领域。信息经济学的发展提供了较博弈论更为广阔的研究领域。信息经济学信息经济学X本章要点本章要点规范研究的基本假设实证研究的结论讨论博弈的基本要素、类型及其均衡的求解非线性规划
92、的应用模型信息经济学信息经济学X课堂延伸课堂延伸规范研究的学习“柠檬”市场:质量不确定性与市场机制趣味博弈:海盗分金币的博弈求解信息经济学信息经济学X推荐阅读文献:推荐阅读文献:1. (美)罗伯特(美)罗伯特 吉本斯吉本斯Gibbons:博弈论基础(中译本),中国社:博弈论基础(中译本),中国社会科学出版社,会科学出版社,1999年年2. 张维迎张维迎博弈论与信息经济学博弈论与信息经济学,上海三联书店,上海三联书店,1996年年3. 王则柯,王则柯,博弈论平话博弈论平话,中国经济出版社,中国经济出版社,1998年年4. 博弈生存博弈生存社会现象的博弈论解读社会现象的博弈论解读,中央编译出版社,中央编译出版社,2004年年5. 黄韬等,博弈论的发展与创新,黄韬等,博弈论的发展与创新,财经问题研究财经问题研究,1995年第年第5期期6. 刘军跃等,从博弈论看刘军跃等,从博弈论看“格兰仕格兰仕”与与“美的美的”之争,之争,商业研究商业研究,2002年第年第5期期