{企业通用培训}博弈论与信息经济经济学系学培训

资源描述

《{企业通用培训}博弈论与信息经济经济学系学培训》由会员分享，可在线阅读，更多相关《{企业通用培训}博弈论与信息经济经济学系学培训（185页珍藏版）》请在金锄头文库上搜索。

1、博弈论与信息经济学,经济学系陶金13387555749 E-mail:,参考文献： 1.艾里克拉斯穆森（Eric Rasmusen），博弈与信息：博弈论概论，中国人大出版社第三、四版，。 2.克里斯汀蒙特等（Christian Montet），博弈论与经济学，经济管理出版社2005年版。 3.朱弗登博格和让梯若尔(Drew Fudenberg and Jean Tirole)，博弈论，中国人大出版社2002年版。 4.张维迎，博弈论与信息经济学，上海人民出版社1996年版。 5.谢炽予，经济博弈论，复旦大学出版社第三版。,第一章导论,“正如理性预期学派使宏观经济学发生革命一样，博弈论广泛而

2、深远地改变了经济学家的思维方式。” 让梯若尔（ Jean Tirole ）（和让雅克拉丰一起创立图卢兹学派）,经济学与博弈论的契合,20世纪80年代以来，博弈论迅速成为主流经济的重要组成部分，几乎吞没了整个微观经济学，就如同计量经济学吞没了“经验经济学”一样。为什么？博弈论的研究范式：建模者对players规定pay-off functions 和strategy sets，观察当参与人选择策略以最大化其支付时会产生什么结果。,原因一，博弈论的研究范式是“Maximization Subject to Constraints”和“No Free Lunch”经济学思想的结合。原因二，主流

3、经济学对寡头垄断的束手无策。,博弈论是建模的工具，它依赖于ideas。运用博弈论建模的方式通常称为“无脂建模”（no-fat modeling）或者实例建模（modeling by example）或者实例化理论。 Fisher“实例化理论并不告诉我们什么是必将发生的，而只告诉我们什么是可以发生的。”,社会的两个基本问题：协调（coordination) 协调问题的核心是预测（prediction)：预测其他人如何行为；合作（cooperation) 合作问题的核心是激励(incentive) 个人行为与社会利益的冲突什么是个人的最优选择？什么是社会的最优选择？如何把个人行为与社会

4、利益统一起来？,“美丽心灵”纳什,在1994年诺贝尔经济学奖揭晓的那天下午，普林斯顿大学为纳什举行了一个小型香槟酒会。纳什在会上说，他不习惯发表讲话，但这次他有三件事要说。第一件事就是，他希望获得诺贝尔奖可以改善他的信用评级，因为他实在太需要一张信用卡了；第二件是他更希望自己能够独享诺贝尔奖，因为他太需要那笔钱，他要为自己的住房支付欠款；第三件是他认为自己的博弈论研究是与超弦理论类似的高度智力课题，其实用性也许是次要的或者可疑的,美国数学家约翰纳什、约翰海萨尼、莱因哈德泽尔腾因在非合作博弈均衡分析理论方面做出了开创性贡献，从而对博弈论和经济学产生了重大影响，而共同获得诺贝尔经济学奖。,非

5、合作博弈和合作博弈,区分的依据：约束力的协议（binding agreement）内生与外生研究的重点：非合作博弈强调的重点主要在个人行为；合作博弈强调的重点在于参与者联盟会形成什么样的联盟，他们之间如何瓜分合作的收益等。,均衡s*=(s1 *，sn *)是指由博弈的n个参与人每人选取的最佳策略所组成的一个策略组合。那什么是最佳策略呢？,纳什均衡的精炼逻辑,NE MSNE SPE PTHE BNE PBE和SE PTHESE PBE SPE NE,NE的不存在需要对NE扩展,NE的多重性需要对NE精炼,对SPE“完美”,对SPE“序贯”,引入不完全信息需要对NE概括,Mixed str

6、ategy nash equilibrium,Sub-game perfect equilibirum,Perfect trembling hand equilibirum,Bayes nash equilibrium,Sequential equilibirum,Perfect Bayes equilibirum,精炼,博弈论的关键：如何预测对方的行动,博弈论关注的是意识到其行动将相互影响的决策者们的行为。也就是说博弈论涉及那些真实生活中的情形当理性的人们彼此相互作用的时候，即当某个人的行动依赖于他人如何行动的时候。,一、博弈的要素,博弈的要素包括：参与人（players）、行动（actio

7、ns）、信息(information)、策略(strategies)、支付(payoffs)、结果(outcome)和均衡(equilibrium)。对一个博弈的描述至少必须包括参与人、策略和支付；而行动和信息则是建筑材料。,1参与人,参与人是独立决策和独立承担结果的个人或组织。每个参与人的目标都是通过选择来最大化自身的效用(理性)。假设我们构造一个“OPEC模型”，我们将参与人设定为沙特阿拉伯（S）和其他生产者（O），消费者只是被动的个体不是参与人，只是环境参数。,要理解何种情形适宜用博弈来模型化，考察以下几个例子： 1OPEC成员国选择其年产量 2GM向USX（美国最大的钢材商）购买钢材

8、 3中石油在全国招聘工人 4一家电力公司在估计了未来10年对电力的需求后，决定是否购置一套新的发电机组。,1OPEC成员国的产量都会影响世界油价 2双方的产量或需求量会影响价格 3每个工人对中石油的影响微乎其微 4电力公司决策的复杂性并非来自另一个理性的主体如何改变重要的经济变量使3和4转化成博弈？,自然是一种虚拟的参与人，它在博弈的特定时点上以特定的概率随机选择行动。自然的支付是无差异的。,在“OPEC模型”中，我们用D来表示石油的需求。我们还可以假定需求只分“强”和“弱”。假设前者的概率为70%，后者为30%。一个博弈会因随机变动的结果不同而有着不同的结果。,2行动,参与人i的行动以a

9、i表示，是他能做的某一选择。参与人的行动集（action set ）, Ai=ai,是其可以采用的全部行动的集合。一个行动组合（action profile）是一个由博弈中的n个参与人每人选择一个行动所组成的有序集，a= ai,i=1,2, ,n,除了设定对于参与人来说何种行动是可行的之外，还必须设定何时这种行动是可行的。这就是行动顺序（order of play）若石油生产要求提前计划，则一国在博弈之初就选择两年的产量，OPEC模型的行动顺序可以是：,第一步，自然选择需求D，强或弱第二步，S从如下行动集中选择其1998和1999的产量： (Qs,8=L, Qs,9=L ),(Qs,8

10、=L, Qs,9=H) (Qs,8=H, Qs,9=L ),(Qs,8=H, Qs,9=H) O同时从其相应行动集中选择其产量。,3信息,既然博弈的关键是预测行动，信息理所当然是重要的。信息是以信息集的概念来模型化的。可以将参与人的信息集看做是他在特定时点对于不同变量的取值的了解。信息集的要素包括参与人认为可能的不同值。若有很多元素，则表明存在参与人无法排除的许多取值。若只有一个元素，则表明他准确知道这些变量的取值。,我们假定，在自然行动后，沙特知道世界石油需求是强还是弱，但其他生产者无法排除任何一种可能，因此模型的信息集为：其他生产者：D=强，D=弱沙特：D=强或D=弱，视需求而定。

11、参与人的信息集不仅包括如石油需求强度等变量取值的差别，还包括对已采取过什么行动的了解。因此信息集是变化的。,博弈的信息 (Information),完美（perfect）或不完美信息的，是指博弈的规则而言：如果参考者在选择自己行动时对于前面发生的情况很清楚，并且假设没有同时的行动，那么就是完美信息；否则就是不完美信息的。完全(complete)或不完全信息，是指博弈进行的环境而言，是指参与者之间对博弈的各个方面相互了解的程度。,不完全信息和不完美信息的区别,不完全信息指的是参与者的信息特征；不完美信息指的是博弈的信息结构。后面会讲到，经过海萨尼转换，任何不完全信息博弈都可以转化为不完美信

12、息博弈。,什么是“共同知识”（Common Knowledge）最早出现在哲学领域（David Lewis）,1976年奥曼(Aumann)引入到博弈论中。举例说明。,理性的共同知识（common knowledge of rationality),(1)Zero-order CKR: 每个人都是理性的，但不知道其他人是否是理性的； (2)first-order CKR: 每个人是理性的，并且知道其他每个人也都是理性的，但并不知道其他人是否知道自己是理性的； (3)second-order CKR: (1)+(2)+每个人知道（2） nth-order CKR: R(b)C(b)R(b)C

13、(b)R is rational,4策略,参与人的策略si是如下一项规则：给定其信息集，该策略决定在博弈的每一时点他选择何种行动。参与人的策略集或策略空间Si= si是其可行策略的集合。策略组合（strategy profile）s=(s1, ,sn)是由博弈的n个参与人每人选择一个策略组成的策略集。,策略与行动的区别,参与人的策略是一个关于其行动程序的完备集合（complete set），它告诉参与人在每一种可预见的情况下选择什么行动，即使参与人并不预期那种情况真的会出现。这一描述的完备性也意味着策略与行动的不同之处在于它是不可观测的，行动是物质上的，但策略仅是意识上的。,5支付,在所

14、有参与人和自然都选择了各自策略且博弈已经完成之后，参与人i获得的效用或期望效用。在OPEC模型中，可以将沙特和其他生产者的支付设为两个生产年份中石油收入的总和。,6结果,一个博弈的结果是指在博弈结束之后，建模者从行动、支付和其他变量的取值中所挑选出来的他感兴趣的要素的集合。结果的定义取决于建模者所感兴趣的是什么。 OPEC模型的一个结果是： Qs,8=L,Qs,9=H,Qo,8=H, Qo,9=L,D=L,Rs=100,Ro=80 结果可以狭义地定义为仅仅是支付或产量水平的集合。选择何种定义取决于建模者认为对OPEC而言什么是最有意义的。,7均衡,均衡s*=(s1 *，sn *)是指由博弈的

15、n个参与人每人选取的最佳策略所组成的一个策略组合。策略组合是一组策略的集合，而结果指的是感兴趣的一组变量的取值集合。,不同的策略组合有时会导致不同的结果（Qs,8=L,Qs,9=L,Qo,8=L, Qo,9=L,D=强,Rs=100,Ro=80）这一结果可以由下述任一策略产生。黄金规则：无论如何都选择低产量。沙特：（Qs,8=L, Qs,9=L）其他生产者：（Qo,8=L, Qo,9=L）,白银规则：针锋相对沙特阿拉伯：（Qs,8=L；若Qo,8=L, 则 Qs,9=L ，否则Qs,9=H ）其他生产者：（Qo,8=L；若Qs,8=L, 则 Qo,9=L ，否则Qo,9=H

16、）要记住的是：行动与策略、结果与均衡之间是存在严格区别的。,8均衡概念,仅仅规定参与人、策略与支付还不足以找到均衡，因为建模者还必须决定“最优策略”到底是什么意思。这一点可以通过定义一个均衡概念来实现。只有几种均衡概念被普遍接受，如优势策略均衡（dominant strategy equilibrium）和纳什均衡(Nash equilibrium)。,第二章分散化决策,这章考察的是一种完全忽略其他参与者决策的非合作博弈。这种决策无须关于其他决策者的任何知识，因为这里的“环境”ENVIORMENT就是不考虑策略性的不确定性。,一、优势策略均衡（Dominant Strategy Equilibrium）,如果无论其他参与人选择什么策略，策略si*都是参与人i的强最佳应对，那么si*就称为优势策略。这意味着无论别人选择什么策略， si*都使参与人i的支付最大化。从数学上讲ui(si*, s-i) ui(si, s-i) 对于任何si si*,对于参与人i而言较差的策略称为劣式策

展开阅读全文

{企业通用培训}博弈论与信息经济经济学系学培训

最新文档