经济博弈论基础电子教案完整版

上传人:桔**** 文档编号:585444238 上传时间:2024-09-02 格式:PPT 页数:319 大小:5.55MB
返回 下载 相关 举报
经济博弈论基础电子教案完整版_第1页
第1页 / 共319页
经济博弈论基础电子教案完整版_第2页
第2页 / 共319页
经济博弈论基础电子教案完整版_第3页
第3页 / 共319页
经济博弈论基础电子教案完整版_第4页
第4页 / 共319页
经济博弈论基础电子教案完整版_第5页
第5页 / 共319页
点击查看更多>>
资源描述

《经济博弈论基础电子教案完整版》由会员分享,可在线阅读,更多相关《经济博弈论基础电子教案完整版(319页珍藏版)》请在金锄头文库上搜索。

1、经济博弈论基础经济博弈论基础Economic Game Theory 第一章绪 论 第一节第一节 博弈论与经济学博弈论与经济学第二节第二节 经济博弈论的产生与发展经济博弈论的产生与发展第三节第三节 经济博弈论内容体系经济博弈论内容体系经济博弈论内容体系经济博弈论内容体系 主要内容主要内容一、博弈论的研究对象一、博弈论的研究对象 博弈论是研究在利益相互影响的局势中,博弈论是研究在利益相互影响的局势中,局中人如何选择自己的策略才能使自身的收益最局中人如何选择自己的策略才能使自身的收益最大化的均衡问题,是研究聪明而又理智的决策者大化的均衡问题,是研究聪明而又理智的决策者在冲突或合作中的策略选择理论。

2、在冲突或合作中的策略选择理论。 第一节、博弈论与经济学 1. 1. 从经济学的研究对象来看从经济学的研究对象来看& 传统观点:经济学是研究有限资源的最优配置的传统观点:经济学是研究有限资源的最优配置的 一门学科。一门学科。物尽其用物尽其用& 现代观点:经济学是研究理性人行为的一门学科。现代观点:经济学是研究理性人行为的一门学科。 人尽其才人尽其才 理性人理性人 合作与冲突合作与冲突 博弈论博弈论 从从“物尽其用物尽其用” 到到“人尽其才人尽其才” 二二、博弈论与经济学的关系、博弈论与经济学的关系2. 2. 从新古典经济学的两个假设来看从新古典经济学的两个假设来看假设一假设一:市场是完全竞争的;

3、:市场是完全竞争的;假设二假设二:市场是完全信息的。:市场是完全信息的。& 结结 论论:市场可以达到一般均衡,资源配置达到:市场可以达到一般均衡,资源配置达到 ParetoPareto最优。最优。两个假设与现实的背离,引出博弈论。两个假设与现实的背离,引出博弈论。从从“一般均衡一般均衡” 到到“博弈均衡博弈均衡” 二二、博弈论与经济学的关系、博弈论与经济学的关系3. 3. 从传统的消费理论来看从传统的消费理论来看& 传统消费理论:传统消费理论:& 缺缺陷陷:没没有有考考虑虑消消费费者者之之间间的的相相互互影影响响问问题题 经济学离不开博弈论经济学离不开博弈论 二二、博弈论与经济学的关系、博弈论

4、与经济学的关系 在经济系统中,各经济实体都有自己的利在经济系统中,各经济实体都有自己的利益益( (主要是经济利益主要是经济利益) )。利益决定着经济实体的经济行。利益决定着经济实体的经济行为。而现代经济博弈论在承认各经济实体利益的基础为。而现代经济博弈论在承认各经济实体利益的基础上,更加侧重研究经济主体行为特征,能够协调它们上,更加侧重研究经济主体行为特征,能够协调它们的利益,更加侧重研究经济主体的利益,更加侧重研究经济主体( (局中人局中人) )的行为方案的行为方案( (策略策略) )与其利益得失与其利益得失( (支付函数支付函数) )的关系,从而推动经的关系,从而推动经济发展和社会进步。济

5、发展和社会进步。 三三、博弈论的作用、博弈论的作用 博弈论思想源远流长,而能作为现代博弈论博弈论思想源远流长,而能作为现代博弈论研究对象和内容的起源的博弈思想和实践活动而言,研究对象和内容的起源的博弈思想和实践活动而言,则可追溯到则可追溯到20002000多年前齐王与田忌赛马以及多年前齐王与田忌赛马以及孙子兵孙子兵法法中的军事博弈。中的军事博弈。 第二节、经济博弈论的产生与发展第二节、经济博弈论的产生与发展18381838年,年,CournotCournot 两寡头产量竞争模型两寡头产量竞争模型 Antoine Antoine AugustinAugustin CournotCournot,

6、, RecherchesRecherches sursur les les PrincipesPrincipes MathematiquesMathematiques de la de la TheorieTheorie des des RichessesRichesses , , 1838. 1838. English Edition: Researches into the Mathematical English Edition: Researches into the Mathematical Principles of the Theory of Wealth, edited by

7、N. Principles of the Theory of Wealth, edited by N. Bacon, New York: Macmillan, 1897.Bacon, New York: Macmillan, 1897.古诺古诺. .财富理论的数学原理的研究财富理论的数学原理的研究,商务印书馆,商务印书馆,19941994 一、经济一、经济博弈论的产生博弈论的产生18831883年,年,BertrandBertrand两寡头价格竞争模型两寡头价格竞争模型Bertrand, J., Theorie Mathematique de la Richesse Sociale, Jour

8、nal des Savants, 1883, 499-508. 一、经济一、经济博弈论的产生博弈论的产生作为博弈论诞生的标志作为博弈论诞生的标志Von Neumann, J. & O. Morgenstern, The Theory of Games and Economic Behavior, Princeton University Press, 1944.冯冯诺依曼和摩根斯顿诺依曼和摩根斯顿: :博弈论与经济行为博弈论与经济行为三联书店三联书店, 2004., 2004.John von Neumann (1903-1957)Oskar Morgenstern (1902-1977)非合

9、作博弈均衡理论非合作博弈均衡理论John F. NashJohn F. Nash: : 美国普林斯顿大学美国普林斯顿大学ReinhardReinhard SeltenSelten: : 德国波恩大学德国波恩大学John John C.HarsanyiC.Harsanyi: : 美国加州大学泊克莱分美国加州大学泊克莱分校校 19941994年年NobelNobel经济学奖经济学奖 1、The bargaining problem, Econometrica, 1950, 18: 155162. 2、Equilibrium points in n-person games, Proceedings

10、 of the National Academy of Sciences, 1950, 36: 4849. John F. Nash John F. Nash 的代表作的代表作 3、Noncooperative games, Doctoral dissertation, 1950. 4、Noncooperative games, Ann. of Math. , 1951, 54: 286295. 5、Two-person cooperative games, Econometrica, 1953, 21: 128140. John F. Nash John F. Nash 的代表作的代表作 1

11、、Spieltheoretische Behandlung eines Oligopol-modells mit Nachfragetr gheit, Zeitschrift fur die gesamte Staatswissenschaft, 1965, 12: 301324. 2、Re-examination of the perfectness concept for equilibrium points in extensive games, International Journal of Game Theory, 1975, 4: 2555. 3、 The Chain-Store

12、 Paradox, Theory and Decision, April 1978, 9: 127129. ReinhardReinhard SeltenSelten 的代表的代表作作 1、 Games with incomplete information played by Bayesian players I II & III, Management Science, 196768,14: 159182, 320334, 486502. 2、Rational Players and Bargaining Equilibrium in Games and Social Situations

13、, Cambridge University Press, 1977. 3、Harsanyi, J. And R. Selten, A General Theory of Equilibrium Selection in Games, Cambridge: MIT Press, 1988. John C. John C. HarsanyiHarsanyi 的代表的代表作作非对称信息下的激励机制设计理论非对称信息下的激励机制设计理论James A. James A. MirrleesMirrlees: : 英国剑桥大学英国剑桥大学William William VickreyVickrey: :

14、 美国哥伦比亚大学美国哥伦比亚大学 1996年Nobel经济学奖逆向选择:非对称信息下的市场交易理论逆向选择:非对称信息下的市场交易理论George George AkerlofAkerlof 美国加州大学泊克莱分美国加州大学泊克莱分校校Michael SpenceMichael Spence 美国斯坦福大学美国斯坦福大学Joseph E. Joseph E. StiglitzStiglitz 美国哥伦比亚大学美国哥伦比亚大学 20012001年年NobelNobel经济学奖经济学奖通过博弈论分析而增进我们对冲突和合作的理解通过博弈论分析而增进我们对冲突和合作的理解Robert J. Robe

15、rt J. AumannAumann 以色列耶路撒冷希伯来大学理性研究以色列耶路撒冷希伯来大学理性研究中心中心Thomas C. Schelling Thomas C. Schelling 美国哈佛大学肯尼迪政府学院和马美国哈佛大学肯尼迪政府学院和马里兰大学经济学系暨公共政策学院里兰大学经济学系暨公共政策学院 20052005年年NobelNobel经济学奖经济学奖机制设计理论机制设计理论 Leonid Leonid HurwiczHurwicz 美国明尼苏达大学经济学教授美国明尼苏达大学经济学教授 Eric S.Eric S. MaskinMaskin 普林斯顿大学社会科学院高等研究普林斯顿

16、大学社会科学院高等研究院院 Roger B.Roger B. Myerson Myerson 芝加哥大学经济系教授芝加哥大学经济系教授 20072007年年NobelNobel经济学奖经济学奖 Leonid HurwiczLeonid Hurwicz 生于生于19171917年年8 8月月2121日日 美国明美国明尼苏达大学经济学名誉教尼苏达大学经济学名誉教 授,其授,其主要研究领域包括机制和主要研究领域包括机制和 机构设机构设计以及数理经济学。计以及数理经济学。 20072007年年NobelNobel经济学奖经济学奖 Eric S. Maskin 普林斯顿大学社会科学院普林斯顿大学社会科学

17、院 高等研究院教授,其经济学理论已高等研究院教授,其经济学理论已经经 在经济、政治科学及法律的领域产在经济、政治科学及法律的领域产生生 了深远影响。目前的研究课题为机了深远影响。目前的研究课题为机制制 设计理论,重复博弈,收入不均衡设计理论,重复博弈,收入不均衡问问 题以及投票题以及投票理论。理论。 20072007年年NobelNobel经济学奖经济学奖Roger B. MyersonRoger B. Myerson 芝加哥大学经济系教授,芝加哥大学经济系教授,19761976年获得哈佛大学应年获得哈佛大学应用数学系哲学博士学位,其博士论文题为:一种合作博弈用数学系哲学博士学位,其博士论文题

18、为:一种合作博弈理论理论 (A Theory of Cooperative Games) (A Theory of Cooperative Games) 20072007年年NobelNobel经济学奖经济学奖博弈论成为主流经济学的一部分博弈论成为主流经济学的一部分1. 1. 重视微观基础重视微观基础2. 2. 重视人与人之间关系的研究重视人与人之间关系的研究3. 3. 重视信息在经济中的作用重视信息在经济中的作用 二、博弈论对经济学发展的影响二、博弈论对经济学发展的影响1 1、Von NeumannVon Neumann体系体系& 标准型标准型& 扩展型扩展型& 合作型合作型 第三节第三节、

19、经济博弈论内容体系、经济博弈论内容体系 2 2、合作博弈与非合作博弈、合作博弈与非合作博弈 局中人之间是否有具有约束力的协议,博弈可分为:局中人之间是否有具有约束力的协议,博弈可分为:& 合合作作博博弈弈:有有。强强调调团团体体理理性性,效效率率、公公平平和和公公正正& 非非合合作作博博弈弈:没没有有。强强调调个个人人理理性性、个个人人最最优优选选择,其结果可能是有效率的,也可能是无效率的。择,其结果可能是有效率的,也可能是无效率的。 第三节第三节、经济博弈论内容体系、经济博弈论内容体系 (1 1)从局中人行动的时间顺序上,分为:)从局中人行动的时间顺序上,分为:静态博弈静态博弈:局中人同时行

20、动,或虽然局中人的行动有局中人同时行动,或虽然局中人的行动有先有后,但后行动者不能够观察到先行动者的行动;先有后,但后行动者不能够观察到先行动者的行动;动态博弈动态博弈:局中人的行动有先有后,且后行动者能够局中人的行动有先有后,且后行动者能够观察到先行动者的行动。观察到先行动者的行动。 非合作博弈可以从两个角度进行分类非合作博弈可以从两个角度进行分类(2 2)从局中人掌握信息的角度,分为:)从局中人掌握信息的角度,分为:完完全全信信息息博博弈弈: : 是是指指局局中中人人对对自自己己与与其其他他局局中中人人的的所所有有与与博博弈弈有有关关的的事事前前信信息息(策策略略空空间间、支支付付函函数数

21、等等)有充分的了解。有充分的了解。( (局中人的支付函数是局中人的支付函数是共同知识共同知识) )不完全信息博弈不完全信息博弈 非合作博弈可以从两个角度进行分类非合作博弈可以从两个角度进行分类. . 四种不同类型的博弈四种不同类型的博弈 信息信息行动行动顺序顺序完全信息完全信息不完全信息不完全信息静态静态完全信息静态博弈完全信息静态博弈纳什均衡纳什均衡Nash (1950,1951)Nash (1950,1951)不完全信息静态博弈不完全信息静态博弈贝叶斯纳什均衡贝叶斯纳什均衡HarsanyiHarsanyi (1967-1968) (1967-1968)动态动态完全信息动态博弈完全信息动态博

22、弈子博弈完美纳什均衡子博弈完美纳什均衡SeltenSelten (1965) (1965)不完全信息动态博弈不完全信息动态博弈完美贝叶斯纳什均衡完美贝叶斯纳什均衡SeltenSelten (1975); (1975);Kreps &Wilson (1982)Kreps &Wilson (1982)经济博弈论基础经济博弈论基础 Economic Game Theory 第二部分非合作博弈理论 第二章第二章 策略型博弈策略型博弈第三章第三章 扩展型博弈扩展型博弈第四章第四章 贝叶斯博弈贝叶斯博弈第五章第五章 动态贝叶斯博弈动态贝叶斯博弈 主要内容主要内容第一节第一节 策略型博弈的表示策略型博弈的表

23、示第二节第二节 重复剔除严格劣策略均衡重复剔除严格劣策略均衡第三节第三节 纳什均衡纳什均衡第四节第四节 混合策略纳什均衡混合策略纳什均衡第五节第五节 纳什均衡的存在性纳什均衡的存在性 第二章第二章 策略型博弈策略型博弈 同时行动,如何决同时行动,如何决策策 策略型策略型( (标准型)表述标准型)表述 适合表示静态博弈适合表示静态博弈扩展型表述扩展型表述 适合表示动态博弈适合表示动态博弈 博弈有两种表述方法博弈有两种表述方法一、策略型博弈的含义一、策略型博弈的含义 完全信息静态博弈又称为策略型博弈完全信息静态博弈又称为策略型博弈。完全信息完全信息是指是指局中人对自己与其他局中人的所有与博弈有关的

24、事前信息局中人对自己与其他局中人的所有与博弈有关的事前信息(策略空间、支付函数等)有充分的了解(策略空间、支付函数等)有充分的了解( (局中人的支付函局中人的支付函数是共同知识数是共同知识) )。静态博弈静态博弈是指在博弈中,局中人同时采取是指在博弈中,局中人同时采取行动,或者局中人的行动有先有后,但后行动者不能知道行动,或者局中人的行动有先有后,但后行动者不能知道先行动者的行动选择。先行动者的行动选择。 第一节第一节 策略型博弈的表示策略型博弈的表示 二、策略型博弈的三个要素:二、策略型博弈的三个要素: 1 1、局中人(、局中人(Players): 1, 2, Players): 1, 2,

25、 , n, n; 2 2、策策略略(Strategies): Strategies): ; ; 3 3、支付函数、支付函数 (Payoff Payoff functions)functions)表示为:表示为: 第一节第一节 策略型博弈的表示策略型博弈的表示 1 1、有限博弈:、有限博弈: (1) (1) 博弈中局中人人数有限博弈中局中人人数有限; ; (2) (2) 每个局中人只有有限个策略。每个局中人只有有限个策略。 2 2、零和博弈:、零和博弈: 博博弈弈中中局局中中人人所所获获支支付付之之和和为为零零,即即一一方所得为另一方所失。方所得为另一方所失。 三三、两种特殊博弈类型、两种特殊博

26、弈类型、两种特殊博弈类型、两种特殊博弈类型1 1、局中人、局中人:甲,乙:甲,乙2 2、策、策 略略: 坦白坦白, ,不坦白不坦白 3 3、支付函数、支付函数支付矩阵支付矩阵(双人有限博弈)(双人有限博弈) 每每个个位位置置上上第第一一个个数数字字表表示示局局中中人人1 1在在对对应应的的策策略略组组合中得到的支付,第二个数字表示局中人合中得到的支付,第二个数字表示局中人2 2的相应所获支付。的相应所获支付。 例例2.1 2.1 囚徒困境及其策略型表示囚徒困境及其策略型表示囚徒困境及其策略型表示囚徒困境及其策略型表示 (Tucker,1950)(Tucker,1950)(Tucker,1950

27、)(Tucker,1950) 乙乙 甲甲坦白坦白不坦白不坦白坦白坦白-6-6,-6-6-1-1,-8-8不坦白不坦白-8-8,-1-1-2-2,-2-2 囚徒困境的支付矩阵囚徒困境的支付矩阵 乙乙 甲甲石头石头剪刀剪刀布布石头石头0 0,0 01 1,-1-1-1-1,1 1剪刀剪刀-1-1,1 10 0,0 01 1,-1-1布布1 1,-1-1-1-1,1 10 0,1 1 例例例例2.2 2.2 2.2 2.2 石头、剪刀、布的支付矩阵石头、剪刀、布的支付矩阵石头、剪刀、布的支付矩阵石头、剪刀、布的支付矩阵 田忌田忌 齐王齐王上中下上中下上下中上下中中上下中上下中下上中下上下上中下上中下

28、中上下中上上中下上中下3 3,-3-31 1,-1-11 1,-1-11 1,-1-1-1-1,1 11 1,-1-1上下中上下中1 1,-1-13 3,-3-31 1,-1-11 1,-1-11 1,-1-1-1-1,1 1中上下中上下1 1,-1-1-1-1,1 13 3,-3-31 1,-1-11 1,-1-11 1,-1-1中下上中下上-1-1,1 11 1,-1-11 1,-1-13 3,-3-31 1,-1-11 1,-1-1下上中下上中1 1,-1-11 1,-1-11 1,-1-1-1-1,1 13 3,-3-31 1,-1-1下中上下中上1 1,-1-11 1,-1-1-1-

29、1,1 11 1,-1-11 1,-1-13 3,-3-3 例例例例2.3 2.3 2.3 2.3 田忌赛马的支付矩阵田忌赛马的支付矩阵田忌赛马的支付矩阵田忌赛马的支付矩阵 局中人局中人:男,女:男,女 策策 略略:男:看足球,看芭蕾:男:看足球,看芭蕾 女:看足球,看芭蕾女:看足球,看芭蕾 支付矩阵支付矩阵:见下一页:见下一页 例例2.4 性别大战(性别大战(battle of the sexes) 女女 男男足球足球芭蕾芭蕾足球足球3 3,2 21 1,1 1芭蕾芭蕾-1-1,-1-12 2,3 3 性别大战的支付矩阵性别大战的支付矩阵一、基本思想:一、基本思想: 如如果果一一个个局局中中

30、人人在在任任何何情情况况下下从从某某种种策策略略中中得得到到的的支支付付均均小小于于从从另另一一种种策策略略中中得得到到的的支支付付,那那么么显显然然对对他他而而言言,前一种策略劣于后一种策略。前一种策略劣于后一种策略。 从从个个人人利利益益出出发发,被被剔剔除除的的策策略略不不会会被被局局中中人人采采用用。从从而而可可以以利利用用剔剔除除严严格格劣劣策策略略的的概概念念来来简简化化博博弈弈局局势势,可可能能会得到博弈的解。会得到博弈的解。第二节第二节 重复剔除严格劣策略均衡重复剔除严格劣策略均衡 , ,如如果果存存在在 ,对对于于所有的所有的都有都有 且其中至少有一个为严格不等式且其中至少有

31、一个为严格不等式 ,则称,则称 是第是第i i个个局中人的一个局中人的一个严格劣策略严格劣策略。 二、严格劣策略的定义二、严格劣策略的定义 1 1、根根据据理理性性的的局局中中人人不不会会选选择择严严格格劣劣策策略略这这一一原原则则,可可以通过重复剔除严格劣策略的方法对博弈进行求解。以通过重复剔除严格劣策略的方法对博弈进行求解。 2 2、其其方方法法是是:对对每每个个局局中中人人寻寻找找严严格格劣劣策策略略,由由于于它它不不会会被被局局中中人人选选择择实实施施,所所以以找找到到一一种种后后就就可可以以将将其其从从博博弈弈局局势势中中剔剔除除,从从而而得得到到一一种种新新的的缩缩减减后后的的博博

32、弈弈局局势势,对对这这种种新新局局势势重重复复上上述述过过程程,直直到到无无法法找找到到新新的的严严格格劣劣策策略略为为止止。 三、重复剔除严格劣策略三、重复剔除严格劣策略 对对局局中中人人甲甲而而言言,无无论论局局中中人人乙乙采采取取何何种种策策略略,采采用用“不不坦坦白白”策策略略得得到到的的支支付付都都小小于于采采用用“坦坦白白”策策略略。局中人甲的局中人甲的“不坦白不坦白”策略严格劣于策略严格劣于“坦白坦白”策略策略. . “不不坦坦白白”策策略略都都是是一一种种严严格格劣劣策策略略,从从而而可可以以剔剔除除。博博弈弈中中局局中中人人各各自自从从自自身身利利益益出出发发的的理理性性选选

33、择择(博博弈均衡解)就是弈均衡解)就是(坦白,坦白)(坦白,坦白)。 四四、囚徒困境的解、囚徒困境的解、囚徒困境的解、囚徒困境的解 乙乙 甲甲坦白坦白不坦白不坦白坦白坦白-6-6,-6-6-1-1,-8-8不坦白不坦白-8-8,-1-1-2-2,-2-2 例例2.12.1 囚徒困境的支付矩阵囚徒困境的支付矩阵 甲:甲:“不坦白不坦白”相对于相对于“坦白坦白”是严格劣策是严格劣策略略 乙乙 甲甲坦白坦白不坦白不坦白坦白坦白-6-6,-6-6-1-1,-8-8乙:乙:“不坦白不坦白”相对于相对于“坦白坦白”是严格劣策是严格劣策略略 乙乙 甲甲坦白坦白坦白坦白-6-6,-6-6 例例2.52.5 利

34、用重复剔除严格劣策略求解利用重复剔除严格劣策略求解 乙乙 甲甲左左中中右右上上1 1,0 01 1,2 20 0,1 1下下0 0,3 30 0,1 12 2,0 0乙:乙:“右右”相对于相对于“中中”是严格劣策略是严格劣策略 乙乙 甲甲左左中中右右上上1 1,0 01 1,2 20 0,1 1下下0 0,3 30 0,1 12 2,0 0甲:甲:“下下”相对于相对于“上上”是严格劣策略是严格劣策略 乙乙 甲甲左左中中上上1 1,0 01 1,2 2下下0 0,3 30 0,1 1乙:乙:“左左”相对于相对于“中中”是严格劣策略是严格劣策略 乙乙 甲甲左左中中上上1 1,0 01 1,2 2

35、重复剔除重复剔除严格劣策略均衡是严格劣策略均衡是( (上上, ,中中) ) 乙乙 甲甲中中上上1 1,2 21 1、每每一一步步剔剔除除需需要要局局中中人人间间相相互互了了解解的的更更进进一一步步假假定定,如如果果我我们们把把这这一一过过程程应应用用到到任任意意多多步步,需需要要假假定定“局局中中人人是理性的是理性的”是共同知识。是共同知识。2 2、这一方法对博弈结果的预测经常是不准确的、这一方法对博弈结果的预测经常是不准确的. . 五、重复剔除严格劣策略有两个缺陷五、重复剔除严格劣策略有两个缺陷 乙乙 甲甲石头石头剪刀剪刀布布石头石头0 0,0 01 1,-1-1-1-1,1 1剪刀剪刀-1

36、-1,1 10 0,0 01 1,-1-1布布1 1,-1-1-1-1,1 10 0,1 1 例例例例2.2 2.2 2.2 2.2 石头、剪刀、布的支付矩阵石头、剪刀、布的支付矩阵石头、剪刀、布的支付矩阵石头、剪刀、布的支付矩阵 利用重复剔除严格劣策略无法求解利用重复剔除严格劣策略无法求解 例例2.62.6 利用重复剔除严格劣策略无法求解利用重复剔除严格劣策略无法求解 乙乙 甲甲左左中中右右上上0 0,4 44 4,0 05 5,3 3中中4 4,0 00 0,4 45 5,3 3下下3 3,5 53 3,5 56 6,6 6F大大多多数数的的博博弈弈局局势势中中使使用用剔剔除除严严格格劣劣

37、策策略略的的方方法法能能够够对对博博弈弈局局势势进进行行简简化化,但但可可能能得得不不到博弈的均衡解。到博弈的均衡解。F需要引入非合作博弈理论中的核心概念需要引入非合作博弈理论中的核心概念 纳什均衡纳什均衡 ( (Nash EquilibriumNash Equilibrium) )。 六、注意六、注意一、纳什均衡的思想一、纳什均衡的思想 “双赢双赢” 或或 “多赢多赢” 第三节第三节 纳什均衡纳什均衡它是关于博弈结局的一致性预测它是关于博弈结局的一致性预测 如如果果所所有有局局中中人人预预测测一一个个特特定定的的纳纳什什均均衡衡会出现,那么这种均衡就会出现。会出现,那么这种均衡就会出现。 只

38、只有有纳纳什什均均衡衡才才能能使使每每个个局局中中人人均均认认可可这这种种结结局局,而而且且他他们们均均知知道道其其他他局局中中人人也也认认可可这这种种结结局。局。 二、纳什均衡的意义二、纳什均衡的意义 1 1、博博弈弈的的纳纳什什均均衡衡是是这这样样一一种种最最优优策策略略组组合合,是是一一种种你你好好、我我好好大大家家都都好好的的理理性性结结局局,其其中中每每一一个个局局中中人人均均不不能能也也不不想想单单方方面面改改变变自自己己的的策策略略而而增增加加收收益益,每每个个局局中中人人选选择择的的策策略略是是对对其其他他局中人所选策略的最佳反应。局中人所选策略的最佳反应。 三、纳什均衡的定义

39、三、纳什均衡的定义 2 2、数学定义:、数学定义: 在在策策略略型型博博弈弈 中中,如果对于每个局中人如果对于每个局中人i i,存在,存在 ,都有,都有 或或 则称策略组合则称策略组合 是此博弈是此博弈G G的一个的一个纳什均衡纳什均衡。 三、纳什均衡的定义三、纳什均衡的定义1 1、双人有限博弈:双划线法、双人有限博弈:双划线法 首首先先对对局局中中人人2 2的的每每一一个个策策略略,局局中中人人1 1寻寻找找支支付付最最大大的策略,在其对应支付下划线;的策略,在其对应支付下划线; 然后对局中人然后对局中人1 1进行相应的步骤;进行相应的步骤; 最最后后,凡凡是是两两个个局局中中人人支支付付下

40、下均均被被划划线线的的结结局局就就是是纳纳什均衡。什均衡。 四、纳什均衡的求法四、纳什均衡的求法用双划线法可以求出纳什均衡用双划线法可以求出纳什均衡: (坦白,坦白),(坦白,坦白),(-6-6,-6-6)意义:揭示个人理性与集体理性之间的矛盾意义:揭示个人理性与集体理性之间的矛盾。 例例2.12.1 囚徒困境的纳什均衡囚徒困境的纳什均衡 乙乙 甲甲坦白坦白不坦白不坦白坦白坦白-6-6,-6-6-1-1,-8-8不坦白不坦白-8-8,-1-1-2-2,-2-2 乙乙 甲甲坦白坦白不坦白不坦白坦白坦白-6-6,-6-6-1-1,-8-8不坦白不坦白-8-8,-1-1-2-2,-2-2 乙乙 甲甲

41、坦白坦白不坦白不坦白坦白坦白-6-6,-6-6-1-1,-8-8不坦白不坦白-8-8,-1-1-2-2,-2-2 局中人:大猪,小猪局中人:大猪,小猪 策策 略:大猪:按,等待略:大猪:按,等待 小猪:按,等待小猪:按,等待 支付矩阵:见下一页支付矩阵:见下一页 纳什均衡:纳什均衡:(按,等待)(按,等待) 例例2.72.7 智猪博弈(智猪博弈(boxed pigs)boxed pigs) 小猪小猪 大猪大猪按按等待等待按按5 5,1 14 4,4 4等待等待9 9,-1-10 0,0 0 例例2.72.7 智猪博弈的支付矩阵智猪博弈的支付矩阵 小猪小猪 大猪大猪按按等待等待按按5 5,1 1

42、4 4,4 4等待等待9 9,-1-10 0,0 0 小猪小猪 大猪大猪按按等待等待按按5 5,1 14 4,4 4等待等待9 9,-1-10 0,0 0 女女 男男足球足球芭蕾芭蕾足球足球3 3,2 21 1,1 1芭蕾芭蕾-1-1,-1-12 2,3 3 例例2.42.4 性别大战博弈的支付矩阵性别大战博弈的支付矩阵 女女 男男足球足球芭蕾芭蕾足球足球3 3,2 21 1,1 1芭蕾芭蕾-1-1,-1-12 2,3 3 女女 男男足球足球芭蕾芭蕾足球足球3 3,2 21 1,1 1芭蕾芭蕾-1-1,-1-12 2,3 3 局中人局中人:甲,乙:甲,乙 策策 略略:甲:放左手,放右手:甲:放

43、左手,放右手 乙乙:猜猜左左手手,猜猜右手右手 支付矩阵支付矩阵:见下一页:见下一页 没有纳什均衡没有纳什均衡 例例2.82.8 猜左右手游戏猜左右手游戏 乙乙 甲甲猜左手猜左手猜右手猜右手放左手放左手-1-1,1 11 1,-1-1放右手放右手1 1,-1-1-1-1,1 1 乙乙 甲甲猜左手猜左手猜右手猜右手放左手放左手-1-1,1 11 1,-1-1放右手放右手1 1,-1-1-1-1,1 1 乙乙 甲甲猜左手猜左手猜右手猜右手放左手放左手-1-1,1 11 1,-1-1放右手放右手1 1,-1-1-1-1,1 12 2、连续性博弈纳什均衡的求法、连续性博弈纳什均衡的求法 首首先先求求出

44、出每每个个局局中中人人对对其其他他局局中中人人策策略略组组合合的的反反应应函函数数即即在在其其他他局局中中人人策策略略组组合合给给定定时时极极大大化化自自己己的的支支付付,得得到到的的最最佳佳反反应应策策略略表表现现为为其其他局中人策略组合的函数;他局中人策略组合的函数; 然然后后将将这这些些反反应应函函数数联联立立求求解解即即得得到到博博弈弈的纳什均衡解。的纳什均衡解。 四、纳什均衡的求法四、纳什均衡的求法 局中人:局中人:厂商厂商1 1,厂商,厂商2 2 策策 略:略:厂商厂商1 1:选择产量:选择产量 厂商厂商2 2:选择产量:选择产量 假假 设:设:价格价格 支付函数支付函数 ( (利

45、润函数利润函数) ) : 例例2.92.9 两寡头产量竞争两寡头产量竞争CournotCournot(18381838)模型)模型 CournotCournot 模型求解模型求解 反应函数反应函数: : 纳什均衡:纳什均衡: CournotCournot 模型求解模型求解 假设两寡头可以串谋,共同确定产量假设两寡头可以串谋,共同确定产量Q Q使总利润最大化,使总利润最大化,利润函数为:利润函数为: (Q)=Q(a-Q-c)(Q)=Q(a-Q-c) 总利润最大的产量为:总利润最大的产量为: 称为称为契约曲线契约曲线 总利润为:总利润为: 比较及含义:比较及含义: 两寡头产量串谋模型两寡头产量串谋

46、模型 Q1 厂商厂商2 2的反应曲线的反应曲线 纳什均衡纳什均衡 契契约约曲曲线线 厂厂商商1 1的反应曲线的反应曲线 O Q2 图图1 1 反应曲线、纳什均衡与契约曲线反应曲线、纳什均衡与契约曲线局中人局中人:厂商:厂商1 1,厂商,厂商2 2 策策 略略:厂商:厂商1 1选择价格选择价格 ;厂商;厂商2 2选择价格选择价格假假 设设: : 两寡头固定成本都为两寡头固定成本都为0 0,边际成本为常数,边际成本为常数c, c, 消费者对厂商消费者对厂商1 1和和2 2生产产品的需求量分别为:生产产品的需求量分别为: ; ; 例例2.102.10 两寡头价格竞争两寡头价格竞争BertrandBe

47、rtrand(18831883)模型)模型支付(利润)函数:支付(利润)函数: 最优化的一阶条件是最优化的一阶条件是: : BertrandBertrand(18831883)模型及求解)模型及求解 反应函数:反应函数: 纳什均衡价格:纳什均衡价格: BertrandBertrand(18831883)模型及求解)模型及求解 在在n n个局中人的策略型博弈中,个局中人的策略型博弈中, 1 1、如如果果重重复复剔剔除除严严格格劣劣策策略略剔剔除除掉掉除除策策略略组组合合s s以以外的所有策略,则这一策略组合外的所有策略,则这一策略组合s s为该博弈的唯一的纳什均衡。为该博弈的唯一的纳什均衡。 2

48、 2、如如果果策策略略组组合合s s是是一一个个纳纳什什均均衡衡,那那么么它它就就不不会会被重复剔除严格劣策略所剔除。被重复剔除严格劣策略所剔除。 纳什均衡是比重复剔除严格劣策略更强的解概念。纳什均衡是比重复剔除严格劣策略更强的解概念。五、纳什均衡与重复剔除严格劣策略均衡五、纳什均衡与重复剔除严格劣策略均衡 一、举例说明混合策略纳什均衡一、举例说明混合策略纳什均衡 例例2.82.8 猜左右手游戏猜左右手游戏 第四节第四节 混合策略纳什均衡混合策略纳什均衡 乙乙 甲甲(q q)猜左手猜左手(1-q1-q)猜右手猜右手(p p)放左手放左手-1,-1, 1 11,1, -1-1(1-p1-p)放右

49、手放右手1,1, -1-1-1,-1, 1 1 在在 甲甲 选选 , 乙乙 选选 这种策略时,这种策略时,他们的期望效用分别为:他们的期望效用分别为: 混合策略与期望效用混合策略与期望效用甲和乙的目标是甲和乙的目标是: :最优化的一阶条件是最优化的一阶条件是: : 混合策略纳什均衡混合策略纳什均衡 混合策略纳什均衡为:混合策略纳什均衡为: 混合策略纳什均衡混合策略纳什均衡1 1、混合策略、混合策略(mixed Strategy) 局局中中人人 i i 的的一一个个混混合合策策略略 是是在其纯策略空间在其纯策略空间 上上的的一一个个概概率率分分布布,其其中中 是是 i i 选择策略选择策略 的的

50、概概率率。局局中中人人 i i的的混混合合策策略略空空间间 是是他他的的所所有有混混合策略构成的集合。合策略构成的集合。 纯纯 策策 略略 可可 以以 理理 解解 为为 混混 合合 策策 略略 的的 特特 例例 。 如如 等价于等价于 二、混合策略纳什均衡二、混合策略纳什均衡 在在混混合合策策略略组组合合 下下,局局中中人人 i i的的期望效用函数为:期望效用函数为: 其中其中 2 2、期望效用函数、期望效用函数 在在策策略略型型博博弈弈 中中,如果对于每个局中人如果对于每个局中人 i i,存在,存在 ,都有,都有 或或 则则称称 是是博博弈弈G G的的一一个个混混合合策策略略纳纳什什均衡均衡

51、。 3 3、混合策略纳什均衡、混合策略纳什均衡 奇奇数数定定理理 (Wilson (Wilson 1971) 1971) :几几乎乎所所有有的的有有限限博弈都有奇数个纳什均衡。博弈都有奇数个纳什均衡。 4 4、奇数定理、奇数定理例例2.112.11 社会保障博弈社会保障博弈 局中人局中人:政府和下岗工人:政府和下岗工人 策策 略略:政政 府府:救救济济,不不救救济济 下下岗岗工工人人:找找工工作作,不找工作不找工作 支付矩阵支付矩阵为:为: 三、应用举例三、应用举例 工人工人 政府政府找工作找工作不找不找救济救济3 3,2 2-1-1,3 3不救济不救济-1-1,1 10 0,0 0 女女 男

52、男足球足球芭蕾芭蕾足球足球3 3,2 21 1,1 1芭蕾芭蕾-1-1,-1-1 求出性别大战博弈的混合策略纳什均衡求出性别大战博弈的混合策略纳什均衡 定定理理1 1:(Nash,Nash, 19501950)每每个个有有限限策策略略型型博博弈弈至至少存在一个纳什均衡(纯策略的或混合策略的)。少存在一个纳什均衡(纯策略的或混合策略的)。 第五节第五节 纳什均衡的存在性纳什均衡的存在性 BrouwerBrouwer不不动动点点定定理理:如如果果X X是是非非空空的的有有界界闭闭凸凸集集,f(x)f(x)是是X X到到自自身身的的连连续续映映射射,那那么么至至少少存存在在一一个个x xX X,使使

53、得得 f(xf(x )=x)=x ,x x 称为不动点。称为不动点。 KakutaniKakutani不不动动点点定定理理:设设f(X)f(X)是是点点集集X X上上的的一一个个集集值值映映射射,如如果果X X是是非非空空的的有有界界闭闭凸凸集集,并并且且对对于于所所有有的的x x X X,f(x)f(x)是是非非空空的的、凸凸的的且且上上半半连连续续的的,那那么么至至少少存存在在一一个个x xX X,使得,使得 x xf(xf(x ) ),x x 称为不动点。称为不动点。 纳什均衡的存在性证明纳什均衡的存在性证明 1 1、集集值值映映射射:对对于于集集合合X X上上的的任任何何一一个个点点x

54、 x,如如果果f(x)f(x)给给出出唯唯一一的的一一个个点点y y Y Y,则则f(x)f(x)称称为为从从X X到到Y Y的的映映射射;如如果果f(x)f(x)给给出一个集合出一个集合f(x)f(x) Y Y,则,则f(x)f(x)称为从称为从X X到到Y Y的的集值映射集值映射。 映射是集值映射的特例。映射是集值映射的特例。 2 2、上上半半连连续续:设设f(x)f(x)是是X X到到自自身身的的一一个个集集值值映映射射,如如果果对对于于所所有有的的x xX X和和包包含含f(xf(x ) )的的开开集集V V,都都存存在在x x 的的一一个个邻邻域域U U,使使得得对对于于所所有有的的

55、x x U U,有有f(x)f(x) V V,则则称称f(x)f(x)是是上上半半连续的连续的。 注:集值映射和上半连续注:集值映射和上半连续 定定理理2 2:(Debreu,(Debreu, 19521952 ; ; Glicksberg,1952Glicksberg,1952 ; ; Fan,Fan, 1952) 1952) 在在n n人人策策略略型型博博弈弈中中,如如果果每每个个局局中中人人的的纯纯策策略略空空间间S Si i是是欧欧氏氏空空间间中中的的一一个个非非空空的的有有界界闭闭凸凸集集,支支付付函函数数u ui i( (s)s)是是连连续续的的且且对对s si i是拟凹的,那么该

56、博弈存在一个纯策略纳什均衡。是拟凹的,那么该博弈存在一个纯策略纳什均衡。 定定理理3 3:(Glicksberg,1952) (Glicksberg,1952) 在在n n人人策策略略型型博博弈弈中中,如如果果每每个个局局中中人人的的纯纯策策略略空空间间S Si i是是欧欧氏氏空空间间中中的的一一个个非非空空的的有有界界闭闭凸凸集集,支支付付函函数数u ui i(s)(s)是是连连续续的的,那那么么该该博博弈弈存存在在一一个个混混合合策策略略纳纳什均衡。什均衡。 定理定理1 1的推广:从有限到无限的推广:从有限到无限经济博弈论基础经济博弈论基础Economic Game Theory 第二部分

57、非合作博弈理论 第二章第二章 策略型博弈策略型博弈第三章第三章 扩展型博弈扩展型博弈第四章第四章 贝叶斯博弈贝叶斯博弈第五章第五章 动态贝叶斯博弈动态贝叶斯博弈 主要内容主要内容第一节第一节 扩展型博弈的表述扩展型博弈的表述第二节第二节 扩展型博弈的纳什均衡扩展型博弈的纳什均衡第三节第三节 子博弈完美纳什均衡子博弈完美纳什均衡第四节第四节 重复博弈重复博弈 第三章第三章 扩展型博弈扩展型博弈 行动有先有后,如何制胜行动有先有后,如何制胜1 1、一局博弈可能有不止一个纳什均衡、一局博弈可能有不止一个纳什均衡,事实上,有,事实上,有些博弈可能有无数个纳什均衡,究竟哪个纳什均衡实际上些博弈可能有无数

58、个纳什均衡,究竟哪个纳什均衡实际上会发生?不知道。会发生?不知道。2 2、纳什均衡并不一定导致帕累托最优、纳什均衡并不一定导致帕累托最优。例如。例如“囚徒囚徒困境困境”意味纳什均衡并不导致帕累托最优,导致了个人理意味纳什均衡并不导致帕累托最优,导致了个人理性与集体理性的矛盾。对于这样的问题,纳什均衡没有给性与集体理性的矛盾。对于这样的问题,纳什均衡没有给出解决的办法。出解决的办法。 一、纳什均衡存在的问题一、纳什均衡存在的问题3 3、 纳什均衡假定:每个人将别人的策略视为给定,纳什均衡假定:每个人将别人的策略视为给定,选择对自己最有利的策略,即如果其他局中人不改变策选择对自己最有利的策略,即如

59、果其他局中人不改变策略,任何单个局中人不能通过单方面改变策略来提高他略,任何单个局中人不能通过单方面改变策略来提高他的效用或收益。的效用或收益。这种完全信息的假定不符合实际情况这种完全信息的假定不符合实际情况。 一、纳什均衡存在的问题一、纳什均衡存在的问题4 4、在纳什均衡中,局中人在选择自己的策略时,把其他、在纳什均衡中,局中人在选择自己的策略时,把其他局中人的策略当作给定的,不考虑自己的选择如何影响对手的局中人的策略当作给定的,不考虑自己的选择如何影响对手的策略。这个假设在研究静态博弈时是成立的,因为在静态博弈策略。这个假设在研究静态博弈时是成立的,因为在静态博弈下,所有局中人同时行动,无

60、暇反应。但对动态博弈而言,这下,所有局中人同时行动,无暇反应。但对动态博弈而言,这个假设就有问题了。当一个人行动在先,另一个人行动在后时,个假设就有问题了。当一个人行动在先,另一个人行动在后时,后者自然会根据前者的选择而调整自己的选择,前者自然会理后者自然会根据前者的选择而调整自己的选择,前者自然会理性地预期到这一点,所以不可能不考虑自己的选择对其对手的性地预期到这一点,所以不可能不考虑自己的选择对其对手的选择的影响。选择的影响。 一、纳什均衡存在的问题一、纳什均衡存在的问题5 5、与第、与第4 4个问题相联系,由于不考虑自己选择对别人个问题相联系,由于不考虑自己选择对别人选择的影响,选择的影

61、响,纳什均衡允许了不可置信威胁的存在纳什均衡允许了不可置信威胁的存在。这就引出了泽尔腾(这就引出了泽尔腾(SeltenSelten)的贡献。)的贡献。 一、纳什均衡存在的问题一、纳什均衡存在的问题 对对“纳什均衡纳什均衡”加以修正加以修正提出了提出了“子博子博弈完美纳什均衡弈完美纳什均衡”和和“颤抖手完美纳什均衡颤抖手完美纳什均衡”,去剔除那些不合理的纳什均衡,提出了去剔除那些不合理的纳什均衡,提出了“均衡选均衡选择择”问题。问题。 二、二、SeltenSelten的贡献的贡献一、扩展型博弈的含义一、扩展型博弈的含义 完完全全信信息息动动态态博博弈弈又又称称为为扩扩展展型型博博弈弈。扩扩展展型

62、型博博弈弈是是指指在在完完全全信信息息博博弈弈中中,局局中中人人的的行行动动有先有后,后行动者可以观察到先行动者的行动。有先有后,后行动者可以观察到先行动者的行动。 第一节 扩展型博弈的表述扩展型博弈的表述二、扩展型博弈的表述二、扩展型博弈的表述 扩展型扩展的是策略型中的策略,有六个要素:扩展型扩展的是策略型中的策略,有六个要素: 1 1、局中人集合;、局中人集合; 2 2、局中人的行动顺序;、局中人的行动顺序; 3 3、局中人的行动空间;、局中人的行动空间; 4 4、局中人的信息集;、局中人的信息集; 5 5、支付函数;、支付函数; 6 6、 外生事件的概率分布。外生事件的概率分布。 第一节

63、 扩展型博弈的表述扩展型博弈的表述1、结点、结点 (nodes)2、枝、枝 (branches):行动:行动3、信息集、信息集 (information set): (1 1)同一个局中人的一些结点构成的集合;)同一个局中人的一些结点构成的集合; (2 2)表示博弈到了这个集合,但不知到了这)表示博弈到了这个集合,但不知到了这个集合的哪一个结点上。个集合的哪一个结点上。 三三、博弈树、博弈树两家房地产开发商两家房地产开发商A A、B B,考虑是否在同一地段开发写字楼,考虑是否在同一地段开发写字楼,各自面临的选择是开发还是不开发。房地产市场充满了风险,风各自面临的选择是开发还是不开发。房地产市场

64、充满了风险,风险来自市场需求的不确定性:需求可能大,也可能小。该博弈的险来自市场需求的不确定性:需求可能大,也可能小。该博弈的行动顺序为:行动顺序为:(1 1)开发商)开发商A A首先行动,选择开发或者不开发;首先行动,选择开发或者不开发;(2 2)在)在A A决策后,自然选择市场需求的大小;决策后,自然选择市场需求的大小;(3 3)开发商)开发商B B在观测到在观测到A A的选择和市场需求后,决定开发或的选择和市场需求后,决定开发或不开发。不开发。 例例3.1 3.1 房地产开发博弈房地产开发博弈 开发开发 不开发不开发 N N N N 大大 小小 大大 小小 B B B B B BB B

65、开发开发 不开发不开发 开发开发 不开发不开发 开发开发 不开发不开发 开发开发 不开发不开发 房地产开发博弈的博弈树房地产开发博弈的博弈树 开发开发 不开发不开发 N N N N 大大 小小 大大 小小 B B B B B B B B 开发开发 不开发不开发 开发开发 不开发不开发 开发开发 不开发不开发 开发开发 不开发不开发 房地产开发博弈的博弈树房地产开发博弈的博弈树 开发开发 不开发不开发 N N N N 大大 小小 大大 小小 B B B B B B B B 开发开发 不开发不开发 开发开发 不开发不开发 开发开发 不开发不开发 开发开发 不开发不开发 房地产开发博弈的博弈树房地产

66、开发博弈的博弈树1 1、完美信息、完美信息(perfect information)博弈)博弈是指博弈中所是指博弈中所有信息集都是单点集。在完美信息博弈中,一次只有一个局有信息集都是单点集。在完美信息博弈中,一次只有一个局中人在行动,而且他在行动时知道博弈所有以往行动的历史。中人在行动,而且他在行动时知道博弈所有以往行动的历史。2、完美回忆(、完美回忆(perfect recall)博弈)博弈是指没有局中人会忘是指没有局中人会忘记自己所知道的信息,所有局中人都记得自己以往的行动选记自己所知道的信息,所有局中人都记得自己以往的行动选择。择。 四、完美信息博弈与完美回忆博弈四、完美信息博弈与完美回

67、忆博弈一、以房地产开发博弈一、以房地产开发博弈为例说明从为例说明从扩展型表述构造出策扩展型表述构造出策略型表述略型表述,从而求出,从而求出纳什均衡纳什均衡。 扩展型扩展型 扩展型博弈扩展型博弈纳什均衡纳什均衡 博弈博弈 策略型策略型 策略型博弈策略型博弈纳什均衡纳什均衡二、局中人的策略二、局中人的策略是关于行动的一个完整的计划,它明是关于行动的一个完整的计划,它明确了在局中人可能会遇到的各种情况下对可行行动的选择。确了在局中人可能会遇到的各种情况下对可行行动的选择。 第二节第二节 扩展型博弈的纳什均衡扩展型博弈的纳什均衡例题例题: :房地产开发博弈房地产开发博弈 A 开发开发 不开发不开发 B

68、 B B B 开发开发 不开发不开发 开发开发 不开发不开发(-3,-3) (1,0) (0,1) (0,0) 第二节第二节 扩展型博弈的纳什均衡扩展型博弈的纳什均衡 三、三、 扩展型博弈的纳什均衡扩展型博弈的纳什均衡 B B A A( (开开, ,开开) )( (开开, ,不不) )( (不不, ,开开) )( (不不, ,不不) )开发开发不开不开 三、三、 扩展型博弈的纳什均衡扩展型博弈的纳什均衡 B B A A( (开开, ,开开) )( (开开, ,不不) )( (不不, ,开开) )( (不不, ,不不) )开发开发-3, -3-3, -3-3, -3-3, -31 , 01 ,

69、01, 01, 0不开不开 0 , 0 , 1 1 0 , 0 , 0 00, 10, 10, 00, 0 三、三、 扩展型博弈的纳什均衡扩展型博弈的纳什均衡 B B A A( (开开, ,开开) )( (开开, ,不不) )( (不不, ,开开) )( (不不, ,不不) )开发开发-3, -3-3, -3-3, -3-3, -31 1 , , 0 01 1, , 0 0不开不开 0 0 , , 1 1 0 0 , , 0 00 0, , 1 10, 00, 0 此博弈有三个纳什均衡:此博弈有三个纳什均衡: (开发,(开发,( (不开发,开发不开发,开发) )) (开发,(开发,( (不开发

70、,不开发不开发,不开发) )) (不开发,(不开发,( (开发,开发开发,开发) )) 三、三、 扩展型博弈的纳什均衡扩展型博弈的纳什均衡 1 1、定义扩展型博弈的策略、定义扩展型博弈的策略 2 2、定义扩展型博弈的纳什均衡、定义扩展型博弈的纳什均衡 三、三、 扩展型博弈的纳什均衡扩展型博弈的纳什均衡 1 1、有限扩展型博弈:、有限扩展型博弈:扩展型博弈有有限个信息扩展型博弈有有限个信息集,每个信息集上只有有限个行动。集,每个信息集上只有有限个行动。 2 2、定理、定理:(Zemelo,1913; Kuhn, 1953Zemelo,1913; Kuhn, 1953)完美)完美信息有限信息有限扩

71、展型博弈存在纯策略纳什均衡。扩展型博弈存在纯策略纳什均衡。 四、四、 有限扩展型博弈有限扩展型博弈一、子博弈:一、子博弈:称称G G1 1是是G G的一个子博弈,如果满足:的一个子博弈,如果满足: 1 1、子博弈、子博弈G G1 1是原博弈是原博弈G G的一部分;的一部分; 2 2、子博弈、子博弈G G1 1必须从单结信息集开始;必须从单结信息集开始; 3 3、子博弈、子博弈G G1 1的信息集和支付向量都继承自的信息集和支付向量都继承自原博弈原博弈G G 。 第三节第三节 子博弈完美纳什均衡子博弈完美纳什均衡房地产开发博弈有三个子博弈,除原博弈外,还有:房地产开发博弈有三个子博弈,除原博弈外

72、,还有: B B B B 开发开发 不开发不开发 开发开发 不开发不开发 (-3-3,-3-3) (1 1,0 0)()(0 0,1 1) (0 0,0 0) G G1 1 G G2 2 例例3.1 3.1 房地产开发博弈的子博弈房地产开发博弈的子博弈二、子博弈完美纳什均衡二、子博弈完美纳什均衡 (SubgameSubgame perfect Nash Equilibrium) perfect Nash Equilibrium)扩展型博弈的一个策略组合是子博弈完美纳什均扩展型博弈的一个策略组合是子博弈完美纳什均衡当且仅当它在每一个子博弈上都构成纳什均衡。衡当且仅当它在每一个子博弈上都构成纳什均

73、衡。 第三节第三节 子博弈完美纳什均衡子博弈完美纳什均衡三、子博弈完美纳什均衡的求法三、子博弈完美纳什均衡的求法 1 1、定义、定义 2 2、逆向归纳法(、逆向归纳法(Backward Backward Induction)Induction) 完美信息有限博弈完美信息有限博弈 第三节第三节 子博弈完美纳什均衡子博弈完美纳什均衡例例3.13.1、房地产开发博弈房地产开发博弈的子博弈完美纳什均衡:的子博弈完美纳什均衡: 定义求法定义求法 逆向归纳法求法逆向归纳法求法 四、四、 举例举例房地产开发博弈房地产开发博弈 A A 开发开发 不开发不开发 B B B B 开发开发 不开发不开发 开发开发

74、不开发不开发(-3-3,-3-3) (1 1,0 0) (0 0,1 1) (0 0,0 0) 子博弈完美纳什均衡的求法博弈完美纳什均衡的求法房地产开发博弈房地产开发博弈 A 开发开发 不开发不开发 B BB B 不开发不开发 开发开发 不不开发开发 (1 1,0 0) (0 0,1 1) (0 0,0 0) 子博弈完美纳什均衡的求法博弈完美纳什均衡的求法房地产开发博弈房地产开发博弈 A A 开发开发 不开发不开发 B B B B 不开发不开发 开发开发 (1 1,0 0) (0 0,1 1) 子博弈完美纳什均衡的求法博弈完美纳什均衡的求法房地产开发博弈房地产开发博弈 A A 开发开发 不开发

75、不开发 B BB B 不开发不开发 开发开发 (1 1,0 0) (0 0,1 1) 子博弈完美纳什均衡的求法博弈完美纳什均衡的求法 局中人局中人:厂商:厂商1 1,厂商,厂商2 2 策策 略略:厂商:厂商1 1先行动,选择产量去先行动,选择产量去q q1 1; 厂商厂商2 2观察到观察到q q1 1 后,选择自己的产量后,选择自己的产量q q2 2. . 假假 设设:价格:价格 支付(利润)函数支付(利润)函数: 例例3.2 两寡头产量竞争的两寡头产量竞争的 Stackelberg (1934)模型模型 用逆向归纳法求出子博弈完美纳什均衡:用逆向归纳法求出子博弈完美纳什均衡: (1) Sta

76、ckelberg 模型求解模型求解 代代 入入(1)(1)式得式得: : Stackelberg 模型求解模型求解子博弈完美纳什均衡:子博弈完美纳什均衡:与与CournotCournot模型的纳什均衡比较模型的纳什均衡比较: : 子博弈完美纳什均衡子博弈完美纳什均衡 纳什均衡纳什均衡 动动态态博弈时,厂商博弈时,厂商2 2有后动优势有后动优势。 动态动态BertrandBertrand模型求解模型求解利用逆向归纳法求解出的利用逆向归纳法求解出的 子博弈完美纳什均衡子博弈完美纳什均衡的的 结果与现实结果与现实 存在一定的存在一定的 差异,受到了一些学差异,受到了一些学者的批评。者的批评。其中最著

77、名的是蜈蚣博弈及其实验。其中最著名的是蜈蚣博弈及其实验。 五、五、 逆向归纳法的不足逆向归纳法的不足 小宝小宝C C 大宝大宝C C 小宝小宝C C 大宝大宝C C 小宝小宝C C 大宝大宝C C S S S S S S S S S S S S 例例3.4 蜈蚣博弈蜈蚣博弈 小小宝宝C C 大大宝宝C C 小小宝宝C C 大大宝宝C C 大大宝宝C C S S S S S S S S S S 例例3.5 蜈蚣博弈蜈蚣博弈一、重复博弈:一、重复博弈:同样结构的博弈重复多次。同样结构的博弈重复多次。 1 1、重复博弈的基本特征:、重复博弈的基本特征: (1 1)单次博弈之间没有实质联系,即前一阶段

78、的博弈)单次博弈之间没有实质联系,即前一阶段的博弈不改变其它阶段的博弈结构;不改变其它阶段的博弈结构; (2 2)所有局中人能够观测并记忆以往的博弈历史;)所有局中人能够观测并记忆以往的博弈历史; (3 3)局中人的总支付为各阶段支付的贴现值之和或者加)局中人的总支付为各阶段支付的贴现值之和或者加权平均值。权平均值。 第四节第四节 重复博弈重复博弈2 2、影响重复博弈均衡结果的主要因素:、影响重复博弈均衡结果的主要因素: (1 1)博弈重复的次数;)博弈重复的次数; (2 2)信息的完备性。)信息的完备性。 一、一、 重复博弈重复博弈1 1、有限次重复博弈的子博弈完美纳什均衡、有限次重复博弈的

79、子博弈完美纳什均衡 以囚徒困境为例以囚徒困境为例 二、二、 有限次重复博弈有限次重复博弈 2 2、 定定 理理 : 以以 阶阶 段段 博博 弈弈 G G构构 成成 的的 重重 复复 T T次次(TTeei i的的v v(对每个(对每个i)i),存在一个贴现因子,存在一个贴现因子 11使得对于所有使得对于所有的的 , v=(vv=(v1 1,v,v2 2, ,v,vn n) )是一个特定的子博弈完美均衡的支是一个特定的子博弈完美均衡的支付向量。付向量。 三、无限次重复博弈三、无限次重复博弈 无名氏定理的含义无名氏定理的含义:在无限次重复博弈中,如:在无限次重复博弈中,如果局中人有足够的耐心(即果

80、局中人有足够的耐心(即 足够大),那么,任何足够大),那么,任何满足个人理性的可行的满足个人理性的可行的支付向量都可以通过一个特支付向量都可以通过一个特定的子博弈完美均衡而实现。定的子博弈完美均衡而实现。 三三、无限次重复博弈无限次重复博弈经济博弈论基础经济博弈论基础Economic Game Theory 第二部分非合作博弈理论 第二章第二章 策略型博弈策略型博弈第三章第三章 扩展型博弈扩展型博弈第四章第四章 贝叶斯博弈贝叶斯博弈第五章第五章 动态贝叶斯博弈动态贝叶斯博弈 主要内容主要内容第一节第一节 贝叶斯博弈及其策略型表示贝叶斯博弈及其策略型表示第二节第二节 贝叶斯纳什均衡贝叶斯纳什均衡

81、第三节第三节 拍卖与招标博弈分析拍卖与招标博弈分析第四节第四节 混合策略纳什均衡重新解释混合策略纳什均衡重新解释 第四章第四章 贝叶斯博弈贝叶斯博弈 不了解对手,同时行动时,如何不了解对手,同时行动时,如何抉择抉择一、不完全信息与贝叶斯博弈一、不完全信息与贝叶斯博弈 完全信息完全信息:支付函数是共同知识:支付函数是共同知识 不不完完全全信信息息:至至少少有有一一个个局局中中人人不不能能确确定定其其他他局中人的支付函数局中人的支付函数 第一节第一节 贝叶斯博弈及其策略型表示贝叶斯博弈及其策略型表示例例4.1 4.1 市场进入博弈市场进入博弈 在位者在位者 高高成成本本情情况况 低成本情况低成本情

82、况 默默许许 斗斗争争 默许默许 斗争斗争 进入进入进入者进入者 不进入不进入 不完全信息博弈举例不完全信息博弈举例40, 40, 5050 -10, 0-10, 0 30, 8030, 80-10, -10, 1001000, 3000, 300 0, 3000, 300 0, 400 0, 400 0, 400 0, 400例例4.24.2 求爱博弈求爱博弈 求爱者求爱者 品品德德好好 品德差品德差 求求爱爱 不不求求爱爱 求爱求爱 不求爱不求爱 接受接受 你你 不接受不接受 不完全信息博弈举例不完全信息博弈举例100,1000, 0-100, 1000, 0 0, -50 0, 0 0,

83、 0 0, 0Harsanyi(1967-68)方法)方法:引引入入一一个个虚虚拟拟的的局局中中人人“自自然然”,自自然然首首先先选选择择局局中中人人的的特特征征,局局中中人人知知道道自自己己的的特特征征,其其他局中人不知道。他局中人不知道。 把把不不完完全全信信息息博博弈弈转转化化为为完完全全但但不不完完美美信息博弈。信息博弈。 二、二、Harsanyi 转换转换 N N 高高p p 低低1-p 1-p 进入者进入者 进入者进入者 不进入不进入 进入进入 不进入不进入 进入进入(0,300) 0,300) 在位者在位者 (0,400) (0,400) 在位者在位者 默许默许 斗争斗争 默许默

84、许 斗争斗争 (40,50) 40,50) (-10,0) -10,0) (30,8030,80) (-10,100-10,100) Harsanyi 转换后的市场进入博弈转换后的市场进入博弈类类型型是是个个人人特特征征的的完完备备描描述述,由由支支付付函函数数完完全全决决定,等同于支付函数。定,等同于支付函数。 不不完完全全信信息息表表明明:至至少少有有一一个个局局中中人人有有多多个个类型。类型。 i i局中人局中人 i i的的类型空间类型空间 i i局中人局中人 i i的一个类型的一个类型 1 1、类型、类型 假假定定分分布布函函数数 是是所所有有局局中中人人的的共共同知识。同知识。 从从

85、而而局局中中人人 i i有有私私人人信信息息 ,即即类类型型为为 的的局局中中人人 i i有有关关其其他他局局中中人人属属于于 的的条条件概率。件概率。 2、Harsanyi 假设假设1 1、局中人的类型空间、局中人的类型空间i i,i i=1,=1, , n n2 2、条件概率、条件概率 3 3、类型依存策略空间、类型依存策略空间 4 4、类型依存支付函数、类型依存支付函数 三、三、贝叶斯博弈的策略型表示贝叶斯博弈的策略型表示1 1、自自然然选选择择类类型型向向量量 ,局局中中人人 i i 观观 测测 到到 i i, 局局 中中 人人 j j 观观 测测 不不 到到 i i, 只只 知知 道

86、道 ;2 2、所有局中人同时选择行动、所有局中人同时选择行动 ; ;3 3、局中人、局中人 i i 得到得到 。假假定定 和和 是是共共同同知知识。识。 四、四、贝叶斯博弈的时间顺序贝叶斯博弈的时间顺序局中人局中人 i i 的期望效用函数为:的期望效用函数为: 五、期望效用函数五、期望效用函数一、贝叶斯纳什均衡的定义:一、贝叶斯纳什均衡的定义:贝贝叶叶斯斯博博弈弈 的的纯纯策策略略组组合合 是是一一个个贝贝叶叶斯斯纳纳什均衡,如果对于每个局中人什均衡,如果对于每个局中人 i i,有:,有: 第二节第二节 贝叶斯纳什均衡贝叶斯纳什均衡 局中人:厂商局中人:厂商1 1,厂商,厂商2 2 类类 型:

87、型: 策策 略略:厂厂商商1 1和和 2 2同同时时行行动动,选选择择产产量量q q1 1和和产产量量q q2 2 假假 设:设:p = 2 p = 2 (q (q1 1 + q + q2 2 ) ) 支付(利润)函数:支付(利润)函数: 例例4.3 不完全信息不完全信息 Cournot 模型模型从最优化的一阶条件解出厂商从最优化的一阶条件解出厂商2 2的反应函数为的反应函数为: : ; ; (1)(1)厂厂商商1 1不不知知道道厂厂商商2 2的的最最优优反反应应究究竟竟是是 还还是是 ,他的期望利润函数:他的期望利润函数: 解最优化的一阶条件得厂商解最优化的一阶条件得厂商1 1的反应函数为:

88、的反应函数为: (2) 例例4.3 不完全信息不完全信息 Cournot 模型模型均均衡衡意意味味着着两两个个反反应应函函数数(1)(1)和和(2)(2)同同时时成成立立,解解两两个个反反应应函数得贝叶斯纳什均衡为函数得贝叶斯纳什均衡为: : ; ; ; ; 与完全信息下的纳什均衡比较与完全信息下的纳什均衡比较: : 如如果果厂厂商商2 2的的成成本本是是 ,厂厂商商1 1知知道道,那那么么纳纳什什均均衡衡产产量量为为: , ;如如果果厂厂商商2 2的的成成本本是是 ,厂厂商商1 1知知道道,那那么么纳纳什什均均衡衡产产量量为为: , 。 例例4.3 不完全信息不完全信息 Cournot 模型

89、模型 ; ; ; 与与完完全全信信息息下下情情况况相相比比,在在不不完完全全信信息息下下,低低成成本本厂厂商商2 2的的产产量量相相对对较较低低,高高成成本本厂厂商商2 2的的产产量量较较高高。导导致致这这个个结结果果的的原原因因是是,当当厂厂商商1 1不不知知道道厂厂商商2 2的的成成本本时时,只只能能生生产产预预期期的的最最优优产产量量,高高于于完完全全信信息息下下对对低低成成本本竞竞争争对对手手时时的的产产量量,低低于于完完全全信信息下对高成本竞争对手时的产量,厂商息下对高成本竞争对手时的产量,厂商2 2对此作出反应。对此作出反应。 例例4.3 不完全信息不完全信息 Cournot 模型

90、模型一、拍卖一、拍卖 1 1、拍卖、拍卖是指以公开竞价的形式,由拍卖是指以公开竞价的形式,由拍卖机构在一定的时间和地点,按照一定的章程和规则,机构在一定的时间和地点,按照一定的章程和规则,将特定物品或财产权利转让给最高应价者的一种买将特定物品或财产权利转让给最高应价者的一种买卖方式。卖方式。 第三节第三节 拍卖与招标博弈分析拍卖与招标博弈分析 公元前公元前500500年左右,古希腊著名历史学家年左右,古希腊著名历史学家希罗多德记载:古巴比伦人用拍卖方式购买妇女作希罗多德记载:古巴比伦人用拍卖方式购买妇女作为妻子的行为。为妻子的行为。 古罗马帝国,拍卖已成为商品买卖的一种古罗马帝国,拍卖已成为商

91、品买卖的一种普遍形式。普遍形式。 2 2、拍卖的起源、拍卖的起源 1 1、适度规模的人口,由此形成买卖双方;、适度规模的人口,由此形成买卖双方; 2 2、剩余产品的出现,由此形成拍卖物品;、剩余产品的出现,由此形成拍卖物品; 3 3、货币的存在,由此形成竞价付现。、货币的存在,由此形成竞价付现。 3 3、拍卖产生的社会自然条件、拍卖产生的社会自然条件 (1 1)揭示价格)揭示价格 (2 2)减少代理成本)减少代理成本 4 4、拍卖的作用、拍卖的作用 “三公一高三公一高”原则原则公平、公正、公开,价高者得公平、公正、公开,价高者得 5 5、拍卖基本原则、拍卖基本原则英国伦敦的英国伦敦的索思比拍卖

92、行索思比拍卖行和和克里斯蒂拍卖行克里斯蒂拍卖行(艺术品、古董)(艺术品、古董) 6 6、世界著名拍卖行、世界著名拍卖行 (1 1)英式拍卖)英式拍卖 (2 2)荷兰式拍卖)荷兰式拍卖 (3 3)第一价格密封拍卖)第一价格密封拍卖 (4 4)第二价格密封拍卖)第二价格密封拍卖 (5 5)双方叫价拍卖)双方叫价拍卖 7 7、拍卖的主要形式、拍卖的主要形式(1 1)一般均衡理论中的拍卖解释)一般均衡理论中的拍卖解释(2 2)解释的不足)解释的不足 8 8、一般均衡理论中的拍卖、一般均衡理论中的拍卖1 1、拍卖博弈分析:、拍卖博弈分析: 第一价格密封拍卖第一价格密封拍卖 第二价格密封拍卖第二价格密封拍

93、卖 第第n n价格密封拍卖价格密封拍卖 双方叫价拍卖双方叫价拍卖 二、拍卖与招标博弈分析二、拍卖与招标博弈分析(1 1)考虑两个投标人)考虑两个投标人 i=1,i=1, 2 2的情况:的情况: v vi i拍卖物品对投标人拍卖物品对投标人 i i的价值的价值 v vi i 00,1 1 均匀分布均匀分布 b bi i0 0 投标人投标人 i i的出价的出价 b bi i= b= bi i(v vi i)严格递增可微函数)严格递增可微函数 第一价格密封拍卖博弈分析第一价格密封拍卖博弈分析投标人投标人1 1的期望支付为:的期望支付为:由对称性,由对称性,其中其中 是是b b* *的逆函数。的逆函数

94、。 第一价格密封拍卖博弈分析第一价格密封拍卖博弈分析因此投标人因此投标人1 1的问题是:的问题是: 最优化的一阶条件:最优化的一阶条件: 第一价格密封拍卖博弈分析第一价格密封拍卖博弈分析(2 2)考虑)考虑n n个投标人的情况:个投标人的情况: 评价为评价为v vi i的投标人的投标人 i i出价出价b b,他的期望支付函数为:,他的期望支付函数为: 最优化的一阶条件:最优化的一阶条件: 第一价格密封拍卖博弈分析第一价格密封拍卖博弈分析2 2、招标博弈分析:、招标博弈分析: 第一价格密封招标第一价格密封招标 第二价格密封招标第二价格密封招标 第第n n价格密封招标价格密封招标 二二、拍卖与招标

95、博弈分析、拍卖与招标博弈分析 某单位有一项建设工程要出包,选择要价最某单位有一项建设工程要出包,选择要价最低的承包者。让每个投标者将自己的标价写下来低的承包者。让每个投标者将自己的标价写下来装入一个信封,密封后交给招标单位,信封打开装入一个信封,密封后交给招标单位,信封打开后,招标单位选择标价最低者为中标者,并按起后,招标单位选择标价最低者为中标者,并按起标价出包。标价出包。 第一价格密封招标博弈分析第一价格密封招标博弈分析 每个投标者的策略是根据自己的生产成本每个投标者的策略是根据自己的生产成本和对其他投标人的判断来选择自己的出价,赢者和对其他投标人的判断来选择自己的出价,赢者的支付是他的标

96、价减去他的生产成本,其他投标的支付是他的标价减去他的生产成本,其他投标者的支付为零。者的支付为零。 报价越低,中标的可能性就越大;但在给报价越低,中标的可能性就越大;但在给定中标的情况下,报价越低,利润就越小。定中标的情况下,报价越低,利润就越小。 第一价格密封招标博弈分析第一价格密封招标博弈分析考虑考虑n n个投标人的情况个投标人的情况: c ci i投标人投标人i i的真实生产成本的真实生产成本 c ci i 00,1 1 均匀分布均匀分布 b bi i0 0 投标人投标人i i的出价的出价 b bi i= b= bi i(c(ci i) )严格递增可微函数严格递增可微函数 第一价格密封招

97、标博弈分析第一价格密封招标博弈分析考虑对称的均衡出价策略考虑对称的均衡出价策略 , 是是 的逆函数的逆函数 第一价格密封招标博弈分析第一价格密封招标博弈分析成本为成本为c c的投标人的投标人i i出价出价b b,他的期望支付函数为:,他的期望支付函数为:最优化的一阶条件:最优化的一阶条件: 均衡情况下,均衡情况下, 第一价格密封招标博弈分析第一价格密封招标博弈分析 第一价格密封招标博弈分析第一价格密封招标博弈分析1 1、拍卖制度与资源配置效率、拍卖制度与资源配置效率2 2、收入等价定理、收入等价定理 三、拍卖制度与资源配置三、拍卖制度与资源配置一、混合策略纳什均衡的不完全信息解释一、混合策略纳

98、什均衡的不完全信息解释HarsanyiHarsanyi (1973) (1973) 证明:完全信息静态博弈中证明:完全信息静态博弈中的混合策略纳什均衡可以解释为不完全信息静态博的混合策略纳什均衡可以解释为不完全信息静态博弈中贝叶斯纳什均衡的极限。弈中贝叶斯纳什均衡的极限。 第四节第四节 混合策略纳什均衡的重新解释混合策略纳什均衡的重新解释二二、混混合合策策略略纳纳什什均均衡衡的的本本质质特特征征不不在在于于局局中中人人j j随随机机地地选选择择行行动动,而而在在于于局局中中人人i i不不能能确确定定局局中中人人j j将将选选择择什什么么纯纯策策略略,这这种种不不确确定定性性可可能能来来自自局局

99、中中人人i i不知道局中人不知道局中人j j的类型。的类型。自自然然是是通通过过选选择择局局中中人人的的类类型型而而不不是是选选择择硬硬币币的出正反面制造了不确定性。的出正反面制造了不确定性。 第四节第四节 混合策略纳什均衡的重新解释混合策略纳什均衡的重新解释三、举例三、举例 例例4.44.4:抓钱博弈:抓钱博弈 乙乙 甲甲抓抓不抓不抓抓抓-1-1,-1-11 1,0 0不抓不抓0 0,1 10 0,0 0 第四节第四节 混合策略纳什均衡的重新解释混合策略纳什均衡的重新解释转转化化为为不不完完全全信信息息博博弈弈:1 1,2 2 -,+,+ 均匀分布均匀分布 乙乙 甲甲抓抓不抓不抓抓抓-1-1

100、,-1-11+1+1 1,0 0不抓不抓0,0, 1+1+2 20 0,0 0 例例1 1:抓钱博弈:抓钱博弈甲:若甲:若1 11 1* *,抓;若,抓;若1 1 1 1* *,不抓。,不抓。乙:若乙:若2 22 2* *,抓;若,抓;若2 2 2 2* *,不抓。,不抓。EuEu甲甲( (抓抓)=(-1)P)=(-1)P乙乙( (抓抓)+(1+)+(1+1 1)P)P乙乙( (不抓不抓) )EuEu甲甲( (不抓不抓)=0)=0P P乙乙( (抓抓)+ 0)+ 0P P乙乙( (不抓不抓) )其中其中: : 局中人的纯策略局中人的纯策略由由EuEu甲甲( (抓抓)=Eu)=Eu甲甲( (不抓

101、不抓) )及对称性及对称性1 1* =* =2 2* *,解得:,解得: 1 1* =* =2 2*=0*=0 甲:若甲:若1 100,抓;若,抓;若1 100,不抓。,不抓。 乙:若乙:若2 200,抓;若,抓;若2 200,不抓。,不抓。 对对 i = 1, 2i = 1, 2,i i0 0 和和i i0 0 的概率各为的概率各为1/2.1/2.当当00,上上述述纯纯策策略略贝贝叶叶斯斯纳纳什什均均衡衡就就收收敛敛为为完完全全信信息息博弈的混合策略纳什均衡。博弈的混合策略纳什均衡。 均衡情况下的最优选择均衡情况下的最优选择 例例4.54.5:性别大战博弈:性别大战博弈 女女 男男足球足球芭

102、蕾芭蕾足球足球3 3,2 21 1,1 1芭蕾芭蕾-1-1,-1-12 2,3 3m,w 00, x 均匀分布均匀分布 转化为不完全信息博弈转化为不完全信息博弈 女女 男男足球足球芭蕾芭蕾足球足球3+m ,21,1芭蕾芭蕾-1,-12,3+w男:若男:若m mm m* *,看足球;若,看足球;若m m m m* *,看芭蕾。,看芭蕾。女:若女:若w ww w* *,看芭蕾;若,看芭蕾;若w w w w* *,看足球。,看足球。EuEu男男( (足足)=(3+)=(3+m m) P) P女女( (足)足)+ 1 P+ 1 P女女( (芭芭) )EuEu男男( (芭芭)=(-1) P)=(-1)

103、P女女( (足)足)+ 2 P+ 2 P女女( (芭芭) )其中其中:P:P女女( (芭芭) =) =(x- x- w w* *)/ / x x P P女女( (足)足)=1-=1-(x- x- w w* *)/x/x 局中人的纯策略局中人的纯策略由由EuEu男男( (足足)=)=EuEu男男( (芭芭) )及对称性及对称性m m* =* =w w* *解得解得: : 男:若男:若m mm m* *,看足球;若,看足球;若m m m m* *,看芭蕾。,看芭蕾。女:若女:若w ww w* *,看芭蕾;若,看芭蕾;若w w 3T3,下下列列策策略略组组合合构构成成一一个个完完美美贝贝叶叶斯斯纳纳

104、什什均均衡衡:理理性性囚囚徒徒1 1在在t=1t=1至至t=T-2t=T-2 阶阶段段一一直直选选择择“不不坦坦白白”,然然后后在在t=T-1t=T-1和和t=Tt=T阶阶段段选选择择“坦坦白白”;囚囚徒徒2 2在在t=1t=1至至t=T-1t=T-1阶阶段段选选择择“不不坦坦白白”,然后在,然后在 t t =T=T阶段选择阶段选择“坦白坦白” 。 一、一、KMRW声誉模型声誉模型将任何一个囚徒选择将任何一个囚徒选择“坦白坦白”的阶段成为的阶段成为非合非合作阶段;作阶段;两个囚徒都选择两个囚徒都选择“不坦白不坦白”成为成为合作阶段合作阶段。结论结论:只要:只要p1/3p1/3,非合作阶段的总数

105、量等于,非合作阶段的总数量等于2 2,与,与T T无关。无关。 一、一、KMRW声誉模型声誉模型在在T T阶阶段段重重复复囚囚徒徒博博弈弈中中,如如果果每每个个囚囚徒徒都都有有p0p0的的概概率率是是非非理理性性的的(即即只只选选择择“针针锋锋相相对对”或或“冷冷酷酷策策略略”),如如果果T T足足够够大大,那那么么存存在在一一个个T T0 0TT,使使得得下下列列策策略略组组合合构构成成一一个个完完美美贝贝叶叶斯斯纳纳什什均均衡衡:所所有有理理性性囚囚徒徒在在tTtTtT0 0 阶阶段段选选择择不不合合作作(坦坦白白);并并且且非非合合作作阶阶段段的的数数量(量(T-TT-T0 0)只于)只

106、于p p有关而与有关而与T T无关。无关。 KMRW定理定理 尽管每一个囚徒选择合作时冒者被其他囚徒出卖尽管每一个囚徒选择合作时冒者被其他囚徒出卖的风险(从而可能得到一个较低的现阶段支付),但的风险(从而可能得到一个较低的现阶段支付),但如果他选择不合作,就暴露了他是非合作型的,从而如果他选择不合作,就暴露了他是非合作型的,从而失去了获得长期合作收益的可能(如果对方是合作型失去了获得长期合作收益的可能(如果对方是合作型的)。的)。 KMRW定理的直观解释定理的直观解释如果博弈重复的次数足够多,未来收益的损失就如果博弈重复的次数足够多,未来收益的损失就超过短期被出卖的损失,因此在博弈的开始,每个

107、局超过短期被出卖的损失,因此在博弈的开始,每个局中人都想树立一个合作形象(使对方认为自己是喜欢中人都想树立一个合作形象(使对方认为自己是喜欢合作的),即使他在本性上并不是合作型的;只有在合作的),即使他在本性上并不是合作型的;只有在博弈快结束的时候,局中人才会一次性地把自己过去博弈快结束的时候,局中人才会一次性地把自己过去建立的声誉利用尽,合作才会停止(因为此时,短期建立的声誉利用尽,合作才会停止(因为此时,短期收益很大而未来损失很小)。收益很大而未来损失很小)。 KMRW定理的直观解释定理的直观解释 大智若愚大智若愚确实是智者追求自己利益的最佳方确实是智者追求自己利益的最佳方式。式。 智者即

108、囚徒博弈中的理性囚徒(非合作型),智者即囚徒博弈中的理性囚徒(非合作型),愚者即囚徒博弈中的非理性囚徒(合作型)。愚者即囚徒博弈中的非理性囚徒(合作型)。 行为方式的行为方式的KMRW定理解释定理解释 一个人干好事还是干坏事常常不取决于他是一个人干好事还是干坏事常常不取决于他是好人还是坏人,而取决于别人认为他是好人还是坏好人还是坏人,而取决于别人认为他是好人还是坏人,因为坏人也有兴趣建立一个好人的形象以谋取人,因为坏人也有兴趣建立一个好人的形象以谋取长远利益。长远利益。 行为方式的行为方式的KMRW定理解释定理解释 货币政策的动态非一致性货币政策的动态非一致性:政府没有办法承诺:政府没有办法承

109、诺零通货膨胀率,结果是一方面遭受通货膨胀之苦,零通货膨胀率,结果是一方面遭受通货膨胀之苦,另一方面又不能得到产出增加之益。另一方面又不能得到产出增加之益。 二二、声誉、声誉模型应用:政府的货币政策模型应用:政府的货币政策 Barro(1986)和)和Vickers(1986)利用)利用KMRW声誉模型证明声誉模型证明:如果公众有关政府偏好的信息是不完如果公众有关政府偏好的信息是不完全的,出于声誉方面的考虑,即使政府的任期是有限全的,出于声誉方面的考虑,即使政府的任期是有限的(因而博弈重复的次数是有限的),政府也可能选的(因而博弈重复的次数是有限的),政府也可能选择不制造通货膨胀。择不制造通货膨

110、胀。 二二、声誉、声誉模型应用:政府的货币政策模型应用:政府的货币政策经济博弈论基础经济博弈论基础Economic Game Theory第四部分合作博弈理论 第一节第一节 合作博弈的基本问题合作博弈的基本问题第二节第二节 合作博弈解合作博弈解第三节第三节 合作博弈应用合作博弈应用 第六章第六章 合作博弈合作博弈 从对手到合作,如从对手到合作,如何决策何决策 一、合作博弈的意义一、合作博弈的意义 合合作作博博弈弈的的意意义义表表现现在在它它与与非非合合作作博博弈弈的的差差别别上上。豪豪尔尔绍绍尼尼(19661966)提提出出,在在博博弈弈局局势势中中,如如果果意意愿愿表表示示(如如协协议议、承

111、承诺诺、威威胁胁等等)具具有有完完全全的的约约束束力力且且可可强强制制执执行行的的,则则该该博博弈弈为为合合作作博博弈弈。如如果果意意愿愿表表示示不不可可强强制制执执行行,即即使使局局中人之间在博弈之前可以互相交往,则只能是非合作博弈。中人之间在博弈之前可以互相交往,则只能是非合作博弈。 第一节第一节 合作博弈的基本问题合作博弈的基本问题在形式上,有一种观点认为:在形式上,有一种观点认为:可可从从如如下下角角度度把把合合作作博博弈弈看看成成是是非非合合作作博博弈弈的的特特殊殊情情形形,即即把把达达成成合合作作的的谈谈判判过过程程和和执执行行合合作作协协议议的的强强制制过过程程明明确确地地纳纳入

112、入博博弈弈的的扩扩展展形形式式,用用扩扩展展型型博博弈弈研研究究合合作作博博弈弈,从从而而将将合合作作博博弈弈理理论论纳纳入入非非合作博弈理论体系中。合作博弈理论体系中。 第一节第一节 合作博弈的基本问题合作博弈的基本问题 非合作博弈的重点非合作博弈的重点在个体,是每个局中人该采用什么策略。在个体,是每个局中人该采用什么策略。 合合作作博博弈弈的的重重点点在在群群体体,何何种种联联盟盟将将会会形形成成,联联盟盟中中的的成成员员将将如如何何分分配配他他们们可可以以得得到到的的支支付付。即即使使可可以以把把所所形形成成的的联联盟盟看看作作是是一一个个利利益益主主体体参参与与博博弈弈,但但如如何何在

113、在联联盟盟内内部部分分配配他他们们的的支付则是合作博弈所特有的研究内容。支付则是合作博弈所特有的研究内容。 合合作作博博弈弈有有其其独独立立存存在在的的理理论论价价值值,也也有有比比较较广广泛泛的的应用领域。应用领域。 第一节第一节 合作博弈的基本问题合作博弈的基本问题(1) (1) 联盟:联盟:设设N N1,1, 2,2, , , nn为局中人集合,则称其中为局中人集合,则称其中任意一个子集任意一个子集S S为一个联盟。所有联盟构成的集合记为为一个联盟。所有联盟构成的集合记为P(N)P(N)。(2) (2) 分分配配:合合作作博博弈弈的的一一个个分分配配是是指指对对n n个个局局中中人人来来

114、说说,存存在一个向量在一个向量 ,满足:,满足: (1)(1) ;(2)(2) 。其其中中V(N)V(N)表表示示n n个个局局中中人人总总的的最最大大收收益益,V(V(i i) )表表示示局局中中人人i i不与任何人结盟时的收益。不与任何人结盟时的收益。 二、两个重要概念、两个重要概念 条条件件(1)(1)是是群群体体理理性性,说说明明个个人人分分配配的的收收益益和正好是各种联盟形式总的最大收益;和正好是各种联盟形式总的最大收益; 条条件件(2)(2)是是个个体体理理性性,说说明明从从联联盟盟中中每每个个人人分分配配到到的的收收益益不不小小于于单单独独“经经营营”所所得得收收益益,即即分分配

115、配必须使每个人都能得到更多的好处。必须使每个人都能得到更多的好处。 三、分配定义中、分配定义中两个条件的含义两个条件的含义(1 1)对对联联盟盟来来说说,整整体体收收益益大大于于其其每每个个成成员员单单独独经经营营时时的的收益之和,收益之和, ;(2 2)对对联联盟盟内内部部而而言言,应应存存在在着着具具有有帕帕累累托托改改进进性性质质的的分分配配规规则则 ,即即每每个个成成员员都都能能获获得得比比不不加入联盟时要多一些的收益加入联盟时要多一些的收益 , , 。如如何何保保证证实实现现和和满满足足这这些些条条件件,这这是是由由合合作作博博弈弈的的本本质质特特点点所所决决定定的的,也也就就是是联

116、联盟盟内内部部成成员员之之间间的的信信息息是是可可互互相相交交换换的的,所达成的协议必须是强制执行的。所达成的协议必须是强制执行的。 四、合作博弈存在的四、合作博弈存在的两个基本条件两个基本条件(1 1)具有可转移效用的)具有可转移效用的:可转移效用是指联盟中各局中人:可转移效用是指联盟中各局中人获得的效用可以相互转移;获得的效用可以相互转移;(2 2)具有不可转移效用的)具有不可转移效用的:不可转移效用是指局中人获得:不可转移效用是指局中人获得的效用不可转移。的效用不可转移。 合作博弈中一般研究的是具有可转移效用的合作博弈中一般研究的是具有可转移效用的合作博弈,应用的工具就是合作博弈,应用的

117、工具就是联盟型博弈联盟型博弈,在理论上常常,在理论上常常称为称为特征函数型博弈特征函数型博弈。 五、合作博弈分为两类五、合作博弈分为两类联联盟盟型型博博弈弈( (特特征征函函数数型型博博弈弈) ):对对每每一一种种可可能能联联盟盟给给出出相相应应的的联联盟盟总总和和收收益益,也也就就是是给给出出了了一一种种集集合合函函数数,称称为特征函数为特征函数V V()。)。特特征征函函数数具具有有超超加加性性:对对任任意意两两个个独独立立联联盟盟S S与与T T(两两者没有公共成员,即者没有公共成员,即ST=ST=),有),有V(ST)V(S)+V(T)V(ST)V(S)+V(T)。具具有有n n个个局

118、局中中人人,局局中中人人集集合合为为N N1,2,1,2,n ,n ,特特征征函数为函数为V(V()的特征函数型博弈被记为()的特征函数型博弈被记为(N,V)N,V)。 六、联盟型博弈六、联盟型博弈在在合合作作博博弈弈中中如如果果有有 ,则则称称该该合合作作博弈是非本质的博弈是非本质的,其中,其中V(V(i i) )表示局中人表示局中人i i一人组成的联盟;一人组成的联盟; 若若有有 ,则则此此合合作作博博弈弈是是本本质质的的,即存在有净增收益的联盟。即存在有净增收益的联盟。 如如果果对对于于任任何何联联盟盟S S,有有V(S)+V(NS)=V(N)V(S)+V(NS)=V(N),其其中中NS

119、NS表表示示N N中中除除了了S S成成员员之之外外的的其其他他成成员员组组成成的的联联盟盟,那那么么此此合合作作博博弈弈被被称为常和的称为常和的。 六、联盟型博弈六、联盟型博弈例例1 1:策略型博弈:策略型博弈 局中人局中人2 2局中人局中人1 1-1-1,2 25 5,5 50 0,10100 0,1010 七、策略型博弈向特征函数型博弈的转化七、策略型博弈向特征函数型博弈的转化例例1 1中存在四个联盟:中存在四个联盟:、11、22、1,21,2。 特征函数即对这四种联盟求得他们各自特征函数即对这四种联盟求得他们各自的总和收益,一般的求法是设联盟外局中人将采取的总和收益,一般的求法是设联盟

120、外局中人将采取行动使该联盟的总和收益最少(体现了行动使该联盟的总和收益最少(体现了“从坏处着从坏处着想,往好处努力想,往好处努力”的思想)。的思想)。 七、策略型博弈向特征函数型博弈的转化七、策略型博弈向特征函数型博弈的转化V(V()=0)=0,没有人的联盟是不会有任何收益的,没有人的联盟是不会有任何收益的; ; V(1)=0 V(1)=0,局中人,局中人2 2能使局中人能使局中人1 1面临的最坏情形是局中人面临的最坏情形是局中人2 2取取策略策略 ,局中人,局中人1 1将不得不在将不得不在0 0与与-1-1之间选择。之间选择。V(2)=5V(2)=5,局中人,局中人1 1能使局中人能使局中人

121、2 2面临的最坏情形是局中人面临的最坏情形是局中人1 1取取 ,局中人,局中人2 2将不得不在将不得不在2 2与与5 5之间选择。之间选择。V(1,V(1, 2)=102)=10,没有联盟外局中人,没有联盟外局中人,1010是局中人是局中人1 1与与2 2能取得最能取得最大总和收益。大总和收益。 七、策略型博弈向特征函数型博弈的转化七、策略型博弈向特征函数型博弈的转化 对对于于特特征征函函数数的的上上述述求求法法,主主要要的的批批评评是是:它它忽忽略略了了联联盟盟外外局局中中人人使使联联盟盟面面临临最最坏坏处处境境时时,自自己己也也将将付出代价(有时代价很高)。付出代价(有时代价很高)。 Ha

122、rsayniHarsayni认认为为,特特征征函函数数的的取取值值应应该该由由联联盟盟与与其其对对立立联联盟盟(联联盟盟外外所所有有局局中中人人形形成成的的联联盟盟)之之间间的一次谈判而决定。的一次谈判而决定。 七、策略型博弈向特征函数型博弈的转化七、策略型博弈向特征函数型博弈的转化 例例2 2:垃圾博弈:垃圾博弈: 在在一一区区域域中中居居住住着着7 7户户居居民民,每每天天产产生生一一袋袋垃垃圾圾,这这些些垃垃圾圾只只能能扔扔在在这这一一区区域域的的某某一一户户人人家家中中(区区域中没有空地)。域中没有空地)。 这这就就构构成成了了一一种种博博弈弈局局势势,在在合合作作博博弈弈条条件件下,

123、可以直接分析得到其中的特征函数。下,可以直接分析得到其中的特征函数。 八、实际博弈局势分析得到特征函数型博弈八、实际博弈局势分析得到特征函数型博弈 V Vn n表表示示任任意意n n个个局局中中人人组组成成联联盟盟的的特特征征函函数数值值,n=1,n=1, , , 7 7。 V V0 0=V(=V()=0)=0; V V1 1=-6=-6,1 1个个局局中中人人组组成成的的联联盟盟所所遇遇到到的的最最糟糟处处境境是是其其他他6 6个个局局中中人人将将他他们们产产生生的的垃垃圾圾扔扔到到他他自自己己的的地地里里,即即收收到到6 6袋袋垃垃圾圾,自自己己则则可可将将垃垃圾圾扔扔到到其其他他任任意意

124、一个局中人的地里;一个局中人的地里; 八、实际博弈局势分析得到特征函数型博弈八、实际博弈局势分析得到特征函数型博弈 V V2 2=-5=-5,两两个个局局中中人人组组成成的的联联盟盟则则将将收收到到5 5袋袋垃垃圾圾,联联盟盟产产生生的的两两袋袋垃垃圾圾处处理理到到联联盟盟外外局局中中人人的的地地中;中; 同理,同理,V V3 3=-4=-4, V V4 4=-3=-3,V V5 5=-2=-2,V V6 6=-1=-1 V V7 7=-7=-7,而而全全部部7 7个个局局中中人人组组成成的的联联盟盟的的特特征征函函数数值值有有所所不不同同,他他们们无无法法将将垃垃圾圾扔扔到到非非联联盟盟成成

125、员员的的地里,收到地里,收到7 7袋垃圾。袋垃圾。 八、实际博弈局势分析得到特征函数型博弈八、实际博弈局势分析得到特征函数型博弈一、合作博弈求解思路一、合作博弈求解思路 合作博弈理论求解的目的:合作博弈理论求解的目的: 得得到到博博弈弈的的“理理性性”最最终终分分配配,主主要要方法有两种:优超与赋值。方法有两种:优超与赋值。 第二节第二节 合作博弈解合作博弈解 优优 超超 设设有有n n个个局局中中人人,每每个个局局中中人人有有相相应应的的可可选选择择策策略略,在在(所所有有)可可能能的的策策略略组组合合上上定定义义各各局局中中人人的的效效用用函函数数。效效用向量用向量 则表现博弈的一种分配。

126、则表现博弈的一种分配。 对于不可转移效用情形的合作博弈,定义优超为:对于不可转移效用情形的合作博弈,定义优超为: 一一种种效效用用向向量量 被被优优超超是是指指存存在在一一种种联联盟盟S S,对对于于联联盟盟中中的的每每一一成成员员i i,联联盟盟给给予予他他的的效效用用将将大大于于效效用用向向量量中中他他得得到到的的,即即对对任任意意 , 。 优优 超超 直直观观上上说说优优超超就就是是联联盟盟中中的的每每个个人人都都感感觉觉好好的的分分配配原原则则肯肯定定比比只只有有部部分分人人感感觉觉好好的的分分配配准准则则更更可可取。取。 利利用用优优超超可可以以定定义义合合作作博博弈弈均均衡衡,即即

127、指指这这样样的的局局中中人人策策略略组组合合,它它产产生生的的效效用用向向量量不不被被任任何联盟所优超(何联盟所优超(核核)。)。 优优 超超 对于可转移效用情形的合作博弈,定义优超为:对于可转移效用情形的合作博弈,定义优超为: 一一种种效效用用分分配配 被被优优超超是是指指存存在在一一种种联联盟盟S S,该该联联盟盟获获得得的的总总和和收收益益V(S)V(S)大大于于效效用用分分配配向向量量提提供供给给该该联联盟盟个个成成员员的的效效用用之之和和,即即 。 二、合作博弈解二、合作博弈解1 1、核、核定定义义1 1: : 设设x x和和y y为为n n人人合合作作博博弈弈(N,V)(N,V)的

128、的两两个个分分配配, 为为一一个个联联盟盟,如如果果:(1)(1)对对任任意意 ,有有 ;(2)(2) ,则称,则称x x在在S S上优超上优超y y,记为,记为 。 对对于于两两个个分分配配x x和和y y,如如果果存存在在某某联联盟盟S S,使使得得 ,则称则称x x优超优超y y,记为,记为 。 注意注意: :对于联盟对于联盟S=NS=N 或或S=S=i i ,不能有,不能有 。 1 1、核、核 一一旦旦联联盟盟S S发发现现有有 ,它它将将放放弃弃分分配配y y而而接接受受x x。所所以以,只只有有不不被被优优超超的的分分配配对对局局中中人人来来说说才才令人满意。令人满意。这就是核的意

129、义。这就是核的意义。 定定义义2 2: : n n人人合合作作博博弈弈(N,V)(N,V)的的所所有有不不被被优优超超的的分分配配的集合称为它的的集合称为它的核,记为核,记为C(V)C(V)。 1 1、核、核定定理理1(1(核核的的特特征征) ): : n n人人合合作作博博弈弈(N,V)(N,V)的的核核由由所所有有满满足足以以下下条件的条件的n n维向量维向量 组成:组成: (1) (1) 对对任任意意 , ;(2)(2) 。 由由此此定定理理可可知知核核是是闭闭凸凸集集。如如果果博博弈弈的的核核非非空空,就就可可以以将将总总收收益益V(N)V(N)按按这这样样一一种种方方式式分分配配给给

130、各各个个局局中中人人,使使之之不不仅仅满满足足个个体体理理性性和和群群体体理理性性,而而且且满满足足联联盟盟理理性性,即即任任何何联联盟盟在在这这种种方方式式下下的的所所得得都都不不小小于于它它独独立立出出来来时时的的所所得得,因而也就没有积极性拒绝这样的分配。因而也就没有积极性拒绝这样的分配。 1 1、核、核把把核核中中的的分分配配作作为为合合作作博博弈弈的的解解,一一个个致致命命的的缺缺陷陷就是核有时是空的。例如,有以下的定理。就是核有时是空的。例如,有以下的定理。定理定理2 2: 常和合作博弈的核是空的。常和合作博弈的核是空的。作作为为一一种种解解,存存在在性性可可说说是是最最重重要要的

131、的性性质质,核核有有时时存存在在,有有时时不不存存在在,这这样样何何时时核核存存在在就就称称为为一一个个很很重要的问题,以下是关于核存在性的定理。重要的问题,以下是关于核存在性的定理。 1 1、核、核定定理理3 3(核核的的存存在在性性):对对于于n n人人合合作作博博弈弈(N,V)(N,V),核核C(V)C(V) 非空的充分必要条件是下述线性规划非空的充分必要条件是下述线性规划: : 有最小值有最小值 。 简单博弈简单博弈定定义义3 3:如如果果合合作作博博弈弈中中联联盟盟的的特特征征函函数数值值不不是是0 0就就是是1 1,那那么么称称之之为为简简单单博博弈弈。在在简简单单博博弈弈(N,V

132、)(N,V)中中,如如果果对对于于某某局局中中人人 ,则则称称局局中中人人 为为具具有有否否决权的局中人。决权的局中人。简单博弈常用来描述投票问题。这种博弈的核有以下结论简单博弈常用来描述投票问题。这种博弈的核有以下结论定定理理4 4:在在简简单单博博弈弈(N,V)(N,V)中中,核核C(V)C(V)非非空空的的充充分分必必要要条条件件是是存在有否决权的局中人。存在有否决权的局中人。稳稳定定集集是是由由冯冯诺诺依依曼曼与与摩摩根根斯斯特特恩恩提提出出来来的的概概念念,有有时时被被记记为为VN-MVN-M解解。记记所所有有可可能能分分配配组组成成的的集集合合为为E(V)E(V),则则稳稳定定集集

133、定义如下:定义如下:定定义义4 4:对对于于n n人人合合作作博博弈弈(N,V)(N,V),分分配配集集 为为稳定集,则稳定集,则W W满足满足: : (1)(1)(内内部部稳稳定定性性)不不存存在在 ,满满足足 ; (2)(2)(外外部部稳稳定定性性)对对 ,使得,使得 。 2 2、稳定集、稳定集作为稳定集存在的例子有:作为稳定集存在的例子有:定定理理5 5:对对于于简简单单博博弈弈(N,V)(N,V),S S是是一一个个极极小小获获胜胜联联盟盟(即即 V(S)=1V(S)=1,但但对对S S的的任任何何真真子子集集T T 有有V(T)=0V(T)=0),则稳定集为则稳定集为: : 2 2、

134、稳定集、稳定集 2 2、稳定集、稳定集稳定集和核之间有如下关系:稳定集和核之间有如下关系: 定定理理6 6:设设n n人人合合作作博博弈弈(N,V)(N,V)的的稳稳定定集集为为W W,核核为为C(V)C(V),则,则 。稳稳定定集集的的存存在在性性比比核核要要好好一一些些,但但有有时时稳稳定定集集仍仍是是不存在的,这就需要其它解的概念。不存在的,这就需要其它解的概念。核核仁仁具具有有如如下下性性质质:(1)(1)每每个个博博弈弈有有且且仅仅有有一一个个核核仁仁;(2)(2)如如果核存在的话,核仁是它的一部分。果核存在的话,核仁是它的一部分。为了定义核仁,首先定义剩余的概念。为了定义核仁,首先

135、定义剩余的概念。定义定义5 5:对于:对于n n人合作博弈人合作博弈(N,V)(N,V),S S为一个联盟,为一个联盟,为一个分配,记为一个分配,记 ,则,则 称为称为S S关于关于x x的剩余。的剩余。 3 3、核仁、核仁剩剩余余 反反映映了了联联盟盟对对于于分分配配的的不不满满意意程程度度,当当然然每个联每个联 盟盟 都都 希希 望望 剩剩 余余 越越 小小 越越 好好 。 因因 为为 N N的的 子子 集集 共共 有有 个个 , , 也也 有有 个个,可可以以将将它它们们按按照照由由小小到到大大的的顺顺序序排排列列为为一一个个向向量量 。设设x x,y y为为两个向量,为了比较好坏两个向

136、量,为了比较好坏 引引 入入 “ ”, , 是是 指指 或或 者者 或者对或者对k=1,k=1, , (i-1),(i-1), 有有 而而 。 3 3、核仁、核仁 3 3、核仁、核仁 定义定义6 6:对于对于n n人合作博弈人合作博弈(N,V)(N,V),它的核仁,它的核仁 N(V) N(V)是指集合是指集合 定理定理7 7(核仁的性质)(核仁的性质):对于对于n n人合作博弈人合作博弈(N,V)(N,V),则有:,则有: (1) (1) 它的核仁它的核仁N(V)N(V)非空,而且只包含一个元素;非空,而且只包含一个元素; (2) (2) 若核若核C(V)C(V)非空,则它必定包含核仁,即非空

137、,则它必定包含核仁,即 4、夏普利值(、夏普利值(Shapley value)夏普利值是利用公理化方法得到合作博弈的唯一解。夏普利值是利用公理化方法得到合作博弈的唯一解。设设 为为局局中中人人i i在在博博弈弈(N,V)(N,V)中中应应该该得得到到的的期期望望收收益益,则夏普利指出,它应该满足几种公理。首先给出辅助性定义。则夏普利指出,它应该满足几种公理。首先给出辅助性定义。定定义义7 7:对对于于n n人人合合作作博博弈弈(N,V)(N,V),T T是是一一个个联联盟盟,如如果果对对任任意意联联盟盟S S均均有有 ,则则称称T T为为这这个个博弈的承载博弈的承载 。 4、夏普利值(、夏普利

138、值(Shapley value)承载常常不唯一。如果承载常常不唯一。如果T T是承载,则是承载,则 也是承载。也是承载。如如果果T T为为承承载载,那那么么在在T T以以外外的的局局中中人人对对任任何何联联盟盟都都没没有有什什么么贡献,相当于哑元贡献,相当于哑元(dummy)(dummy)。定定义义8 8: 对对于于n n人人合合作作博博弈弈(N,V)(N,V), 为为N N上上的的一一个个置置换换运运算算。定定义义博博弈弈 为为这这样样一一个个新新博博弈弈(N,U)(N,U) ,对对任任意意联盟联盟 ,有有 . . 4、夏普利值(、夏普利值(Shapley value)值值 应满足以下公理:

139、应满足以下公理: (有有效效性性公公理理) 若若S S为为(N,V)(N,V)的的任任意意一一个个承承载,则有载,则有 ; ( 对对 称称 性性 公公 理理 ) : : 对对 N N的的 任任 意意 置置 换换 和和 ,有,有 (可可加加性性公公理理)对对任任意意两两个个 n n人人合合作作博博弈弈(N,U)(N,U) 和和 (N,V) (N,V),有,有 4、夏普利值(、夏普利值(Shapley value) 公公理理 反反映映了了帕帕累累托托最最优优性性的的要要求求,表表示示分分配配收收益益时时,不必把不必把“哑元哑元”考虑在内。考虑在内。公公理理 反反映映了了对对称称性性的的要要求求,表

140、表示示当当局局中中人人的的编编号号改改变时,分配不受影响。变时,分配不受影响。公公理理 是是关关于于可可加加性性的的要要求求,表表示示局局中中人人在在和和博博弈弈中中得到的分配等于两个分博弈中得到的分配之和。得到的分配等于两个分博弈中得到的分配之和。 4、夏普利值(、夏普利值(Shapley value)定定理理 8 8: 对对于于任任意意的的 n n人人合合作作博博弈弈 (N,V)(N,V),存存在在唯唯一一的的一一个个向向量量函函数数 ,满满足足公公理理 ,它它的的第第i i 个分量是:个分量是: 其中其中 表示联盟中所含局中人的个数。表示联盟中所含局中人的个数。 4、夏普利值(、夏普利值

141、(Shapley value) 夏夏普普利利值值的的概概率率解解释释:假假定定局局中中人人依依随随机机次次序序形形成成联联盟盟,各各种种次次序序发发生生的的概概率率假假定定相相等等,均均为为 。局局中中人人 i i在在与与其其前前面面 人人形形成成联联盟盟,局局中中人人i i 对对这这个个联联盟盟的的贡贡献献为为 (实实际际上上为为一一种种边边 际际 贡贡 献献 ) 。 与与 NSNS 的的 局局 中中 人人 相相 继继 排排 列列 的的 次次 序序 共共 有有 种,因此种,因此, , 各种次序出现的概率应为各种次序出现的概率应为 。 因因此此,局局中中人人 i i所所作作贡贡献献的的期期望望

142、值值正正好好就就是是夏夏普利值。普利值。经济博弈论基础经济博弈论基础Economic Game Theory 第三部分非对称信息博弈理论 1 1 非对称信息博弈非对称信息博弈2 2 非对称信息下的激励理论非对称信息下的激励理论3 3 非对称信息下的市场交易理论非对称信息下的市场交易理论 主要内容主要内容1 1、非对称信息博弈、非对称信息博弈:委托:委托代理理论代理理论 委委托托人人 代代理人理人 (信息少)(信息少) (信息多)(信息多)2 2、非对称信息博弈研究的问题、非对称信息博弈研究的问题: 给给定定信信息息结结构构,什什么么是是可可能能的的均均衡衡结结果果 ? 1 1 非对称信息博弈论

143、非对称信息博弈论三、信息经济学研究的问题:三、信息经济学研究的问题: 给给定定信信息息结结构构,什什么么是是最最优优的的契契约约安安排排?因此,又称为契约理论,或机制设计理论。?因此,又称为契约理论,或机制设计理论。 1 1 非对称信息博弈论非对称信息博弈论1 1、从信息非对称发生的时间来看,有:、从信息非对称发生的时间来看,有: 逆向选择模型逆向选择模型 道德风险模型道德风险模型(事事前前信信息息不不对对称称) (事事后后信息不对称)信息不对称) 委委托托人人 代理人代理人 签约签约 四四、信息非对称性的分类信息非对称性的分类2 2、从非对称信息的内容来看,有、从非对称信息的内容来看,有:

144、隐藏知识(信息)模型隐藏知识(信息)模型 隐藏行动模型隐藏行动模型 (事事前前信信息息不不对对称称) (事后信息不对称)(事后信息不对称) 委委托托人人 代理人代理人 签约签约 四四、信息非对称性的分类信息非对称性的分类1.1.隐藏行动的道德风险模型隐藏行动的道德风险模型2.2.隐藏知识的道德风险模型隐藏知识的道德风险模型3.3.隐藏知识的逆向选择模型隐藏知识的逆向选择模型 五、非对称信息博弈模型五、非对称信息博弈模型 机机制制设设计计:委委托托人人设设计计一一个个机机制制,让让代代理理人人从自身利益出发选择的行动符合委托人的要求。从自身利益出发选择的行动符合委托人的要求。 1 1、隐藏行动的

145、道德风险模型、隐藏行动的道德风险模型 机机制制设设计计:委委托托人人设设计计一一个个机机制制,让让代代理理人人从从自自身身利利益益出出发发在在给给定定自自然然状状态态下下选选择择对对委委托托人人最最有有利的行动。利的行动。 2 2、隐藏知识的道德风险模型、隐藏知识的道德风险模型 机机制制设设计计:委委托托人人设设计计一一个个机机制制,让让代代理理人人从自身利益出发说实话、披露真实信息。从自身利益出发说实话、披露真实信息。 3 3、隐藏知识的逆向选择模型、隐藏知识的逆向选择模型一一. . 激励的含义激励的含义机机制制设设计计者者(委委托托人人)诱诱使使具具有有私私人人信信息息的的代代理人从自身利

146、益出发做出的行动符合委托人的目标理人从自身利益出发做出的行动符合委托人的目标。 2 2 非对称信息下的激励理论非对称信息下的激励理论 委托人设计机制的目的是最大化自己的期望效用,委托人设计机制的目的是最大化自己的期望效用,但他这样做时,面临两个约束:但他这样做时,面临两个约束: 1 1、参与约束(个人理性约束)、参与约束(个人理性约束) 2 2、激励相容约束、激励相容约束 二、激励机制设计二、激励机制设计满足参与约束的机制称为满足参与约束的机制称为可行机制可行机制;满足激励相容约束的机制称为满足激励相容约束的机制称为可实施机制可实施机制;同同时时满满足足参参与与约约束束和和激激励励相相容容约约

147、束束的的机机制制,是是可可行的可实施机制行的可实施机制。委委托托人人的的问问题题是是设设计计一一个个可可行行的的可可实实施施机机制制以以最最大化他的期望效用。大化他的期望效用。 二、激励机制设计二、激励机制设计1 1、 状态空间模型化方法状态空间模型化方法: : 三、激励机制设计模型三、激励机制设计模型2 2、 分布函数的参数化方法分布函数的参数化方法: : 三、激励机制设计模型三、激励机制设计模型MirrleesMirrlees 和和 VickeyVickey 的工作:的工作:1 1、最佳所得税结构设计、最佳所得税结构设计2 2、最优激励合同、最优激励合同3 3、拍卖机制设计、拍卖机制设计

148、四、机制设计的应用四、机制设计的应用分两部讨论:分两部讨论:首先假定行动首先假定行动a a给定,讨论什么是产出给定,讨论什么是产出的最优的最优分配方式;分配方式; 然后讨论最优的行动选择然后讨论最优的行动选择a.a. 结论是:在对称信息下,结论是:在对称信息下,Parato Parato 最优风险分最优风险分担和担和Parato Parato 最优努力水平都可以达到。最优努力水平都可以达到。 五、对称信息下的最优合同五、对称信息下的最优合同 1 1、最优风险分担合同、最优风险分担合同 2 2、 最优努力水平最优努力水平 六、信息不对称下的最优激励合同六、信息不对称下的最优激励合同一一. . 逆

149、向选择:旧车市场逆向选择:旧车市场 Akerlof Akerlof (19701970)的旧车市场模型)的旧车市场模型二二. .信号传递:信号传递:SpenceSpence(19741974)劳动力市场模型劳动力市场模型三三. . 保险市场上的逆向选择问题保险市场上的逆向选择问题 Rothschild & Stiglitz (1976) Rothschild & Stiglitz (1976) 最优保险最优保险合同设计合同设计四四. . 逆向选择与信贷市场上的配给制逆向选择与信贷市场上的配给制 3 3 非对称信息下的市场交易理论非对称信息下的市场交易理论 AkerlofAkerlof (197

150、01970)的旧车市场模型)的旧车市场模型The Market for Lemons: Quality The Market for Lemons: Quality Uncertainty and the Market Mechanism , Uncertainty and the Market Mechanism , Quarterly Journal of EconomicsQuarterly Journal of Economics 84 (1970) 84 (1970) :488-500:488-500. 一一. . 逆向选择:旧车市场逆向选择:旧车市场 雇雇员员的的教教育育程程度度可

151、可以以作作为为信信号号向向雇雇主主传传递递有有关关雇雇员员能能力力的的信信息息,因因为为接接受受教教育育的的成成本本与与能能力力成成反比,不同能力的人的最优教育程度是不同的。反比,不同能力的人的最优教育程度是不同的。二二. .信号传递:信号传递:SpenceSpence(19741974)劳动力市场模型)劳动力市场模型Rothschild & Rothschild & StiglitzStiglitz (1976) (1976) 最优保险合同最优保险合同设计设计 Equilibrium in Competitive Insurance Equilibrium in Competitive In

152、surance Market,Market, Quarterly Journal of EconomicsQuarterly Journal of Economics 90 90 (1976):488-500.(1976):488-500. 三三. . 保险市场上的逆向选择问题保险市场上的逆向选择问题Stiglitz & Weiss (1981), Stiglitz & Weiss (1981), Credit Rationing Credit Rationing in Markets with Imperfect Information,in Markets with Imperfect I

153、nformation, American Economic Review American Economic Review 71: 393- 71: 393-410.410. 三三. . 逆向选择与信贷市场上的配给制逆向选择与信贷市场上的配给制(1 1)在所有贷款申请中,一部分人得到贷款,)在所有贷款申请中,一部分人得到贷款,另一部分人被拒绝,被拒绝的人即使愿意支付更多另一部分人被拒绝,被拒绝的人即使愿意支付更多的利息也不能得到贷款。的利息也不能得到贷款。(2 2)一个给定申请人的贷款要求只能部分地被)一个给定申请人的贷款要求只能部分地被满足(如申请满足(如申请100100万,但只能得到万,但

154、只能得到5050万)。万)。 1.1.信贷配给的两种情形信贷配给的两种情形 经济学家或者将信贷配给解释为由外部振动经济学家或者将信贷配给解释为由外部振动引起的一种暂时的非均衡现象,或者将其解释为政引起的一种暂时的非均衡现象,或者将其解释为政府干预的结果(如政府人为地规定利率上限导致需府干预的结果(如政府人为地规定利率上限导致需求大于供给)。求大于供给)。 2.2.信贷配给的传统解释信贷配给的传统解释 银行(放款人)的期望收益取决于贷款利率银行(放款人)的期望收益取决于贷款利率和贷款人还款的概率两个方面,因此,银行不仅关和贷款人还款的概率两个方面,因此,银行不仅关心利率水平,而且关心贷款人的风险

155、。如果贷款风心利率水平,而且关心贷款人的风险。如果贷款风险独立于利率水平,在资金的需求大于供给时,通险独立于利率水平,在资金的需求大于供给时,通过提高利率,银行可以增加自己的收益,不会出现过提高利率,银行可以增加自己的收益,不会出现信贷配给问题。信贷配给问题。 3. Stiglitz & Weiss 的解释的解释 问题是:问题是:当银行不能观察借款人的投资风险当银行不能观察借款人的投资风险时,提高利率将使低风险的借款人退出市场(逆向时,提高利率将使低风险的借款人退出市场(逆向选择行为),或者诱使借款人选择更高风险的项目选择行为),或者诱使借款人选择更高风险的项目(道德风险行为),从而使得银行放

156、款的平均风险(道德风险行为),从而使得银行放款的平均风险上升。上升。 Stiglitz & Weiss 的解释的解释原因是原因是:那些愿意支付较高利息的借款人正是那:那些愿意支付较高利息的借款人正是那些预期还款可能性低的些预期还款可能性低的 人。结果,利率的提高可能降人。结果,利率的提高可能降低而不是增加银行的预期收益,银行宁愿选择在相对低而不是增加银行的预期收益,银行宁愿选择在相对低的利率水平上拒绝一部分贷款要求,而不愿意选择低的利率水平上拒绝一部分贷款要求,而不愿意选择在高利率水平上满足所有贷款人的申请,信贷配给就在高利率水平上满足所有贷款人的申请,信贷配给就出现了。出现了。 Stiglitz & Weiss 的解释的解释

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号