博弈论简介(I)教材－金锄头文库

资源描述

《博弈论简介(I)教材》由会员分享，可在线阅读，更多相关《博弈论简介(I)教材（102页珍藏版）》请在金锄头文库上搜索。

1、博弈论简介第一节博弈论的基本概念第二节完全信息静态博弈第三节完全信息动态博弈第四节不完全信息静态博弈第五节不完全信息动态博弈 1 2 第一节博弈论的基本概念一、市场竞争中的博弈二、现代经济学与博弈论三、博弈论的基本概念 3 一、市场竞争中的博弈在现实经济生活中，许多产业市场是寡头断市场。寡头垄断市场是指少数几家大厂商生产一个产业中的全部或大部分产品，从而形成对一个产业的控制的产业市场。在分析寡头垄断市场中的企业决策行为时，就必须把各种决策者之间的策略相互作用纳入到经济模型中，这就是一种博弈分析。 4 二、现代经济学与博弈论从现代的观点来看，经济学

2、是研究人的决策行为的学问。理性人是指有一个很好定义的偏好，在面临给定的约束条件下能最大化自己偏好的人，不考虑竞争对手的决策。价格理论有两个基本假定：1、市场参与人的数量足够多，从而市场是竞争性的；2、参与人之间不存在信息不对称问题（完全竞争、完全信息）。然而在现实生活中，这两个假设在许多情况下是不能被满足。博弈论与诺贝尔经济学奖 1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽尔腾纳什、泽尔腾和海萨尼海萨尼。 1996年诺奖授予两位博弈论与信息经济学研究专家莫里斯、维克里； 2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨，表彰他们在柠檬市场、信号传递和信号甄别等非

3、对称信息理论研究中的开创性贡献。 2005年诺奖授予有以色列和美国双重国籍的罗伯特罗伯特奥曼和美国人托马奥曼和美国人托马斯斯谢林谢林，以表彰他们在博弈论领域作出的贡献。 5 1994年10月11日新闻公报（http:/nobelprize.org/） “由于其对非合作博弈论中关于均衡的开创性分析”，瑞典皇家科学院决定将1994年瑞典央行纪念诺贝尔经济科学奖联合授予美国加利福尼亚大学约翰.C.海萨尼教授美国普林斯顿大学约翰.F.纳什 Jr. 博士德国波恩大学莱因哈德.泽尔腾教授瑞典皇家科学院瑞典银行纪念诺贝尔经济科学奖1994年桂冠得主约翰.C.海萨尼斯坦福大学

4、经济学博士 1957年布达佩斯大学哲学博士 1947年约翰.F.纳什 Jr. 普林斯顿大学数学博士 1950年 MIT.数学教员（1951-1959）莱因哈德.泽尔腾法兰克福大学数学博士 1961年 1996年10月11日新闻公报（http:/nobelprize.org/）前者在信息经济学理论领域做出了重大贡献，尤其是不对称信息条件下的经济激励理论的论述；后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献。瑞典皇家科学院 2005年10月10日新闻公报 “由于通过博弈论分析加深了我们对冲突与合作的理解”，瑞典皇家科学院决定将2005年瑞典银行纪念诺贝尔经济科

5、学奖联合授予以色列耶路撒冷希伯来大学理性中心罗伯特.J.奥曼教授 (以色列和美国双重国籍) 美国马里兰大学经济学系与公共政策学院托马斯.C.谢林教授哈佛大学政治经济学教授。瑞典皇家科学院瑞典银行纪念诺贝尔经济科学奖2005年桂冠得主罗伯特.J.奥曼麻省理工学院数学博士, 1955 年托马斯.C.谢林哈佛大学经济学博士, 1951年 13 三、博弈论的基本概念 (一)博弈论的定义博弈论，英文为Game theory，是研究相互依赖、相互影响的决策主体的理性决策行为以及这些决策的均衡结果的理论。一些相互依赖、相互影响的决策行为及其结果的组合称为博弈(Game)

6、。 14 (二)博弈的组成要素一个博弈一般由以下几个要素组成，包括：参与人、行动、信息、策略、得益、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体) ； 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策； 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排； 15 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识； 5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的策略或行动的函数，这是每个参与人最关心的东西； 6、均衡

7、是所有参与人的最优策略或行动的组合；均衡结果是指博弈结束后博弈分析者感兴趣的一些要素的集合，如在各参与人的均衡策略作用下，各参与人最终的行动或效用集合。上述要素中，参与人、行动、结果统称为博弈规则，博弈分析的目的就是使用博弈规则来决定均衡。 16 (三)博弈的分类根据参与人的多少，可将博弈分为两人博弈或多人博弈；根据参与人是否合作，可将博弈分为合作博弈或非合作博弈；根据博弈结果的不同，又可分为零和博弈、常和博弈与变和博弈。 17 p1.从行动的先后次序来分，博弈可以分为静态博弈和动态博弈：静态博弈指在博弈中，参与人同时选择行动，或虽非同时但后行动者并不知道前行动者

8、采取了什么具体行动；动态博弈指的是参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动的博弈。 18 2、从参与人对其他参与人的各种特征信息的获得差异来分，博弈可分为完全信息博弈和不完全信息博弈。完全信息指的是每一个参与人对所有其他参与人的特征，如策略集合及得益函数都有准确完备的知识；否则就是不完全信息。将上述两个角度的划分结合起来，我们就得到四种不同类型的博弈，这就是：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈和不完全信息动态博弈。顺序信息静态博弈一般动态博弈 -序贯博弈重复动态博弈 -超级博弈完全信息纳什均衡-纳什 (1950

9、,1951); 重复剔除占优均衡-Luce和Raiffa (1957) 聚点均衡-谢林 (1960); 相关均衡- 奥曼 (1974,1987) 子博弈精炼纳什均衡- 泽尔腾(1965) 无限重复博弈：强均衡-奥曼(1959); 无名氏定理-弗里德曼 (1971); 有限重复博弈：连锁店悖论- 泽尔腾(1978) 不完全信息非对称信息贝叶斯纳什均衡- 海萨尼(1967- 1968) 颤抖的手均衡- 泽尔腾(1975); 序贯均衡-克瑞普斯和威尔逊(1982); 精炼贝叶斯均衡- 弗登伯格和泰勒尔 (1991) 无限重复博弈：奥曼、马什勒和斯泰因斯(1966-1968);

10、有限重复博弈： KMRW声誉模型 (1982) 非合作博弈论的基本内容 20 第二节完全信息静态博弈一、完全信息静态博弈定义所谓完全信息静态博弈指的是各博弈方同时决策，或者决策行动虽有先后，但后行动者不知道先行动者的具体行动是什么且各博弈方对博弈中各种策略组合情况下所有参与人相应的得益都完全了解的博弈。 21 二、博弈的策略式表达在博弈论中,一个博弈可以用两种不同的方式来表达：一种是策略式表达；另一种是扩展式表达。策略式表达更适合于静态博弈，而扩展式表达更适合于讨论动态博弈。 22 策略式表达又称为标准式表达，在这种表达中，所有参人同时选择自己的策略，所有参与人选

11、择的策略一起决定每个参与人的得益。值得强调的是，这里参与人同时选择的是 “策略”,而不是“行动”。在静态博弈中,于参与人只选择一次,所以策略就等同于行动了。而在动态博弈中，策略是参与人在各个阶段的行动的全面计划。 23 更为为准确地讲讲，战战略式表述给给出： 1、博弈的参与人集合：i，=(1,2,， n) ； 2、每个参与人的战略空间：Si i1,2,3,n ； 3、每个参与人的得益函数：ui(s1, ，si， sn)，i1,2,3, ，n。用GS1，Sn；u1, ，un代表战略式表述博弈。 24 三、博弈的得益矩阵表示一个博弈被称为有限博弈，如果：第一，参与人的个数是有限的；

12、第二，每个参人可选择的策略个数是有限的。有限博弈的策略式表达及其求解可以方便地用得益矩阵直观地给出。 25 著名的“囚徒困境”的例子警察抓住了两个罪犯，但是警察局却缺乏足够的证据指证他们所犯的罪行。如果罪犯中至少有一人供认犯罪，就能确认罪名成立。为了得到所需的口供，警察将这两名罪犯分别关押防止他们串供或结成攻守同盟，并分别跟他们讲清了他们的处境和面临的选择：如果他们两人都拒不认罪，则他们会被以较轻的妨碍公务罪各判一年徒刑；如果两人中有一人坦白认罪，则坦白者立即释放而另一人将重判10年徒刑；果两人都坦白认罪，则他们将被各判8年监禁。问：两个罪犯会如何选择（即是坦白还是

13、抵赖）？ 26 囚徒B 囚徒A 坦白不坦白坦白8，80，-10 不坦白-10，01，1 27 四、完全信息静态博弈的均衡 1、占优策略均衡。一般来说，由于每个参与人的得益是博弈中所有参与人的策略的函数，因此每个参与人的最优策略选择依赖于所有其他参与人的策略选择。但在一些特殊的博弈中，一个参与人的最优策略可能可以不依赖于其他参与人的策略选择，就是说，不论其他参与人选择什么策略，他的最优策略是唯一的，这样的最优策略被称为“占优策略”。如果一个博弈中，某个参与人有占优策略，那么该参与人的其他可选择策略就被称为“劣策略”。 28 在一个博弈里,如果所有参与人都有占优策略存在

14、，那么占优策略均衡是可以预测到的唯一的均衡，因为没有一个理性的参与人会选择劣策略。所以在囚徒困境博弈里，坦白，坦白是占优策略均衡。囚徒困境反映了一个深刻的问题,即个人理性与团体理性的冲突。这给我们一个启示,我们学习博弈论，也许更应该研究的是怎样设计一种制度,在满足个人理性的同时,去争取达到“集体理性”。 29 2、严格劣策略的重复剔除重复剔除严格劣策略”的思路如下：首先找出某个参与人的严格劣策略(假定其存在) ，把这个劣策略剔除掉，重新构造一个不包含已剔除策略的新的博弈；重复这个过程，一直到只剩下一个唯一的策略组合为止。这个唯一剩下的策略组合就是这个博弈的均衡解，称为

15、”重复剔除的占优均衡”。注意，上述表述中强调了“唯一”这个词。也就是说，如果重复剔除后剩下的策略组合不唯一，那么该博弈就不是可通过重复剔除劣策略求解的。重复剔除的占优均衡重复剔除严格劣战略：思路：首先找到某个参与人的劣战略（假定存在），把这个劣战略剔除掉，重新构造一个不包含已剔除战略的新的博弈，然后再剔除这个新的博弈中的某个参与人的劣战略，一直重复这个过程，直到只剩下唯一的战略组合为止。这个唯一剩下的战略组合就是这个博弈的均衡解，称为“重复剔除的占优均衡”。重复剔除的占优均衡 5，14，4 9，-10，0 等待小猪大猪按等待按案例2-智猪博弈按是小猪

16、的严格劣战略-剔除 4大于1 0大于-1 “按”是大猪的占优战略，纳什均衡：大猪按，小猪等待重复剔除的占优均衡 1，01，2 0，30，1 M 列先生行先生 U D L 0，1 2，0 R 行：没有占优战略列：M严格优于R 剔除 R 行：L优于D 列：无占优战略剔除 D M优于L （U，M）是重复剔除的占优均衡重复剔除的占优均衡卑斯麦海之战卑斯麦海之战发生在1943年的南太平洋上，日本海军上将木村受命将日本陆军运抵新几内亚，其间要穿越卑斯麦海。而美国上将肯尼欲对日军运输船进行轰炸，穿越卑斯麦海通往新几内亚的有两条航线，木村必须从中选一条，而肯尼则必须决定将其飞机派往何处去搜索日军，如果肯尼将他的飞机派到了错误的航线上，他虽可以召回他们，但可供轰炸的天数将减少。 2，-22，-2 1，-13，-3 木村肯尼北南北南 34 3纳什均衡纳什均衡是完全信息静态博弈解的一般概念，构成纳什均衡的策略一定是重复剔除严格劣策略过程中不能被剔除的策略，

展开阅读全文