博弈论简介(I)教材

上传人:我** 文档编号:116885984 上传时间:2019-11-17 格式:PPT 页数:102 大小:2.24MB
返回 下载 相关 举报
博弈论简介(I)教材_第1页
第1页 / 共102页
博弈论简介(I)教材_第2页
第2页 / 共102页
博弈论简介(I)教材_第3页
第3页 / 共102页
博弈论简介(I)教材_第4页
第4页 / 共102页
博弈论简介(I)教材_第5页
第5页 / 共102页
点击查看更多>>
资源描述

《博弈论简介(I)教材》由会员分享,可在线阅读,更多相关《博弈论简介(I)教材(102页珍藏版)》请在金锄头文库上搜索。

1、 博弈论简介 第一节 博弈论的基本概念 第二节 完全信息静态博弈 第三节 完全信息动态博弈 第四节 不完全信息静态博弈 第五节 不完全信息动态博弈 1 2 第一节 博弈论的基本概念 一、市场竞争中的博弈 二、现代经济学与博弈论 三、博弈论的基本概念 3 一、市场竞争中的博弈 在现实经济生活中,许多产业市场是寡 头断市场。寡头垄断市场是指少数几家大厂 商生产一个产业中的全部或大部分产品,从 而形成对一个产业的控制的产业市场。 在分析寡头垄断市场中的企业决策行为 时,就必须把各种决策者之间的策略相互作 用纳入到经济模型中,这就是一种博弈分析 。 4 二、现代经济学与博弈论 从现代的观点来看,经济学

2、是研究人的决策 行为的学问。 理性人是指有一个很好定义的偏好,在面临给 定的约束条件下能最大化自己偏好的人,不考虑竞 争对手的决策。 价格理论有两个基本假定:1、市场参与人的 数量足够多,从而市场是竞争性的;2、参与人之 间不存在信息不对称问题(完全竞争、完全信息) 。 然而在现实生活中,这两个假设在许多情况下 是不能被满足。 博弈论与诺贝尔经济学奖 1994年诺贝尔经济学奖授予了三位博弈论专家纳什、泽尔腾纳什、泽尔腾和海萨尼海萨尼 。 1996年诺奖授予两位博弈论与信息经济学研究专家莫里斯、维克里; 2001年诺奖授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他们在柠檬市 场、信号传递和信号甄别等非

3、对称信息理论研究中的开创性贡献。 2005年诺奖授予有以色列和美国双重国籍的罗伯特罗伯特 奥曼和美国人托马奥曼和美国人托马 斯斯 谢林谢林,以表彰他们在博弈论领域作出的贡献。 5 1994年10月11日 新闻公报(http:/nobelprize.org/) “由于其对非合作博弈论中关于均衡的开创性分析”,瑞典皇家科学 院决定将1994年瑞典央行纪念诺贝尔经济科学奖联合授予美国加利 福尼亚大学 约翰.C.海萨尼 教授美国普林斯顿大学 约翰.F.纳什 Jr. 博士德国波恩大学 莱因哈德.泽尔腾 教授 瑞典皇家科学院 瑞典银行纪念诺贝尔经济 科学奖1994年桂冠得主 约翰.C.海萨尼 斯坦福大学

4、经济学博士 1957年 布达佩斯大学 哲学博士 1947年 约翰.F.纳什 Jr. 普林斯顿大学 数学博士 1950年 MIT.数学教员(1951-1959) 莱因哈德.泽尔腾 法兰克福大学 数学博士 1961年 1996年10月11日 新闻公报(http:/nobelprize.org/) 前者在信息经济学理论领域做出了重大贡献,尤其是不对称信息条 件下的经济激励理论的论述;后者在信息经济学、激励理论、博弈 论等方面都做出了重大贡献。 瑞典皇家科学院 2005年10月10日 新闻公报 “由于通过博弈论分析加深了我们对冲突与合作的理解”,瑞典皇家科学 院决定将2005年瑞典银行纪念诺贝尔经济科

5、学奖联合授予以色列耶路 撒冷希伯来大学理性中心罗伯特.J.奥曼 教授 (以色列和美国双重国籍) 美国马里兰大学经济学系与公共政策学院托马斯.C.谢林 教授 哈佛大 学政治经济学教授。 瑞典皇家科学院 瑞典银行纪念诺贝尔经济 科学奖2005年桂冠得主 罗伯特.J.奥曼 麻省理工学院 数学博士, 1955 年 托马斯.C.谢林 哈佛大学 经济学博士, 1951年 13 三、博弈论的基本概念 (一)博弈论的定义 博弈论,英文为Game theory,是研究相 互依赖、相互影响的决策主体的理性决策行为 以及这些决策的均衡结果的理论。 一些相互依赖、相互影响的决策行为及其 结果的组合称为博弈(Game)

6、。 14 (二)博弈的组成要素 一个博弈一般由以下几个要素组成,包括: 参与人、行动、信息、策略、得益、结果、均衡 等。 1、参与人指的是博弈中选择行动以最大化自 己效用的决策主体(可以是个人,也可以是团体) ; 2、行动是指参与人在博弈进程中轮到自己选 择时所作的某个具体决策; 3、策略是指参与人选择行动的规则,即在博 弈进程中,什么情况下选择什么行动的预先安排 ; 15 4、信息指的是参与人在博弈中所知道的关于 自己以及其他参与人的行动、策略及其得益函数 等知识; 5、得益是参与人在博弈结束后从博弈中获得 的效用,一般是所有参与人的策略或行动的函数 ,这是每个参与人最关心的东西; 6、均衡

7、是所有参与人的最优策略或行动的组 合;均衡结果是指博弈结束后博弈分析者感兴趣 的一些要素的集合,如在各参与人的均衡策略作 用下,各参与人最终的行动或效用集合。 上述要素中,参与人、行动、结果统称为博 弈规则,博弈分析的目的就是使用博弈规则来决 定均衡。 16 (三)博弈的分类 根据参与人的多少,可将博弈分为两人博弈 或多人博弈; 根据参与人是否合作,可将博弈分为合作博 弈或非合作博弈; 根据博弈结果的不同,又可分为零和博弈、 常和博弈与变和博弈。 17 p1.从行动的先后次序来分,博弈可以分为静态博 弈和动态博弈: 静态博弈指在博弈中,参与人同时选择行动 ,或虽非同时但后行动者并不知道前行动者

8、 采取了什么具体行动; 动态博弈指的是参与人的行动有先后顺序, 且后行动者能够观察到先行动者所选择的行 动的博弈。 18 2、从参与人对其他参与人的各种特征信息 的获得差异来分,博弈可分为完全信息博弈和不 完全信息博弈。 完全信息指的是每一个参与人对所有其他参 与人的特征,如策略集合及得益函数都有准确完 备的知识;否则就是不完全信息。 将上述两个角度的划分结合起来,我们就得 到四种不同类型的博弈,这就是:完全信息静态 博弈,完全信息动态博弈,不完全信息静态博弈 和不完全信息动态博弈。 顺序 信息 静态博弈一般动态博弈 -序贯博弈 重复动态博弈 -超级博弈 完全 信息 纳什均衡-纳什 (1950

9、,1951); 重复剔除占优均 衡-Luce和Raiffa (1957) 聚点均衡-谢林 (1960); 相关均衡- 奥曼 (1974,1987) 子博弈精炼纳什均衡- 泽尔腾(1965) 无限重复博弈: 强均衡-奥曼(1959); 无名氏定理-弗里德 曼 (1971); 有限重复博弈: 连锁店悖论- 泽尔腾(1978) 不完全 信息 非对称 信息 贝叶斯纳什均衡- 海萨尼(1967- 1968) 颤抖的手均衡- 泽尔腾(1975); 序贯均衡-克瑞普斯和 威尔逊(1982); 精炼贝叶斯均衡- 弗 登伯格和泰勒尔 (1991) 无限重复博弈: 奥曼、马什勒和斯 泰因斯(1966-1968);

10、 有限重复博弈: KMRW声誉模型 (1982) 非合作博弈论的基本内容 20 第二节 完全信息静态博弈 一、完全信息静态博弈定义 所谓完全信息静态博弈指的是各博弈方同 时决策,或者决策行动虽有先后,但后行动者 不知道先行动者的具体行动是什么且各博弈方 对博弈中各种策略组合情况下所有参与人相应 的得益都完全了解的博弈。 21 二、博弈的策略式表达 在博弈论中,一个博弈可以用两种不同 的方式来表达: 一种是策略式表达;另一种是扩展式 表达。策略式表达更适合于静态博弈,而 扩展式表达更适合于讨论动态博弈。 22 策略式表达又称为标准式表达,在这种表 达中,所有参人同时选择自己的策略,所有参 与人选

11、择的策略一起决定每个参与人的得益。 值得强调的是,这里参与人同时选择的是 “策略”,而不是“行动”。 在静态博弈中,于参与人只选择一次,所以 策略就等同于行动了。而在动态博弈中,策略 是参与人在各个阶段的行动的全面计划。 23 更为为准确地讲讲,战战略式表述给给出: 1、博弈的参与人集合:i,=(1,2,, n) ; 2、每个参与人的战略空间:Si i1,2,3,n ; 3、每个参与人的得益函数:ui(s1, ,si, sn),i1,2,3, ,n。 用GS1,Sn;u1, ,un代表战略式 表述博弈。 24 三、博弈的得益矩阵表示 一个博弈被称为有限博弈,如果: 第一,参与人的个数是有限的;

12、 第二,每个参人可选择的策略个数是有限的。 有限博弈的策略式表达及其求解可以方便地用得益矩 阵直观地给出。 25 著名的“囚徒困境”的例子 警察抓住了两个罪犯,但是警察局却缺乏足 够的证据指证他们所犯的罪行。如果罪犯中至少 有一人供认犯罪,就能确认罪名成立。为了得到 所需的口供,警察将这两名罪犯分别关押防止他 们串供或结成攻守同盟,并分别跟他们讲清了他 们的处境和面临的选择:如果他们两人都拒不认 罪,则他们会被以较轻的妨碍公务罪各判一年徒 刑;如果两人中有一人坦白认罪,则坦白者立即 释放而另一人将重判10年徒刑;果两人都坦白认 罪,则他们将被各判8年监禁。问:两个罪犯会 如何选择(即是坦白还是

13、抵赖)? 26 囚徒B 囚徒A 坦白不坦白 坦白8,80,-10 不坦白-10,01,1 27 四、完全信息静态博弈的均衡 1、占优策略均衡。一般来说,由于每个参 与人的得益是博弈中所有参与人的策略的函数, 因此每个参与人的最优策略选择依赖于所有其他 参与人的策略选择。但在一些特殊的博弈中,一 个参与人的最优策略可能可以不依赖于其他参与 人的策略选择,就是说,不论其他参与人选择什 么策略,他的最优策略是 唯一的,这样的最优 策略被称为“占优策略”。 如果一个博弈中,某个参与人有占 优策略 ,那么该参与人的其他可选择策略就被称为“劣 策略”。 28 在一个博弈里,如果所有参与人都有占优策略 存在

14、,那么占优策略均衡是可以预测到的唯一的均衡, 因为没有一个理性的参与人会选择劣策略。所以在囚徒 困境博弈里,坦白,坦白是占优策略均衡。 囚徒困境反映了一个深刻的问题,即个人理性与 团体理性的冲突。这给我们一个启示,我们学习博弈论 , 也许更应该研究的是怎样设计一种制度,在满足个人理 性的同时,去争取达到“集体理性”。 29 2、严格劣策略的重复剔除 重复剔除严格劣策略”的思路如下:首先 找出某个参与人的严格劣策略(假定其存在) ,把这个劣策略剔除掉,重新构造一个不包 含已剔除策略的新的博弈;重复这个过程, 一直到只剩下一个唯一的策略组合为止。这 个唯一剩下的策略组合就是这个博弈的均衡 解,称为

15、”重复剔除的占优 均衡”。注意,上 述表述中强调了“唯一”这个词。也就是说, 如果重复剔除后剩下的策略组合不唯一,那 么该博弈就不是可通过重复剔除劣策略求解 的。 重复剔除的占优均衡 重复剔除严格劣战略: 思路:首先找到某个参与人的劣战略(假定存在 ),把这个劣战略剔除掉,重新构造一个不包 含已剔除战略的新的博弈,然后再剔除这个新 的博弈中的某个参与人的劣战略,一直重复这 个过程,直到只剩下唯一的战略组合为止。 这个唯一剩下的战略组合就是这个博弈的 均衡解,称为“重复剔除的占优均衡”。 重复剔除的占优均衡 5,14,4 9,-10,0 等待 小猪 大猪 按 等待 按 案例2-智猪博弈 按是小猪

16、的严格 劣战略-剔除 4大于1 0大于-1 “按”是大猪的占优战略,纳什均衡:大猪按,小猪等待 重复剔除的占优均衡 1,01,2 0,30,1 M 列先生 行先生 U D L 0,1 2,0 R 行:没有占优战略 列:M严格优于R 剔除 R 行:L优于D 列:无占优战略 剔除 D M优于L (U,M) 是重复剔除 的占优均衡 重复剔除的占优均衡 卑斯麦海之战 卑斯麦海之战发生在1943年的南太平 洋上,日本海军上将木村受命将日 本陆军运抵新几内亚,其间要穿越 卑斯麦海。 而美国上将肯尼欲对日军运输船进行 轰炸,穿越卑斯麦海通往新几内亚 的有两条航线,木村必须从中选一 条,而肯尼则必须决定将其飞机派 往何处去搜索日军,如果肯尼将他 的飞机派到了错误的航线上,他虽 可以召回他们,但可供轰炸的天数 将减少。 2,-22,-2 1,-13,-3 木村 肯尼 北 南 北南 34 3纳什均衡 纳什均衡是完全信息静态博弈解的一般概 念,构成纳什均衡的策略一定是重复剔除严格 劣策略过程中不能被剔除的策略,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 大学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号