博弈论的基本要素.PPT

上传人:汽*** 文档编号:567935421 上传时间:2024-07-22 格式:PPT 页数:66 大小:1.45MB
返回 下载 相关 举报
博弈论的基本要素.PPT_第1页
第1页 / 共66页
博弈论的基本要素.PPT_第2页
第2页 / 共66页
博弈论的基本要素.PPT_第3页
第3页 / 共66页
博弈论的基本要素.PPT_第4页
第4页 / 共66页
博弈论的基本要素.PPT_第5页
第5页 / 共66页
点击查看更多>>
资源描述

《博弈论的基本要素.PPT》由会员分享,可在线阅读,更多相关《博弈论的基本要素.PPT(66页珍藏版)》请在金锄头文库上搜索。

1、上一讲内容回顾上一讲内容回顾q博弈论用处(解释、预测和提出建议)博弈论用处(解释、预测和提出建议)q猜数游戏猜数游戏-博弈关注的(博弈关注的(interdependence)q博弈论发展简史博弈论发展简史q囚徒困境囚徒困境q智猪博弈智猪博弈q商业中心区(商业中心区(CBD)的形成)的形成q动态博弈与承诺行动动态博弈与承诺行动q信息不对称(二手车市场)信息不对称(二手车市场)q混合策略混合策略q机制设计(定价策略、制度设计等)机制设计(定价策略、制度设计等)1通俗理解博弈论通俗理解博弈论q博弈论是有关取舍策略取舍策略的科学,它的方程式告诉你在与人接触中怎样得到最大的好处。q博弈论刚开始运用到经济

2、领域,现在几乎在哪个科学领域都能看到它的身影,尤其是那些涉及到人性与人的行为的科学。23上述问题都有如下共同点q都有若干决策者,我们称之为参与人参与人(players)vN-人博弈问题的决策者集合,习惯上也用N表示v针对具体问题,参与人可以是个人一个政府公司的整个董事会博弈的基本要素博弈的基本要素456对参与人的理解对参与人的理解q博弈中的决策者。每个参与人的目标是选择一个期望最大化的策略,q要求博弈的决策主体具有行为选择能力,并且对博弈结果负责的能力,否则不是参与人。众所周知的田忌赛马博弈,参与人是田忌和齐威王,孙膑仅仅是一个策略分析者。孙膑并不是决策者,因而不是参与人.q虚拟参与人,又称为

3、自然(nature)。自然在博弈的一些特定点按照给定的概率随机选择行动。q虚拟参与人与正常的参与人之间在概念上的差异是:参与人有预先设定的效用函数,而虚拟的参与人对于给定的结局,不存在任何效用感受。7博弈论对参与人做两个基本假设博弈论对参与人做两个基本假设1 理性的(理性的(rational)? 1如果一个决策者在追逐其目标时能如果一个决策者在追逐其目标时能前后一致地做决策,就称他为前后一致地做决策,就称他为rational。Roger BMyerson (P2) 2广义而言指的是一种行为方式,他广义而言指的是一种行为方式,他同在给定条件或约束下最有效地实现预期目同在给定条件或约束下最有效地实

4、现预期目标相关。具体地讲,理性含义如下:标相关。具体地讲,理性含义如下:8(1)存在一组可供选择的备选或替代方)存在一组可供选择的备选或替代方案;案;(2)每一种方案均对应着某种特定的预期净)每一种方案均对应着某种特定的预期净收益或满足程度或目标实现程度;收益或满足程度或目标实现程度;(3)人们总是选择那个能够带来最大预期净)人们总是选择那个能够带来最大预期净收益的方案。收益的方案。(西蒙,(西蒙,1964)博弈论对参与人做两个基本假设博弈论对参与人做两个基本假设92 智能的(智能的(intelligent)? 当我们像博弈论专家那样分析一个博弈当我们像博弈论专家那样分析一个博弈时,如果参与人

5、知道我们对此博弈所知道的时,如果参与人知道我们对此博弈所知道的一切,并能做出我们对此博弈所能做出的一一切,并能做出我们对此博弈所能做出的一切推断,我们就说此博弈的参与人是智能的。切推断,我们就说此博弈的参与人是智能的。Roger BMyerson (P3)博弈论对参与人做两个基本假设博弈论对参与人做两个基本假设10q参与人都存在若干策略(strategies)或行动(actions)v参与人i的策略用si表示,参与人i的所有策略构成的集合称为策略集策略集,记为Si , si Si v注意行动与策略的区别博弈的基本要素博弈的基本要素111213q支付(收益、效用)(payoff)v各参与人对所有

6、参与人不同策略组合(strategy profile),构成了博弈的一个局势一个局势。记为 s v参与人 i (iN)对局势s 有一个主观的偏好,可用一个函数表示这种偏好,这个偏好函数称为参与人 i 的支付支付博弈的基本要素博弈的基本要素1415q参与人、各参与人的策略集、各参与人的支付函数,是博弈最重要的基本要素。博弈的基本要素博弈的基本要素16 1:博弈的基本特征是一个参与人博弈的基本特征是一个参与人的支付不仅取决于自己的策略选择,而且取的支付不仅取决于自己的策略选择,而且取决于所有其他参与人的策略选择;是策略组决于所有其他参与人的策略选择;是策略组合的函数。合的函数。 2:效用是参与人真

7、正关心的东西,参:效用是参与人真正关心的东西,参与人在博弈中的目标就是选择自己的策略以与人在博弈中的目标就是选择自己的策略以最大化自己的效用函数。最大化自己的效用函数。1718192021An item of information in a game is common knowledge if all of the players know it and all of the players know that all other players know it and all other players know that all other players know that all

8、other players know it, and so on. This is much more than simply saying that something is known by all, but also implies that the fact that it is known is also known by all, etc. 22Consider a simple example of two allied armies situated on opposite hilltops waiting to attack their foe. Neither comman

9、der will attack unless he is sure that the other will attack at exactly the same time. The first commander sends a messenger to the other hilltop with the message I plan to attack in the morning. The messengers journey is perilous and he may die on the way to delivering the message. 23If he gets to

10、the other hilltop and informs the other commander - can we be certain that both will attack in the morning? Note that both commanders now know the message, but the first cannot be sure that the second got the message. Thus, common knowledge implies not only that both know some piece of information,

11、but can also be absolutely confident that the rest know it, and that the rest know that we know it, and so on. 24共同知识趣题共同知识趣题有一群人围坐在一起,假定只有4个人,每人头上带着戴着一顶帽子,颜色为黑色和白色,每个人看不到自己头上帽子的颜色,但能看到别人帽子的颜色. 为了分析的方便,我们假定这四个人均戴的是黑色帽子。这时候,一个局外人来到他们集体当中,对他们说:“你们其中至少一个头戴的是黑色帽子。”当他说完这句话后,他问:“你们知道你们头上的帽子颜色吗?”4个人都说不知道。这

12、个局外人第二次问道:“你们知道你们头上帽子的颜色吗?”4个人又都说不知道。局外人第三次问:“你们知道你们头上帽子的颜色吗?”4个人又说不知道。局外人第四次问道:“你们知道你们头上帽子的颜色吗?”这时4个人均说知道了。 你能知道这是为什么吗? 25博弈概念的理解博弈概念的理解 qOPEC成员国选择其年产量;成员国选择其年产量;q两家制造商,一家做螺钉,一一家做螺帽,决两家制造商,一家做螺钉,一一家做螺帽,决定是采用美制标准还是公制标准;定是采用美制标准还是公制标准;q公司董事会为其总经理设立一项期股安排;公司董事会为其总经理设立一项期股安排;q一家电力公司在估计了未来一家电力公司在估计了未来10

13、年对电力的需年对电力的需求后,决定是否购置一套新的发电机组;求后,决定是否购置一套新的发电机组;q明天出去玩,决定是否带伞;明天出去玩,决定是否带伞;q诸葛亮和司马懿进行的空城计;诸葛亮和司马懿进行的空城计;26Definition of a GameqMust consider the strategic environmentWho are the PLAYERS? (Decision makers)What STRATEGIES are available? (Feasible actions)What are the PAYOFFS? (Objectives)qRules of the

14、 gameWhat is the time-frame for decisions?What is the nature of the conflict?What is the nature of interaction?What information is available?2728293031课程主要内容课程主要内容q完全信息静态博弈q完全信息动态博弈q不完全信息静态博弈q机制设计q合作博弈32完全信息静态博弈概念完全信息静态博弈概念q概念:各参与人对彼此的策略集、支付函数有准确了解q博弈行为同时进行q一些实例v石头、剪子、布游戏v彼此了解的两个厂商的价格战33完全信息静态博弈概念完全

15、信息静态博弈概念q有些实际博弈v虽然决策不是在绝对时间意义上的“同时”,v但决策的时间先后差别跟博弈结果没有关系,也可看成是“同时进行的博弈”。v如不同竞标单位作出的工程投标决策34博弈的策略式表述博弈的策略式表述q常用G表示一个博弈q博弈模型的两种表示形式v策略式表述 (Strategic form), v扩展式表述(Extensive form)q本章主要介绍博弈的策略式表述35博弈的策略式表述博弈的策略式表述q参与人集合vN人博弈的参与人集合,往往也记为N。参与人则记为i, i Nv参与人i的策略集,记为Si ,其中的一个特定策略,可记为si.有si Si.36v对于给定的参与人i, i

16、=1,2,N, 卡氏积 S1S2 Si-1 Si+1 Sn v表示除了参与人i外所有参与人所有策略的可能组合,通 常记为S-i;v于是所有参与人不同策略组合构成的策略空间可表示为vS=(Si , S-i)博弈的策略式表述博弈的策略式表述37vSi中的元素 si 表示参与人i的一个具体策略v一旦确定了所有参与人的策略,便形成了一个博弈局势,表示为s=(s1, s2, sN),sS。博弈的策略式表述博弈的策略式表述38q参与人i的效用函数v参与人 i的支付函数,是从博弈局势集S=S1S2 SN 到实数集R的一个映射,记为ui(s1, s2, s N),表示参与人i对局势s = (s1, s2, s

17、n)的偏好。q一个博弈可以表示为G = S1, ,SN; u1, ,uN, i Nq这就是博弈的策略式表述博弈的策略式表述博弈的策略式表述39博弈的策略式表述博弈的策略式表述例 写出囚徒问题的策略式表述v参与人集合N=囚徒1,囚徒2v参与人的策略集S1=S2= 坦白,不坦白v各参与人的支付,可用图1-1表示。坦 白不坦白坦 白(-8, -8)(0, -10)不坦白(-10, 0)(-1, -1)图图1-1 1-1 囚徒问题的支付矩阵囚徒问题的支付矩阵囚徒1囚徒240博弈的策略式表述博弈的策略式表述v实质上,图1-1已经完全表述了囚徒困境的策略式表述信息v称图1-1为二人有限博弈的双矩阵双矩阵

18、(bimatrix)表述坦 白不坦白坦 白(-8, -8)(0, -10)不坦白(-10, 0)(-1, -1)图图1-1 1-1 囚徒问题的支付矩阵囚徒问题的支付矩阵囚徒1囚徒241占优均衡占优均衡q英文术语:Dominant-strategy Equilibriumq定义:在博弈中如果不管其他参与人选择什么策略,一个参与人的某个策略给他带来的支付值始终高于其他策略,或至少不劣于其他策略,则称该策略为该参与人的严格占优策略或占优策略。42占优策略占优策略q对于所有的s-i, si*称为参与人i的严格占优战略,如果满足:qui(si*,s-i)ui(si,s-i) s-i, si si*43占

19、优均衡占优均衡q占优均衡定义v一个博弈的某个策略组合中,如果对应的所有策略都是各参与人的占优策略,则称该策略组合为该博弈的一个占优均衡。44占优均衡占优均衡q占优战略均衡:每个参与人的占优战略组合(如果存在的话)被称为占优战略均衡。坦 白不坦白坦 白(-8, -8)(0, -10)不坦白(-10, 0)(-1, -1)图图1-2 囚徒问题的支付矩阵囚徒问题的支付矩阵囚徒1囚徒245占优均衡占优均衡q以囚徒1为例,无论囚徒2采取什么策略坦 白不坦白坦 白(-8, -8)(0, -10)不坦白(-10, 0)(-1, -1)图图1-2 囚徒问题的支付矩阵囚徒问题的支付矩阵囚徒1囚徒246占优均衡占

20、优均衡q坦白总是占优策略图图1-2 囚徒问题的支付矩阵囚徒问题的支付矩阵囚徒1囚徒2坦 白不坦白坦 白(-8, -8)(0, -10)不坦白(-10, 0)(-1, -1)47占优均衡占优均衡q由于矩阵的对称性,对囚徒2来说亦可得出类似结论坦 白不坦白坦 白(-8, -8)(0, -10)不坦白(-10, 0)(-1, -1)图图1-2 囚徒问题的支付矩阵囚徒问题的支付矩阵囚徒1囚徒248占优均衡占优均衡q因此,该博弈的策略组合(坦白、坦白)是占优均衡。图图1-2 囚徒问题的支付矩阵囚徒问题的支付矩阵囚徒1囚徒2坦 白不坦白坦 白(-8, -8)(0, -10)不坦白(-10, 0)(-1,

21、-1)49占优均衡占优均衡q但该占优均衡的收益,却劣于另外一个策略组合(不坦白,不坦白)。坦 白不坦白坦 白(-8, -8)(0, -10)不坦白(-10, 0)(-1, -1)图图1-2 囚徒问题的支付矩阵囚徒问题的支付矩阵囚徒1囚徒250q成绩博弈,分析占优策略和占优均衡51重复剔除严劣策略均衡重复剔除严劣策略均衡q前面介绍了第一均衡概念占优均衡q(显然)并非所有博弈都存在占优均衡,如石头、剪子、布游戏q对占优均衡概念稍加扩展,就得到重复剔除严劣策略均衡概念52选举实例选举实例q中间选民定理53重复剔除严劣策略均衡重复剔除严劣策略均衡q“严劣”和“弱劣”的含义:v 设 si和si是参与人i

22、可选择的两个策略,若对其他参与人的任意策略组合s-i, 均成立ui(si, s-i) ui(si, s-i), 则说策略si严劣于策略si 。v上面式子中,若将“”改为“”,则说策略si弱劣于策略si 。54重复剔除严劣策略均衡重复剔除严劣策略均衡q重复剔除严劣策略均衡的定义v重复剔除严格策略就是各参与人在其各自策略集中,不断剔除严劣策略v如果最终各参与人仅剩下一个策略,则该策略组合就被称为重复剔除严劣策略均衡。55重复剔除严劣策略均衡重复剔除严劣策略均衡q实例 一个虚拟的博弈,见图1-4。v该博弈不存在占优均衡。参参与与人人1 参参 与与 人人 2上上下下 左左 中中 右右1, 01, 30

23、, 10, 40, 22, 0图图 1-456重复剔除严劣策略均衡重复剔除严劣策略均衡v可用重复剔除严劣策略的方法,得到重复剔除严劣策略均衡解参参与与人人1 参参 与与 人人 2上上下下 左左 中中 右右1, 01, 30, 10, 40, 22, 0图图 1-457重复剔除严劣策略均衡重复剔除严劣策略均衡v先从参与人2开始v显然,策略“中”要严格优于策略“右”,因此,参与人2应该剔除严劣策略“右”,博弈简化为图1-5参参与与人人1 参参 与与 人人 2上上下下 左左 中中 右右1, 01, 30, 10, 40, 22, 0图图 1-458重复剔除严劣策略均衡重复剔除严劣策略均衡v先从参与人

24、2开始v显然,策略“中”要严格优于策略“右”,因此,参与人2应该剔除严劣策略“右”,博弈简化为图1-5参参与与人人1 参参 与与 人人 2上上下下 左左 中中1, 01, 30, 40, 2图图 1-559重复剔除严劣策略均衡重复剔除严劣策略均衡v由于博弈的信息对于两个参与人来说是“完全的”,因此,参与人1能够预测到参与人2的这个推理过程参参与与人人1 参参 与与 人人 2上上下下 左左 中中1, 01, 30, 40, 2图图 1-560重复剔除严劣策略均衡重复剔除严劣策略均衡v或者说,参与人1能够看到图1-5v因此,参与人1应剔除图1-5中的严劣策略“下”。从而博弈变成图1-6参参与与人人

25、1 参参 与与 人人 2上上下下 左左 中中1, 01, 30, 40, 2图图 1-561重复剔除严劣策略均衡重复剔除严劣策略均衡v或者说,参与人1能够看到图1-5v因此,参与人1应剔除图1-5中的严劣策略“下”。从而博弈变成图1-6参参与与人人1 参参 与与 人人 2上上下下 左左 中中1, 01, 3图图 1-662重复剔除严劣策略均衡重复剔除严劣策略均衡v如果参与人2能够预测到参与人1的推理v对于参与人2而言,针对图1-6的博弈参参与与人人1 参参 与与 人人 2上上下下 左左 中中1, 01, 3图图 1-663重复剔除严劣策略均衡重复剔除严劣策略均衡v当然应该剔除严劣策略“左”参参与与人人1 参参 与与 人人 2上上下下 左左 中中1, 01, 3图图 1-664重复剔除严劣策略均衡重复剔除严劣策略均衡v当然应该剔除严劣策略“左”,见图1-7v此时余下唯一策略组合(上,中),从而得到重复剔除严劣策略均衡参参与与人人1 参参 与与 人人 2上上 中中1, 3图图 1-765汉尼拔进攻罗马,弱劣策略不能剔除。66

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号