博弈论与决策行为

上传人:平*** 文档编号:48602171 上传时间:2018-07-18 格式:PPT 页数:173 大小:811.52KB
返回 下载 相关 举报
博弈论与决策行为_第1页
第1页 / 共173页
博弈论与决策行为_第2页
第2页 / 共173页
博弈论与决策行为_第3页
第3页 / 共173页
博弈论与决策行为_第4页
第4页 / 共173页
博弈论与决策行为_第5页
第5页 / 共173页
点击查看更多>>
资源描述

《博弈论与决策行为》由会员分享,可在线阅读,更多相关《博弈论与决策行为(173页珍藏版)》请在金锄头文库上搜索。

1、第2章 博弈论与决策行为21 博弈论的基本概念l一、博弈参与人 博弈参与人(player)是博弈中选择行动以最大化 自己效用的决策主体。参与人可以是自然人,也可 以是企业、团队、国家,甚至是国家组成的集团( 如欧盟、OPEC等)。除一般意义上的参与人外,博弈论中还有“虚拟参 与人”(pseudo player)自然(nature),“ 自然”是指不以博弈参与人意志为转移的外生事件 ,“自然”选择的是外生事件的各种可能现象,并 用概率分布来描述“自然”的选择机理。也可以说 ,自然就是决定外生的随机变量的概率分布的机制 。l 二、行动 l 行动(action or move)是参与人在博弈的某个

2、时点的决策变量。 l 与行动相关的一个重要问题是行动的顺序。静态 博弈与动态博弈就是依据行动的顺序进行区分的 。所谓静态博弈,就是指参与人同时选择行动, 或虽然不是准确意义上的同时,但后行动者并不 知道先行动者采取了什么具体行动;动态博弈则 是指参与人的行动有先后顺序,且后行动者能够 观察到先行动者所选择的行动。l 三、战略 l 博弈中各参与人的行动规则称为“战略”(strategy) ,它规定参与人在什么情况下选择什么行动。各 参与人可以选择的全部战略或战略选择的范围称 为“战略空间”。 l 如果一个博弈中每个参与人的战略数都是有限的 ,则称为“有限博弈”(finite game),如果一个

3、博 弈中至少有某些参与人的战略有无限多个,则称 为“无限博弈”(infinite game)。l 四、得益 l 得益(payoff)是指在一个特定的战略组合下参与 人从博弈中所获得的利益,是参与人追求的根本 目标,也是他们行为和判断的主要依据。博弈的 一个基本特征是参与人的得益不仅取决于自己的 战略选择,而且取决于所有参与人的战略选择, 因此参与人的得益是所有参与人战略组合的函数 。l 五、信息 l 信息指的是参与人在博弈过程中能够了解和观察 到的知识,这些知识包括“自然”的选择、其他参 与人的特征和行动等。 l 一般地,将各博弈方都完全了解所有博弈方各种 情况下得益的博弈称为“完全信息 (c

4、ompleteinformation)博弈”,而将至少部分 博弈方不完全了解其他博弈方得益情况的博弈称 为“不完全信息(incompleteinformation)博弈” 。l 六、合作博弈与非合作博弈 l 合作博弈(cooperative games)与非合作博弈 (non-cooperative games)的区别,主要在于博 弈的当事人之间能否达成一个有约束力的协议。 如果有,就是合作博弈;反之,就是非合作博弈 。 l 当前,非合作博弈是博弈论研究的主流领域。非 合作博弈按照参与人的信息状态和行动顺序两个 角度进行划分,得到四种不同类型的博弈:完全 信息静态博弈、完全信息动态博弈、不完全

5、信息 静态博弈、不完全信息动态博弈。22 完全信息静态博弈 参与者同时选择行动,根据所有参与者的选择 ,每个参与者得到各自的结果(一定的收益或 支出)。 每一参与者的收益函数(根据所有参与者选择 行动的不同组合决定某一参与者收益的函数) 在所有参与者之间是共同知识。221博弈的标准式表述和求解l 博弈标准式表述含有以下三个要素: (1)参与人集合, (2)每一个参与人可供选择的战略集, (3)针对所有参与人可能选择的战略组合,每一 个参与人获得的收益。l 用G表示一个博弈,如果G有n个博弈方,每个博 弈方的全部可选战略的集合称为“战略空间”,分 别用S1,,Sn表示,SijSi表示博弈方i的第

6、j个 战略,其中j可取有限个值(有限战略博弈),也 可取无限个值(无限战略博弈);博弈方i的得益 用ui表示,是各博弈方战略的多元函数,n个博弈 方的博弈G写成G=S1,Sn;u1,un占优战略均衡 l 在博弈中,如果所有的参与人都有占优战略存在 ,因而博弈将在所有参与人的占优战略的基础上 达到均衡,这种均衡称为占优战略均衡。在上表 中,“A坦白,B也坦白”就是占优战略均衡。 l 占优战略均衡只要求所有的参与人是理性的,而 并不要求每个参与人知道其他参与人也是理性的 。 l 不论其他参与人是否理性,占优战略总是一个理 性参与人的最优选择。重复剔除严格劣势战略均衡l 在绝大多数博弈中,占优战略均

7、衡是不存在的。 我们可以通过逐步剔除劣势策略找出博弈的均衡 。l 劣战略(dominated strategies):是指在其他博弈参 与人战略为既定的条件下,某一参与人可能采取 的战略中,对自己相对不利的战略。 l 严格劣战略(strictly dominated strategies)则是指 :无论其他博弈参与人采取什么战略,某一参与 人可能采取的战略中,对自己相对不利的战略。l 首先找出某一博弈参与人的严格劣战略,将它剔 除掉,重新构造一个不包括已剔除战略的新的博 弈;然后继续剔除这个新的博弈中某一参与人的 严格劣战略;重复进行这一过程,直到剩下唯一 的参与人战略组合为止。 l 这个唯一

8、剩下的参与人战略组合,就是这个博弈 的均衡解,称为“重复剔除的占优战略均衡 ”(iterated dominance equilibrium).与占优战略均衡相比,重复剔除劣势战略均衡不仅要求博弈 的所有参与人都是理性的,而且要求每个参与人都了解所有 的其他参与人都是理性的。在上例中,如果大猪不能排除小 猪按按钮的可能性,按按钮就不一定是大猪的最优选择。纳什均衡(NASH EQUILIBRIUM)l 设想在博弈论预测的博弈结果中,给定每个参与 人选定各自的战略,为使该预测是正确的,必须 使参与人自愿选择理论给他推到出的战略。 l 这样,每个参与人要选择的战略必须是针对其他 参与人选择战略的最优

9、反应,这种理论推测结果 可以叫做“战略稳定”或“自动实施”的,因为没有 参与人愿意独自离弃他所选定的战略,我们把这 一状态就称为纳什均衡。qNash Equilibrium:“Im doing the best I can given what you are doing”“Youre doing the best you can given what I am doing.”l 定义:在博弈G=S1,Sn;u1,un中,如果 由各个博弈方的各一个策略组合(s1*,,sn*) 中,任一博弈方i的策略si*都是对其余博弈方策略 组合(s1*,, si-1*,si+1*, sn*)的最佳策略, 即

10、ui(s1*,, si-1*,si*,si+1*, sn*)ui(s1*, , si-1*,sij,si+1*, sn*)对任意sijSi都成立, 则称(s1*,,sn*)为G的一个纳什均衡。l 可以证明:纳什均衡战略决不会在重复剔除劣战 略的过程中被剔除掉,而重复剔除劣战略后所留 战略却不一定满足纳什均衡战略的条件,因此纳 什均衡是一个比重复剔除严格劣战略要强的解的 概念。无限策略博弈分析和反应函数l 在无限策略、连续策略空间的博弈中,我们仍然 可以以纳什均衡概念为基础进行博弈分析。古诺的寡头模型寡头产量竞争以两厂商产量竞争为例2 22126qqqq-=反应函数古诺模型的反应函数q1* =

11、q2*=24.5,4.55,3.753.75,54,4不突破突破厂商2不突破 突破厂 商 1以自身最大利益为目标:各生产 2单位产量,各自得益为4 以两厂商总体利益最大:各生产 1.5单位产量,各自得益为4.5两寡头间的囚徒困境博弈222完全信息静态博弈的典型应用l 一、豪泰林(Hotelling)价格竞争模型 l 在古诺模型中,产品是同质的。在这个假设下, 如果企业的竞争战略是价格而不是产量,伯川德 (Bertrand)证明,即使只有两个企业,在均衡 情况下,价格等于平均成本,企业的利润为零, 与完全竞争市场均衡一样。这便是所谓的“伯川德 悖论”。(Bertrand Paradox)l 与古

12、诺模型相比,伯川德模型中的纳什均衡是 完全竞争的结果:双方的定价都等于成本,这 与古诺模型中双方均获得正利润的结果截然不 同。 l 为什么?每个厂商都有削价的动机,如果一方 削价(哪怕是些微的),它就可以占领整个市 场并提高其利润水平。因此,直至价格被压低 至成本水平(假如双方相同),双方都将价格 定为在略低于对手的水准。 l 纳什均衡的含义:一旦双方的索价等于成本, 任一方就不存在调整其价格的动机了。l 解开这一悖论的办法之一是引入产品的差异性。 如果不同企业生产的产品是有差异的,替代弹性 就不会是无限的,此时消费者对不同企业的产品 有着不同的偏好,价格不是他们唯一感兴趣的变 量。在存在产品

13、差异的情况下,均衡价格不会等 于成本。l 产品差异有多种形式,经典的豪泰林模型考虑了 一种特殊的差异,即空间上的差异。在模型中, 产品在物质性能上是相同的,但在空间位置上有 差异。因为不同位置上的消费者要支付不同的运 输成本,他们关心的是价格与运输成本之和,而 不仅仅是价格。l 假定有一个长度为1的线性城市,消费者均匀分布在 0,1区间里,分布密度为1。 l 两个商店,分别位于城市的两端,商店1在x=0,商店 2在x=1,出售性能相同的产品。 l 每个商店提供单位产品的成本为c,消费者购买商品的 旅行成本为t l 住在x的消费者如果在商店1购买,要花费tx的旅行成 本;如果在商店2购买,要花费

14、t(1-x)的旅行成本 l 假定消费者具有单位需求,即或者消费1个单位,或者 消费0个单位。l 考虑两商店之间价格竞争的纳什均衡,即行动变 量为价格pi,( i=1,2)。需求函数Di(p1,p2),( i=1,2)。 l 如果住在x的消费者在两个商店之间是无差异的, 即满足: l p1 + tx = p2 + t(1-x)l 那么,住在比x距离近的消费者都会在商店1购买 ,住在比x距离远的消费者都会在商店2购买。则 需求函数分别为: l l 利润函数分别为:l 求使得利润最大的价格水平,分别令以下一阶导 数为零:l 解得: l p1* = p2* = c + t l 每个企业的均衡利润为:

15、l u1 = u2 = t/2l 当旅行成本为零时,不同商店的产品之间具有完 全的替代性,没有任何一个商店可以把价格定得 高于成本,我们就得到伯川德均衡结果: l p1* = p2* =c l u1 = u2 = 0l 更为一般地,我们可以讨论商店位于任何位置的 情况。假定商店1位于a(a=0),商店2位于1-b (b=0),不失一般性,假定1-a-b=0,即商店 1位于商店2的左边。如果旅行成本是旅行距离的 二次式,即旅行成本为td2,d为消费者到商店的 距离l 需求函数分别为:l 纳什均衡为:l 当a=b=0时,商店1位于0,商店2位于1:l 当a=1-b时,两个商店位于同一位置:二、公共

16、资源问题l 在经济学中,所谓公共资源是指具有:(1)没有 哪个人、企业或组织拥有所有权;(2)大家都可 以自由利用。具有这样两个特征的自然资源或人 类生产的供大众免费使用的设施或财货。 l 在人们完全从自利动机出发自由利用公共资源时 ,公共资源倾向于被过度利用、低效率使用和浪 费,并且过度使用会达到任何利用它们的人都无 法得到实际好处的程度。 l 设某村庄有n个农户,该村有一片大家可以自由放 牧羊群的公共草地。由于这片草地的面积有限, 因此只能让不超过某一数量的羊吃饱,如果在这 片草地上放牧羊群的实际数量超过这个限度,则 每只羊都无法吃饱,从而每只羊的产出(毛、皮 、肉的总价值)就会减少,甚至只能勉强存活或 饿死。 l 假设这些农户在夏天才到公共草地上放牧,而每年春天就 要决定养羊的数量,则可看作各农户在决定自己的养羊数 量的时候不知道其他农户养羊的数量,即各农户决定养羊 数量的决策时同时做出的。 l 假设所有农户都清楚这片公共草地最多只能养多少只

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号