博弈论与竞争策略ppt-26

上传人:wt****50 文档编号:50033280 上传时间:2018-08-06 格式:PPT 页数:26 大小:153KB
返回 下载 相关 举报
博弈论与竞争策略ppt-26_第1页
第1页 / 共26页
博弈论与竞争策略ppt-26_第2页
第2页 / 共26页
博弈论与竞争策略ppt-26_第3页
第3页 / 共26页
博弈论与竞争策略ppt-26_第4页
第4页 / 共26页
博弈论与竞争策略ppt-26_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《博弈论与竞争策略ppt-26》由会员分享,可在线阅读,更多相关《博弈论与竞争策略ppt-26(26页珍藏版)》请在金锄头文库上搜索。

1、博弈论与竞争策略 第一节 博弈论的基本概念 第二节 完全信息静态博弈 第三节 重复博弈和序列博弈在现实经济社会,完全垄断和完全竞争的市 场结构十分少见。厂商在市场中既有一定的 垄断势力,又面临很大的竞争压力。厂商之 间具有相关性和依存性。因此,可以用博弈 论的方法解释和说明厂商的竞争行为和策略 。 博弈论是70年代中期以来微观经济学发展的 一个重要方面。1994年的诺贝尔经济学奖被 授予博弈论专家:纳什(Nash)、泽尔腾( Selten)和海萨尼(Harsanyi),他们都对博 弈论在经济学中的应用作出了贡献。 70年代以来,博弈论已经发展成为现代经济学的 基础重要基础之一,改变了传统经济学

2、的结构, 这主要有两个方面的原因: 1传统经济学着重研究市场机制和价格制度, 分析完全竞争市场中的最优决策,不考虑决策者 之间的相互影响。但是,现实经济运行中市场是 不完全竞争的,行为主体之间的决策具有相互影 响。 2完全竞争市场是以完全信息为条件的,这在 现实经济运行中也难以保证。在信息不对称条件 下,考虑行为主体相互影响的非价格制度可以用 博弈论分析。 当然,应用博弈论解决竞争策略问题也是有条件 的。除了掌握博弈论方法外,关键是正确估计各 参与者的策略空间和收益函数。第一节 博弈论的基本概念 一博弈论及其特点 1博弈和博弈论 博弈是指具有不同利益和目标的多个行为主 体共同参加并相互影响的事

3、态发展过程中的 策略决策。 博弈论(Game Theory)也称对策论,它是 一种分析博弈过程和结果的数学方法,研究 具有理性的多个行为主体的决策和行动直接 相互作用和影响时,事态发展过程的决策和 均衡问题。广泛应用于政治、军事、经济、 外交和日常生活的许多领域。2特点: (1)参与者具有各自的目标: (2)参与者都是理性行为者; (3)参与者之间具有相关性; (4)事态发展的结果取决于全部参与者的共 同行为; (5)参与者要根据对其他参与者的判断决定 自己的行动,因而是对策。 可见,博弈论是与优化论不同的决策理论。优 化论是一种单人决策理论;博弈论所揭示的规 律是一种多人决策理论。二博弈论的

4、基本概念 在博弈论中,博弈的基本要素被概括为以下概念: (1)参与者Players (玩家): 即参加博弈过程的行为和决策主体 ,也是利益主体。在一个博弈中,最少要有两个参与者。 (2)策略Strategies (战略或策略行为):即参与者在某个博弈时 点,根据其掌握的有关博弈信息而选择的决策变量和行动计划, 一个参与者的全部可行策略称为他的策略空间。 (3)收益Payoff(支付、得益)和收益函数: 收益是指在既定策 略组合条件下参与者的得失情况。每个参与者的收益取决于全部 参与者所采取的策略,称为收益函数。 (4)结局 outcome(结果):指博弈的结果,指既定策略组合条件 下全部参与者

5、所得收益的集合。 (5)均衡 Equilibrium (均势):指达到稳定的策略组合或结局。 (6)博弈规则: 指参与者、策略、结局之间的联系。它是由博弈 的环境和参与者之间的相互影响决定的。例: 可口可乐与百事可乐(参与者)的价格决策: 双方都可以保持价格不变或者提高价格(策略) 博弈的目标和得失情况体现为利润的多少(收益) 利润的大小取决于双方的策略组合(收益函数) 博弈有四种策略组合,其结局是: (1)如果双方都不涨价,各得利润10单位; (2)如果可口可乐不涨价,百事可乐涨价,可口可乐利润100 ,百事可乐利润-30; (3)如果可口可乐涨价,百事可乐不涨价,可口可乐利润-20 ,百事

6、可乐利润30; (4)如果双方都涨价,可口可乐利润140,百事可乐利润35; 博弈的稳定状态有两个:都不涨价或者都涨价(均衡),均衡 称为博弈的解,它是由博弈规则(即参与者采取什么策略会取 得什么结局,市场的需求弹性、交叉价格弹性等)决定的。三博弈的表述方法 博弈一般用数学模型表达,分为标准和扩展模型两种。 1. 博弈的标准模型 包括三个要素:参与者、每个参与者可以选 择的策略以及收益函数。 在两个参与者的有限博弈中,标准模型可以用收益矩阵表示。 如上例的可乐价格博弈可以表示如下: 在收益矩阵中,包 含了标准博弈模型 的基本信息,表格 中各组数字表示不 同策略组合条件下 的结局。在每个结 局中

7、,第一个数字 代表参与者1 的收 益,第二个数字代 表参与者2的收益 。参与者2 百事可乐参与者2可口可乐不涨价涨价不涨价 涨价10,10 100,-30-20,30 140,35返回2. 博弈的扩展模型 包括五个要素:参与者、决策时点、策略空间、信息和收益函 数。在简单的博弈中,扩展模型可以用博弈树表示。如上例的 可乐价格博弈可表示如图下:不 涨 价涨价参与者1 可口可乐10,10100,-30-20,30140,35不涨价涨价参与者2 百事可乐不涨价涨价参与者2 百事可乐 博弈树一般用来 分析动态博弈。 在博弈过程中, 从某一个决策点 开始,参与者在 已有行动的基础 上开始选择,到 博弈结

8、束,称为 “子博弈”。子博 弈是相对的,从 事态发展的历史 来看,所有的博 弈都是子博弈。四博弈的分类 (1)合作博弈与非合作博弈 根据参与者之间能否通过谈判达成具有约束力的协议或合同来划分。 可以达成协议的为合作博弈cooperative game,合作博弈强调集 体理性和整体最优。如买卖双方讨价还价后成交。 不能达成协议的为非合作博弈non-cooperative game,非合作博 弈强调个体理性和局部最优。如寡头之间的竞争博弈,双方的 利益和目标有冲突,难以达成可以实施的协议,双方都有欺骗 和违约的冲动。博弈论在经济学中的应用主要在非合作博弈领 域。 (2)静态博弈与动态博弈 根据参与

9、者选择策略的关系划分。 参与者同时或独立选择策略的博弈是静态博弈。 参与者按照一定的次序选择策略,后选择者了解先选择者的行 动,这种博弈是动态博弈。 (3)完全信息博弈与不完全信息博弈 根据参与者对其他参与 者的特征、策略空间、收益函数等信息的了解程度划分。 全部相互了解即为完全信息博弈,否则是不完全信息博弈。第二节 完全信息静态博弈 一囚徒的困境与纳什均衡 1囚徒的困境:假设有两个嫌疑犯作案后被抓获,并在不 同的房间审讯。警察告诉他们,如果两人都坦白,各判刑8 年;如果两人都抵赖,各判刑1年;如果其中一人坦白而另 一人抵赖,坦白者释放,抵赖者判刑10年;这样,每个犯人 就有两种策略,即坦白和

10、抵赖。这个博弈的收益矩阵如下囚徒1坦白抵赖囚徒2坦白 抵赖-8,-8 0,-10-10,0 -1,-1 在这个博弈中,(坦白 ,坦白)是博弈的解, 即均衡结局。因为不管 对方怎样行动,两个囚 徒都会选择坦白。 囚徒的困境说明,个人 理性(最优)与集体理 性(最优)可能不一致 。如寡头之间的广告投 入、产量控制等。2纳什均衡 在这个博弈中,出现了两个纳什均衡,参与者不能判断对方会 采取什么策略,因而可能出现非均衡的结局(涨价,不涨价) 和(不涨价,涨价);或者对双方不利的均衡(不涨价,不涨 价)。因此,纳什均衡只说明均衡存在的可能,不能解释均衡 的结果。 纳什均衡是指由所有参与者的最优策略组成的

11、策略组合。在这 种情况下,没有人可以从改变策略中得到好处,因而形成了一 种均衡(僵局)。 一种制度或者协议要能够自动实行(即得到自觉遵守),必须 满足纳什均衡的条件。 可以通过画圈的方法求解纳什均衡。即设定一个参与者的策略 ,然后把另一个参与者将会选择的策略可以带来的收益圈起来 。如果收益矩阵中某个策略组合中的两个收益都被圈起来,则 这个策略组合就是纳什均衡。 例如,前述可乐定价博弈收益矩阵可以确定有(涨价,涨价) 和(不涨价,不涨价)两个纳什均衡。二支配性策略dominant strategy均衡 支配性策略均衡也称上策均衡或优势策略均衡。在博弈中,对 有些参与者来说,不管对手采取什么策略,

12、他的策略都保持不 变。这种不取决于对手选择的最优策略称为支配性策略(上策 或优势策略)。 当存在支配性策略时,可以首先确定支配性策略,然后确定对 手的选择,从而得出博弈的均衡解。例如,两个寡头厂商的广 告博弈收益矩阵如下:参与者1可口可 乐有广告无广告参与者2百事可乐有广告 无广告10,5 15,06, 8 20,6 在这个博弈中,百事可乐有一 个支配性策略,即不管可口可 乐是否有广告,他都会有广告 。在此基础上,可口可乐必然 也会有广告。博弈的结果就是 (有广告,有广告)。这种均 衡称为支配性策略均衡。它也 是纳什均衡,但纳什均衡不一 定是支配性策略。三合作的诱惑 在类似囚徒的困境这样的博弈

13、中,个体 理性往往导致集体的非理性。在有多个 纳什均衡的博弈中,参与者判断失误, 或者某个参与者非理性行为,都会导致 双方的严重损失。因此,存在着通过合 作(共谋、勾结和串通)改善博弈结果 的诱惑,这样可以是大家的收益都得到 改善。 例如,在上述广告博弈中,如果双方都 不做广告,比都做广告收益高。但这种 合作难以自动实现。1对社会无害的合作,往往通过某些规则实现 。 如香烟广告,交通规则,重复建设。 下图列出了斗鸡博弈的收益矩阵。设两辆汽车同时 到达一个十字路口,每个驾驶员都有开和等两种选 择,博弈结果如下:驾驶员1开等驾驶员2开 等-8,-8 4,00,4 0,0 在这个博弈中,( 开,等)

14、和(等, 开)是两个纳什均 衡,但在完全信息 静态博弈中,可能 由于判断失误导致 交通事故,或无谓 地延误时间。因此 通过交通规则引导 博弈。厂商1脆 甜厂商2脆 甜-5,-5 10,2020,10 -8,-8避免重复建设 例如两个厂商进行产品开发博弈的收益矩阵。两个 厂商同时开发一个市场(麦片),市场需要甜和脆 两种产品,每个厂商只能生产其中一种产品。从收 益矩阵可以看出,在理性行为条件下博弈的两个纳 什均衡是(脆,甜)和(甜,脆)。但由于推出甜 的厂商有较多利润,可能导致(甜,甜)的重复建 设结果。因此,应该通过发布信息和政策引导。国 外不允许厂商之间勾结分割市场,主要靠准确的市 场信息。

15、2对社会有害的合作,设法制止 在囚徒的困境博弈中,如果两个囚徒可以互相协商 ,并形成攻守同盟,则罪犯得到好处,对社会不利 。例如在寡头厂商的定价博弈中,勾结定高价对双 方都有好处,但对社会不利,因此受到反垄断法的 严密监控。 寡头厂商的价格博弈收益矩阵如下:厂商1高价低价厂商2高价 低价50,50 10,7070,10 30,30四最大最小策略 纳什均衡是建立在参与者理性行为基础上的,这就使参与者的 决策时面临可能出现某些非理性行为的风险。为了降低风险, 决策者可以采取最大最小策略以便降低风险,即在各种策略的 最小收益中,选择具有最大收益的策略。其代价是放弃最优策 略。 下图是一个产品开发博弈的收益矩阵。其中,按照理性行为会 有两种纳什均衡,(无新产品,有新产品)以及(有新产品, 无新产品)。但如果采取最大最小策略,两个企业都不推出新 产品。厂商1无新品有新品厂商2无新品 有新品 4,4 3,66,3

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 社会民生

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号