第十章博弈论与竞争策略.ppt

资源描述

《第十章博弈论与竞争策略.ppt》由会员分享，可在线阅读，更多相关《第十章博弈论与竞争策略.ppt（42页珍藏版）》请在金锄头文库上搜索。

1、第十章博弈论与竞争策略,2005年11月,微观经济学,博弈论的发展脉络与基本思想,具有博弈性质问题的研究可以追溯到19世纪甚至更早。例如，2000多年前中国孙膑利用博弈论方法帮助田忌赛马取胜；1838年古诺(Cournot)简单双寡头垄断博弈；1883年伯特兰特和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断等等都属于早期博弈论的萌芽。 1944年冯诺依曼与奥斯卡摩根斯特恩(Oskar Morgenstern)，合著的巨作博弈论与经济行为一书中提出的标准型、扩展型和合作型博弈模型解的概念和分析方法，奠定了这门学科的理论基础。合作型博弈在20世纪50年代达到了巅峰期。然而，由于它过于抽象

2、，使应用范围受到很大限制，只是少数数学家的专利，影响力很有限。正是在这个时候，非合作博弈“纳什均衡”应运而生了，它标志着博弈论的新时代的开始！,2005年11月,微观经济学,博弈论的发展脉络与基本思想,1948年纳什到普林斯顿大学读数学系的博士。那一年他还不到20岁。当时普林斯顿可谓人杰地灵，大师如云。爱因斯坦、冯诺依曼、阿尔伯特塔克、哈罗德库恩、诺尔曼斯蒂恩罗德等全都在这里。 1950年他才把自己的研究成果写成题为“非合作博弈”的长篇博士论文，1950年11月刊登在美国全国科学院每月公报上，彻底改变了人们对竞争和市场的看法。他将冯诺依曼的“最小最大原理”(minimax solution)

3、推到非合作博弈领域，找到了普遍化的方法和均衡点，证明了非合作博弈及其均衡解，即著名的纳什均衡。从而揭示了博弈均衡与经济均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石，后来的博弈论研究基本上都沿着这条主线展开的。,2005年11月,微观经济学,博弈论的发展脉络与基本思想,话说有一天，一位富翁在家中被杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人，斯卡尔菲丝和那库尔斯，并从他们的住处搜出被害人家中丢失的财物。但是，他们矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离，分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说，

4、“由于你们的偷盗罪已有确凿的证据，所以可以判你们一年刑期。但是，我可以和你做个交易。如果你单独坦白杀人的罪行，我只判你三个月的监禁，但你的同伙要被判十年刑。如果你拒不坦白，而被同伙检举，那么你就将被判十年刑，他只判三个月的监禁。但是，如果你们两人都坦白交代，那么，你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢？(图克（Tucker）1950年),2005年11月,微观经济学,他们面临着两难的选择坦白或抵赖。显然最好的策略是双方都抵赖，结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以，按照亚当斯密的理论，每一个人都是从利己的目的出发，他们选择坦白交代是最佳策略。因为坦白交

5、代可以期望得到很短的监禁3个月，但前提是同伙抵赖，显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此，坦白还有更多的好处。如果对方坦白了而自己抵赖了，那自己就得坐10年牢。因此，在这种情况下还是应该选择坦白交代，即使两人同时坦白，至多也只判5年，总比被判10年好吧。所以，两人合理的选择是坦白，原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”，也叫非合作均衡。,博弈论的发展脉络与基本思想,2005年11月,微观经济学,博弈论的发展脉络与基本思想,“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理

6、性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。 “纳什均衡”首先对亚当斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在国富论中的名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。,2005年11月,微观经济学,博弈

7、论的发展脉络与基本思想,年的诺贝尔经济学奖最后得主既出乎意料，又在意料之中。拥有以色列和美国双重国籍的罗伯特奥曼因为其专业的博弈论研究，美国人托马斯谢林因其对合作博弈理论的实际运用和分析，双双获得诺奖。而在年前，纳什等三位经济学家已经因博弈论而获得诺贝尔经济学奖。 “为什么有些国家、团体和个人可以和平地解决冲突，而另一些国家、团体和个人却不断地被冲突困扰呢？感谢奥曼和谢林的研究，为这一自古以来困扰我们的问题带来启迪。”诺贝尔经济学奖评委会主席如此解释了罗伯特奥曼和托马斯谢林获奖的理由。,2005年11月,微观经济学,博弈论的发展脉络与基本思想,奥曼的主要贡献在于合作方面，创造了重复博弈理论。他

8、的理论着重解释这样一些问题：为何参与者太多合作就变得困难；参与者何时会偶尔互动一下；何时这种互动会瓦解等。重复博弈论解释了经济冲突如价格战、贸易战的原因，也说明了为何一些政府比另一些政府能更好地管理公共资源。重复博弈理论已被用于从行业协会到有组织犯罪、从劳资谈判到国际贸易条约等领域。奥曼利用数学分析的方法创立了对社会学中讨论的抽象概念和假设进行具体化分析的模式，重复博弈理论成为今天社会科学中长期性合作分析的基础理论。,2005年11月,微观经济学,博弈论的发展脉络与基本思想,谢林曾在冷战阴影下将博弈理论用在对全球安全问题和裁军问题的分析上。他的贡献主要在于如何处理冲突。在核竞赛盛行的20

9、世纪50年代后期，谢林出版了冲突战略一书，奠定了博弈论作为社会科学的方法论的地位。他指出，冲突中的一方可以通过自陷绝境从而加强自己的地位；拥有报复手段比抵抗手段更重要；难以预料的报复手段比已知的报复手段更有效。这些论断在一些地区冲突的解决和避免战争的斡旋中被证明是正确的。在美苏两极对抗的年代，美国提出的“相互确保摧毁”战略就颇受其影响。谢林的理论推进了博弈论在社会科学领域的发展，并被应用于从企业竞争到政治谈判的广泛领域。,2005年11月,微观经济学,博弈论的发展脉络与基本思想,年前博弈论大师纳什获得了诺奖，其提出的“纳什均衡”向西方市场经济“看不见的手”的原理发起了挑战年后，罗伯特奥曼和

10、托马斯谢林把纳什的非合作均衡上升为合作均衡。按奥曼的理论，这两名囚犯在无数次面对同一情况，并且每一次吃苦头之后，最终会意识到，最好的选择就是两人都保持沉默。两者的差别在于：合作博弈强调团体理性，应用于宏观经济领域，如政府在公共经济政策的选择，还应用于非经济领域，而达到政治、军事等领域；而非合作博弈强调个人理性，研究人们在利益相互影响的情况下如何选择策略，以获得自身利益最大化，主要应用于微观经济领域，如企业竞争战略和价格战略等。,2005年11月,微观经济学,第一节博弈论的基本要素与分类,博弈就是一些个人、队组或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自允许

11、选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。博弈论Game Theory主要研究各个相关行为主体的决策行为相互影响相互作用的假设前提下,理性的行为主体如何进行决策以及这种决策的均衡问题的。,2005年11月,微观经济学,第一节博弈论的基本要素与分类,-5， -5,0， -8,-8， 0,-1， -1,坦白,不坦白,坦白,不坦白,两个罪犯的得益矩阵,囚徒 2,囚徒 1,囚徒1：坦白囚徒2：坦白,一、囚徒困境及博弈论的基本要素,2005年11月,微观经济学,博弈包含的四个基本要素 1、参加者(Player)博弈方，一个或多个；个人、企业或国家。 2、策略(Strate

12、gies):指博弈中的任一参加者针对其他参加者的可能行为所采取的行为原则和应对办法。 3、得益(Payoffs)：指博弈参与者所获得的收益或效益，取决于博弈各方的行为。 4、均衡：指博弈的所有参与者从自我利益最大化出发选择的策略所组成的策略集。,第一节博弈论的基本要素与分类,2005年11月,微观经济学,二、博弈的基本分类 1、合作博弈与非合作博弈合作博弈：如果博弈方能达成某种有约束力的契约或协议（包括默契）以使他们选择共同的或联合的策略。寡头垄断厂商：卡特尔。反之，属于非合作博弈。伯特兰德模型。 2、单人博弈、两人博弈、多人博弈单人博弈实质是个体最优化问题，单人博弈是退化的博弈；最

13、常见的是两人博弈，囚徒困境、猜硬币、齐威王田忌赛马等。,第一节博弈论的基本要素与分类,2005年11月,微观经济学,第一节博弈论的基本要素与分类,3、有限策略博弈和无限策略博弈有限策略博弈：每个博弈方的策略数都是有限的无限策略博弈：至少有某些博弈方的策略有无限多个 4、零和博弈、常和博弈、变和博弈零和博弈：在博弈中，一方的得益就是另一方的损失，所有博弈方的得益总和为零。赌博。常和博弈：博弈方的得益总和为常数。分配固定数额的奖金、利润等。变和博弈：不同的策略组合（结果）下各博弈方的得益之和一般是不相同的。合作利益存在。囚徒困境。,2005年11月,微观经济学,5、静态博弈、动态博弈

14、、重复博弈静态博弈：所有博弈方同时或可看作同时选择策略的博弈。田忌赛马、投标动态博弈：各博弈方的选择和行动又先后次序且后选择、后行动的博弈方在自己选择、行动之前可以看到其他博弈方的选择和行动。弈棋、市场进入。重复博弈：同一个博弈反复进行所构成的博弈，提供了实现更有效略博弈结果的新可能。长期客户、信誉。 6、完全信息博弈和不完全信息博弈完全信息博弈：各博弈方都完全了解所有博弈方各种情况下的得益不完全信息博弈：至少部分博弈方不完全了解其他博弈方得益的情况的博弈，也称为“不对称信息博弈”。,第一节博弈论的基本要素与分类,2005年11月,微观经济学,第一节博弈论的基本要素与分类,信息特

15、征,完全信息,不完全信息,静态,动态,行动先后顺序,2005年11月,微观经济学,第二节完全信息静态博弈,完全信息静态博弈即各博弈方同时决策，且所有博弈方对博弈中的各种情况下的策略及其得益都完全了解的博弈。囚徒的困境、齐威王田忌赛马、猜硬币、石头剪子布决策都属于这种博弈。,2005年11月,微观经济学,一、上策与纳什均衡上策：指对于某博弈方来说，不管其它博弈方选择什么策略，他所采取的能给他带来最大得益的策略。囚徒的困境中的“坦白” 。,第二节完全信息静态博弈,2005年11月,微观经济学,第二节完全信息静态博弈,上策均衡：一个博弈的某个策略组合中的所有策略都是各个博弈方各自的上策，必

16、然是该博弈比较稳定的结果。上策均衡不是普遍存在的。,厂商B有一个上策，但厂商A没有，取决于B的决策。,2005年11月,微观经济学,纳什均衡：在给定竞争对手的选择行为后，博弈方选择了它所能选择的最好策略（或采取了它所能采取的最好的行动）。上策均衡肯定是纳什均衡，但纳什均衡不一定是上策均衡。,第二节完全信息静态博弈,2005年11月,微观经济学,第二节完全信息静态博弈,二、极大化极小策略所能选择的各种最小得益中求取得益的最大化。极大化极小策略有时也可能是纳什均衡。囚徒困境。,2005年11月,微观经济学,第三节完全信息动态博弈,一、子博弈精炼纳什均衡纳什均衡在动态博弈可能缺乏稳定性，也就是说，在完全信息静态博弈中稳定的纳什均衡，在动态博弈中可能是不稳定的，不能作为预测的基础。根源：纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定，不能解决动态博弈的相机选择引起的可信性问题。,2005年11月,微观经济学,第三节完全信息动态博弈,将纳什均衡中包含的不可置信的威胁策略剔除出去的均衡叫子博弈精炼纳什均衡。泽尔腾。自由恋爱。子博弈纳什均衡是在剔除了不可置

展开阅读全文

第十章 博弈论与竞争策略.ppt

第十章博弈论与竞争策略.ppt