浅谈生活中的博弈论.doc

资源描述

《浅谈生活中的博弈论.doc》由会员分享，可在线阅读，更多相关《浅谈生活中的博弈论.doc（21页珍藏版）》请在金锄头文库上搜索。

1、浅谈生活中的博弈论矮化砧嫁接的苹果树树冠体积小于乔化砧嫁接的苹果树树冠体积，矮化砧苹果树单株产量低于乔化砧苹果树，所以，栽植矮化苹果树必须根据不同的矮化砧木和不同类型的短枝型品种适当加大栽培密度目录一博弈论的简介2二博弈论的历史3三博弈论的基本概念4四博弈论的基本类型7五经典的博弈论81 囚徒困境博弈82 智猪博弈113 博弈价格战154 二妓争子17六博弈论的重要性20一、博弈论的简介博弈论，亦名“对策论”（Game Theory）、“赛局理论”，既属于现代数学的一个分支，也是运筹学的一个重要学科。博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算

2、机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。博弈论是博弈双方或者多方在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。博弈论思想古已有之，中国古代的孙子兵法就不仅是一部军事著作，而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上，没有向理论化发展。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略，使得其行为能够为个体带来最优的效益。

3、我们研究的博弈论，是建立在博弈双方或者多方都属于理性人的基础上，通过对自己以及博弈对手状况的了解、博弈环境的要求及变化等诸多因素，博弈者做出对自己最有利最保险的决策和行动，从而使得自己能达到获利或者获胜的目的。二、博弈论的历史近代对于博弈论的研究，开始于策墨洛（Zermelo），波雷尔（Borel）及冯诺伊曼（von Neumann）。 1928年，冯诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯诺依曼和摩根斯坦共著的划时代巨著博弈论与经济行为将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。 19501951年，约翰福

4、布斯纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文n人博弈的均衡点（1950），非合作博弈（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。从1994年诺贝尔经济学奖授予3位博弈论专家开始，共有5届的诺贝尔经济学奖与博弈论的研究有关，分别为：1994年，授予美国伯克利加利福尼亚大学的约翰海萨尼（J.Narsanyi）、普林斯顿大学约翰纳什（J.Nash）和德国波恩大学的赖因哈德泽尔滕（Reinhard Selten）。

5、1996年，授予英国剑桥大学的詹姆斯莫里斯（James A. Mirrlees）与美国哥伦比亚大学的威廉维克瑞（William Vickrey）。2001年，授予美国加州大学伯克莱分校的乔治阿克尔洛夫（George A. Akerlof ）生于1940年、美国斯坦福大学的迈克尔斯宾塞（A. Michael Spence ）和美国纽约哥伦比亚大学的约瑟夫斯蒂格利茨（Joseph E. Stiglitz）。2005年，授予美国马里兰大学的托马斯克罗姆比谢林(Thomas Crombie Schelling)和耶路撒冷希伯来大学的罗伯特约翰奥曼(Robert John Aumann）。2007年，

6、授予美国明尼苏达大学的里奥尼德赫维茨（Leonid Hurwicz）、美国普林斯顿大学的埃里克马斯金(Eric S. Maskin）以及美国芝加哥大学的罗杰迈尔森(Roger B. Myerson）。 2012年，授予美国经济学家埃尔文罗斯（Alvin E. Roth）与罗伊德沙普利因（Lloyd S. Shapley）。三博弈论的基本概念（1）决策人：在博弈中率先作出决策的一方，这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。（2）对抗者：在博弈二人对局中行动滞后的那个人，与决策人要作出基本反面的决定，并且他的动作是滞后的、默认的、被动的，但最终占优。他的策略可能依

7、赖于决策人劣势的策略选择，占去空间特性，因此对抗是唯一占优的方式，实为领导人的阶段性终结行为。（3）局中人（players）：在一场竞赛或博弈中，每一个有决策权的参与者成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”，而多于两个局中人的博弈称为 “多人博弈”。（4）策略（strategies）：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。（5）得失（p

8、ayoffs）：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。（6）次序（orders）：各博弈方的决策有先后之分，且一个博弈不同，博弈就不同。（7）博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。所谓纳什均衡，它是一稳定的博弈结果。

9、纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。这样，“均衡偶”的明确定义为：一对策略a*(属于策略集A)和策略b*（属

10、于策略集B）称之为均衡偶，对任一策略a(属于策略集A)和策略b（属于策略集B），总有：偶对（a, b*）偶对(a*,b*)偶对（a*，b）。对于非零和博弈也有如下定义：一对策略a*（属于策略集A）和策略b*（属于策略集B）称为非零和博弈的均衡偶，对任一策略a(属于策略集A）和策略b（属于策略集B），总有：对局中人A的偶对（a, b*）偶对(a*,b*);对局中人B的偶对（a*，b）偶对(a*,b*)。有了上述定义，就立即得到纳什定理：任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。纳什定理的严格证明要用到不动点理论，不动点理论是经济均衡研究的主要工具。通俗地

11、说，寻找均衡点的存在性等价于找到博弈的不动点。纳什均衡点概念提供了一种非常重要的分析手段，使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。但纳什均衡点定义只局限于任何局中人不想单方面变换策略，而忽视了其他局中人改变策略的可能性，因此，在很多情况下，纳什均衡点的结论缺乏说服力，研究者们形象地称之为“天真可爱的纳什均衡点”。塞尔顿（RSelten)在多个均衡中剔除一些按照一定规则不合理的均衡点，从而形成了两个均衡的精炼概念：子博弈完全均衡和颤抖的手完美均衡。四、博弈的基本类型 (1)合作博弈研究人们达成合作时如何分配合作得到的收益，即收益分配问题。 (2)非合作博弈研究人们在利益相互影

12、响的局势中如何选决策使自己的收益最大，即策略选择问题。 (3)完全信息不完全信息博弈：参与者对所有参与者的策略空间及策略组合下的支付有充了解称为完全信息；反之，则称为不完全信息。 (4)静态博弈和动态博弈静态博弈：指参与者同时采取行动，或者尽管有先后顺序，但后行动者不知道先行动者的策略。动态博弈：指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。 5、经典的博弈论 1.“囚徒困境”博弈 “囚徒困境”是1950年美国兰德公司提出的博弈论模型。两个共谋犯罪的人被关入监狱，不能互相沟通情况。如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢1年；若一人揭发，而另一人沉默，则揭发者

13、因为立功而立即获释，沉默者因不合作而入狱10年；若互相揭发，则因证据确实，二者都判刑8年。由于囚徒无法信任对方，因此倾向于互相揭发，而不是同守沉默。用表格表示如下：甲沉默甲背叛乙沉默二人同时服刑一年乙服刑10年，甲即时获释乙背叛甲服刑10年，乙即时获释二人同时服刑8年囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至

14、最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默时，背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论-选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑8年。囚徒困境博弈的一个假设是博弈方都是完全理性。完全理性来源于经济学中的理性人假设，即博弈方都以个

15、体利益最大化为目标，且有准确的判断选择能力，也不会“犯错误”。以个体利益最大为目标被称为“个体理性”，有完美的分析判断能力和不会犯选择行为的错误称为“完全理性”。完全理性包括追求最大利益的理性意识、分析推理能力、识别判断能力、记忆能力和准确行为能力等多方面的完美性要求，其中任何一方面不完美就不属于完全理性。可以看出，这是一个要求非常严格的假设。即便如此，完全理性仍在一个方面没有做出规定（至少是没有意识到或明确地规定出来），就是思维方式，也即是博弈方是以将问题分解的方式来思考问题呢，还是以系统的整体的方式来思考问题的。现在我们以系统的整体的思维方式来重新分析囚徒困境博弈。警察的目的是获得证据，以使囚徒获得应有的惩罚，囚徒的目的是“获取”最少的惩罚。双方的这种矛盾使得囚徒有串通的倾向，为了离间两个囚徒，警察确立了模型中的规则。对每个囚徒来说，要想达到自身的目的，而不考虑整个模型设置的目的，很显然是不行的。囚徒该如何选择呢？答案是背叛。如果

展开阅读全文