博弈论知识点总结完整版

资源描述

《博弈论知识点总结完整版》由会员分享，可在线阅读，更多相关《博弈论知识点总结完整版（6页珍藏版）》请在金锄头文库上搜索。

1、博弈论(一)：基本知识1.1 定义:博弈论，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。即，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间的均衡。1.2 基本要素：参与人、各参与人的策略集、各参与人的收益函数，是博弈最重要的基本要素。1.3 博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议(bindingagreement)。倘若不能，则称非合作博弈(Non-cooperativegame)。合作博弈强调的

2、是集体主义，团体理性，是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果有时有效率，有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益的最大化，最后达到力量均衡。博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。把两个角度结合就得到了4种博弈：a、完全信息静态博弈，纳什均衡，Nash(1950)b、完全信息动态博弈，子博弈精炼纳什均衡，泽尔腾(1965)c、不完全信息静态博弈，贝叶斯纳什均衡，海萨尼(1

3、967-1968)d、不完全信息动态博弈，精炼贝叶斯纳什均衡，泽尔腾(1975)Kreps,Wilson(1982)Fudenberg,Tirole(1991)1.4 课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈1.5 博弈模型的两种表示形式：策略式表述(Strategicform),扩展式表述(Extensiveform)1.6 占优均衡：a、占优策略：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。对于所有的s-i，si*称为参与人i的严格占

4、优战略，如果满足：ui(si*,s-i)ui(si,s-i)Vs-i,Vsizsi*b、占优均衡：一个博弈的某个策略组合中，如果对应的所有策略都是各参与人的占优策略，则称该策略组合为该博弈的一个占优均衡。1.7重复剔除严劣策略均衡：a、“严劣”和“弱劣”的含义：设s;和Sj是参与人i可选择的两个策略，若对其他参与人的任意策略组合s-i,均成立u(s,s)u（ss*）,对于任意的s.WS.，任意的iWNii-iii均成立。通俗定义：纳什均衡是一种策略组合，给定对手的策略，每个参与人选择自己的最优策略。纳什均衡是一种稳定的策略组合：当所有参与人的选择公开以后，每个人都满意自己作出了正确的选择；没有

5、人能得到更好的结果了。在博弈论中这种结果被称为纳什均衡（NE）。2.1 定理：Nash在1950年证明：任何有限博弈，都至少存在一个NEExistenceofNashEquilibrium。即在一个有n个参与人的策略式博弈G=S1,Sn;ul,un中，如果n是有限的，且Si是有限集（i=1,n）,则该博弈至少存在一个纳什均衡（在混合策略意义下）Wilson（1971）证明，几乎所有有限博弈，都存在有限奇数个NE，包括纯策略NE和混合策略NE。OddnessTheorem纳什均衡、占优均衡、重复剔除严劣策略均衡的关系定理a每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡，但反过来不一定成立；定

6、理b纳什均衡一定不能通过重复剔除严劣策略方法剔除。2.2 划线法先找出自己针对其他博弈方每种策略或策略组合（对多人博弈）的最佳对策，即自己的可选策略中与其他博弈方的策略或策略组合配合，给自己带来最大得益的策略（这种相对最佳策略总是存在的，不过不一定唯一），然后在此基础上，通过对其他博弈方策略选择的判断，包括对其他博弈方对自己策略判断的判断等，预测博弈的可能结果和确定自己的最优策略。这就是划线法。2.3 箭头法箭头法对于理解博弈关系很有好处,是寻找相对稳定性策略组合的分析方法。对博弈中的每个策略组合进行分析，考察在每个策略组合处各个参与方能否通过改变自己的策略而增加得益。如能，则从所分析的策略组

7、合对应的得益数组引一箭头到改变策略后策略组合对应的得益数组。最后综合对每个策略组合的分析情况，形成对博弈结果的判断。划线法和箭头法的结果是一致的，可以相互替代。（三）：混合策略（MixedStrategies）纳什均衡定义：混合策略的定义：在博弈G=N,Si,ui,iN中，假设参与人i的纯策略构成的策略集合为Si=si1,sik，若参与人i以概率分布pi=（pi1，,pik）在其k个可选策略中随机选择“策略”，称这样的选择方式为混合策略。这里，0WpijW1,对于j=1，,k都成立，且有,pi1+pik=1。纯策略可看成特殊的混合策略。上述定义是在有限博弈前提下进行的。混合策略意义下策略组合的

8、表述x1丘X1,xnWXn，其中Xi,i=1,n表示参与人i所有纯策略生成的概率空间，xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为（1/2,1/2）,（1/2,1/2）3.3VNM效用函数（VonNeumannandMorgenstern冯诺依曼和摩根斯坦）如果某个随机变量X以概率Pi取值xi，i=1,2，,n，而某人在确定地得到xi时的效用为u（xi）,那么，该随机变量给他的效用便是：U（X）=P1u（x1）+P2u（x2）+.+Pnu（xn）表示关于随机变量X的期望效用。因止此U（X）称为期望效用函数，又叫做冯诺依曼一一摩根斯坦效用函数（VNM函数）。3.4 基于混合策

9、略意义下的博弈策略式表述定义：基于（v-N-M效用的）策略式博弈由a、参与人集合b、每个参与人有一个（纯）策略集合c、对于每一个参与人来说，由所有参与人纯策略组合构成的风险结果空间，存在一个v-N-M效用3.5 混合策略意义下的纳什均衡定义：对于博弈G=N,Si,ui,iWN，基于v-N-M效用的混合策略组合a*是一个纳什均衡，若对于每一个i,以及i的任意一个混合策略ai,a*对应的期望支付至少和(ai,a*-i)的期望支付一样大换句话说，称混合策略组合a*是一个纳什均衡，如果没有一个参与人通过偏离策略a*i实现支付的增加3.6 一个定理对于N-人静态博弈问题，设混合策略纳什均衡对应的策略组合

10、为(Xi,X-i)。对于任意的i,若最优混合策略为Xi=xl,：xl,00(不失一般性，假设前1个分量严格大于0),记分量xk(k=1,：1)对应的纯策略sk,则对于参与人i而言，sk与其他参与人的最优混合策略组合X-i形成的局势的收益值,等于纳什均衡混合策略组合(Xi,X-i)的收益值。即ui(sk,X-i)=ui(Xi,X-i)成立，k=1,-,13.7 方法：a、求解混合策略均衡可以用期望收益等值法b、2X2双矩阵博弈的图解法:反应函数的三个交点即是纳什均衡(四)：多重纳什均衡解及其分析4.1帕雷托占优均衡帕雷托占优均衡的含义是：在多个纳什均衡中，若存在一个纳什均衡，其支付结果针对每个参

11、与人而言都严格优于其它纳什均衡，则该纳什均衡是帕雷托占优纳什均衡。4.2风险占优均衡(risk-dominantequi1ibrium)参与人对风险占优均衡的选择倾向，有一种强化的机制。当部分或所有参与人选择风险占优均衡的可能性增强的时候，任一参与人选择帕雷托占优均衡策略的期望支付会进一步减小，而这又使得帕雷托占优均衡策略的支付更小，从而形成一种选择风险占优均衡策略的正反馈机制，并使其出现的概率越来越大。当参与人数目增加时，选择合作的风险将会更大，可借助该点考虑招标机制如何减少投标方勾结问题。上述问题是我们知道建立诚信机制社会的重要意义。上述问题引出一个博弈相关分支为协调博弈(coordina

12、tiongame)4.3 聚点均衡由实际问题抽象出来的博弈模型中，更多的一类问题是：多个纳什均衡间不存在帕雷托占优关系或明显的风险占优关系，如夫妻爱好问题的两个纯策略均衡。这时如何预测哪一个纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例，在实际中往往二人很默契地知道如何进行博弈，双方往往知道怎么进行选择策略，且能够相互了解(这里面排除了互相协商后达成的一致)实际博弈中参与人往往会利用博弈模型以外的信息，实现对特定博弈均衡一致关注的“聚点”这些信息如：参与人共同的文化背景或规范，共同的知识，具有特定意义事物的特征，某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均衡选择中的某些规

13、律性，但因为涉及因素太多，对于一般博弈模型很难总结普遍规律，只能具体问题具体分析聚点：人们通常会协调彼此的行为。(你弱他就强)；先例产生的影响远大于逻辑或者法律效力；人们总是乐于安守现状或接受自然形成的界线(三八线)4.4 相关均衡(correlatedequilibrium)实际上，在现实中遇到选择困难时，特别是在长期中反复遇到相似选择难题时，常会通过收集更多信息，形成特定的机制和规则，为某种形式的制度安排等主动寻找思路。相关均衡就是这样的一种均衡选择机制。对于实际中比较复杂的博弈问题，参与人是否有能力设计这种机制，并且有足够能力理解、信任这种机制，是有一定疑问的。相关均衡作为社会经济制度创

14、新的一种解释也许更有意义。防共谋均衡(coalition-proofequi1ibrium)定义：如果一个博弈的某个策略组合满足a、没有任何单个参与人的“串通”会改变博弈的结果，即单独改变策略无利可图(该策略组合是纳什均衡)。b、给定选择偏离的参与人有再次偏离的自由时，没有任何两个参与人通过“串通”改变博弈的结果。c、依此类推，直到所有参与人都参加的串通也不会改变博弈的结果。满足上述要求的均衡策略组合称为“防共谋均衡”在有多个参与人的博弈中，若部分参与人通过某种形式的默契或串通形成小团体，可能得到比不串通个大的支付。这就是多人博弈的共谋问题。防共谋均衡是指这样的一个纳什均衡，在该均衡局势下，少数参与人集合不能通过均衡策略的偏离，实现更好的局部利益。防共谋均衡是两个以上参与人参加的博弈中，参与人在帕雷托占优均衡中进行合作思想的扩展。(五)：动态博弈5.1特点一类博弈行为通常需要参与人多步决策才能完成，具有明显的阶段性。博弈的结局、各参与人的收益由多阶段决策结果确定。各参与人的决策有一定的顺序。由于动态博弈各参与人进行决策具有明显的阶段性、行动次序性，通常用扩展式(extensiveform)表述法描述这些信息。博弈的扩展式表示口参与人集合：i=l,N,。用N表示虚拟参与人“自然”；自然的含义是某些外生的客观概率分布事件口参与人的行动顺序(theor

展开阅读全文