博弈论的基概念－金锄头文库

资源描述

《博弈论的基概念》由会员分享，可在线阅读，更多相关《博弈论的基概念（8页珍藏版）》请在金锄头文库上搜索。

1、博弈论的基本概念博弈论是研究两人或多人谋略和决策的理论。博弈论思想古已有之，我国古代的孙子兵法就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。1928年冯诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯诺意曼和摩根斯坦共著的划时代巨著博弈论与经济行为将二人博弈推广到 n 人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。纳什的开创性论文n人博弈的均衡点（1950），非合作博弈（195

2、1）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。参与者：参与者是指一个博弈中的决策主体，通常又称为参与人或局中人。参与人的目的是通过合理悬着自己的行动，以便取得最大化的收益。参与者可以是自然人，也可以是团体。信息：信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要，每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。策略：策略是参与者

3、如何对其他参与者的行动作出反应的行动规则，它规定参与者在什么时候选择什么行动。通常用 si 表示参与者 i 的一个特定策略，用Si表示参与者i的所有可选择的策略的集合（又成为而i的策略空间）。如果n个参与者没人选择一个策略，那么s= （si，s2，sn）称为一个策略组合。收益：收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用ui表示参与者i的收益，它是策略组合的函数。均衡：均衡是所有参与者的最优策略组合，记为s*。几个经典的博弈实例例一囚徒困境两个共同作案的犯罪嫌疑人被捕，并受到指控。除非至少一人认罪，否则警方无充分证据将他们按最论刑。警方把他们隔离审讯，并对他

4、们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度，因警方证据不足，两人将均被判为轻度犯罪入狱一个月；如果双方都坦白，根据案情两人将被判入狱六个月；如果一个招认而另一个拒不坦白，招认者因由主动认罪立功的表现将立即释放，而另一人将被判入狱九个月。囚坦白徒一沉默-6, -60, -9-9, 0-1, -1沉默坦白例二海滩占位甲、乙两个冷饮摊贩，他们在一个直线状的海滩上，以同样的价格，相同的质量向均匀散布在海滩上的众多游客销售冷饮。既然是做生意，目的总是多赚钱，甲乙两人有时在同一地点做同样的生意，竞争是难免的，这两个摊贩应该怎样安排自己的摊位，才能相安无事的做自己的生意？

5、（假定游客总是到据自己最近的摊位购买冷饮）。例三智猪争食猪圈里有一头打猪和一头小猪。里面有一个猪食槽，槽的对面装有控制开关。只要去拱开关，就会有一次 6 个单位的饲料流进槽里。如果它们都不去拱开关，那么它们都吃不到饲料；如果小猪去拱，那么等到它跑回来时，大猪已把饲料吃光了；如果大猪去拱，等它回来时可以吃到1 个单位的饲料；如果他们一起去拱，在一起跑回来，那么大猪可以抢到4 个单位的饲料，小猪也能吃到 2 个单位的饲料。假定每拱一次开关需要消耗 0.5 个单位的饲料能量。它们长期一起进食，上面所说的情况两只猪都知道。它们应该如何选择？小猪拱不拱大猪拱不拱3.5, 1.50.5,

6、 56, -0.50, 0完全信息静态博弈静态博弈：静态博弈指的是博弈的参与者同时选择各自的行动，即便是选择行动有先后的话，后行动者也不知道先行动者所采取的行动。博弈的标准表述(策略表述)含有三个要素(1)博弈参与者集合ie N；(2)每个参与者的策略空间Sj； (3)每个参与者的收益函数ui。定义：在一个有n个参与者的博弈中，参与者的策略空间S,S2,Sn,收益函数为片,幻,un,称G=S,S2,Sn;片,幻,uj为此博弈的一个标准表述。定义：如果对任一 si e Si,si丰 Sj*,不等式 UjG,.%, Sj*, si+1,.,Sn) ui(s1,_,si-1, Si ,si+

7、1,.,sn)对所有的策略组合(s1,.,si-1, si+1,.,sn)都成立，那么 si*称为参与者i的严格占优策略。定义：在博弈的标准表述中，如果对所有的参与者i eN, si*是i的严格占优策略，那么策略组合S*=(S*,Sn*)称为严格占优策略均衡。定义：在标准表述的博弈中，设Si和s是参与者i的两个可选策略，若Ui(Si，.,Si_i，Si,Si+i，.,Sn)VUi(S,.,Si-i，对所有的策略组合(Si，.%, si+i，.,sn)都成立，那么称Si是相对于Si的严格劣策略。定义：如果S*=(S1*,Sn*)是逐步剔除严格劣策略剩下的唯一策略组合，则该策略称为逐步剔除严格劣策

8、略均衡。参与者2左中右1，01，20，10，30，12，01左中参上1，01，2与下0，30，1者1左中参上1，01，2与下者中右3, 34, 11, 24, 00, 21, 11, 42, 32, 4面的这个博弈中既不存在严格占优策略均衡，也不存在逐步剔除严格劣策略均衡，对这样的博弈引入纳什均衡的概念。定义：在博弈 G二S,S2, .,Sn； U,U2,un,策略 s* = (si*，,si*,Si*,si+1 *，,sn*)满足条件：对每一个参与者i,都有对所有的si e SpUi(S*, .,Si 1 *, Si，Si + 1 *，,Sn*) Ui(S*, .,Si 1 *,Si*,s

9、i+1 *，,sn*)成立，则称s*为该博弈的一个纳什均衡。严格占优策略均衡、逐步剔除严格劣策略均衡与纳什均衡的关系：严格占优策略均衡是纳什均衡；逐步剔除严格劣策略均衡是纳什均衡；反之不然。完全信息动态博弈动态博弈：各参与者的行动有先后顺序,而且后行动者在自己行动之前能观测到先行动者的行动。定义：完全信息扩展式博弈形式是一个三元组F= (N,H,P)：其中N是参与者的集合。H是A (行动的集合)中元素组成的序列的集合并且满足：(1)空序列() eH ；(2)如果一个 h eH ,则 h|k eH , h|k 表示 h 的长度为k的子序列；(3)如果一个无穷序列的所有有穷子序列都属于H, 那么h也属于H。P： H/Z N,其中ZcH且h eZ当且仅当任给h eH , 若 h Ik =h 则 h =h。对于n个参与者有限战略的扩展式表述有一种直观的图形方法，就是博弈树。设G=（ui： Z R, F= （N,H,P）扩展式博弈形式，我们称 F,（ ui ） i N）为一个扩展式博弈。0，0）（2，1）

展开阅读全文