博弈论与信息经济学-1.完全信息静态博弈讲义

资源描述

《博弈论与信息经济学-1.完全信息静态博弈讲义》由会员分享，可在线阅读，更多相关《博弈论与信息经济学-1.完全信息静态博弈讲义（79页珍藏版）》请在金锄头文库上搜索。

1、博弈论与信息经济学,第一章完全信息静态博弈,1838年库诺特（Cournot）寡头竞争模型（数量战）1883年伯川德（Bertrand）寡头竞争模型（价格战）1944年冯诺依曼和摩根斯坦发表博弈论和经济行为1950年纳什（Nash）提出了纳什均衡的概念。1965年泽尔腾（Selten）提出了子博弈精炼纳什均衡的概念19671968年海萨尼（Harsanyi）提出了贝叶斯纳什均衡的概念,博弈论概述：发展历程,19751991年泽尔腾（1975）、Kreps和Wilson（1982）、Fudenberg和Tirole（1991）提出了精炼贝叶斯纳什均衡的概念. 1994年纳什、海萨尼和泽尔腾获诺

2、贝尔经济学奖。,博弈论概述：发展历程,1996年维克里，米尔利斯获诺贝尔经济学奖。,2001年阿克尔洛夫、斯彭斯和斯蒂格利茨获诺贝尔经济学奖。,2005年奥曼和谢林诺贝尔经济学奖,博弈的分类,分类是一种深化认识的方法。博弈可以根据不同的标志从不同的角度进行多种分类。通过分类我们将对博弈有进一步的了解，同时对博弈理论的结构体系有初步的认识,. 按参与人的多少分：二人博弈和多人博弈,. 按策略空间是否有限分：有限策略博弈和无限策略博弈,. 按各策略组合下参与人支付之和情况分：零和博弈、常和博弈和变和博弈,. 按参与人行动的顺序分：静态博弈和动态博弈,. 按信息是否完全分：完全信息博弈和不完全信息博

3、弈,. 按参与者是否能达成具有约束力的协议分：非合作博弈与合作博弈,博弈理论体系的结构框架按下面博弈类型安排：静态动态完全信息完全信息完全信息静态博弈动态博弈不完全信息不完全信息不完全信息静态博弈动态博弈,博弈论的基本概念,1、囚徒困境囚徒2坦白抵赖囚坦白徒1 抵赖,1、参与人(局中人)Players:一个博弈中的决策主体，他们各自的目的是通过选择行动（策略）以最大化自己的目标函数（效用水平/支付函数）。他们可以是自然人或团体或法人，如企业、国家、地区、社团、欧盟、北约等。虚拟参与人（pseudo-player）:指“自然” （nature）、“上帝” God，也即决定

4、外生的随机变量的概率分布的机制。“某事在人、成事在天” 的“天”；如出远门去旅游，可能很开心，也可能很尴尬（生病住医院），两者概率分布90%、 10%或98%与2%或其他，由上帝决定。,在以后的讨论中，我们记参与人为i,参与人集合记为，即=1,2, ,i , ,n ,即该博弈中共有n个参与人；为了讨论的方便，把某个参与人i之外的其他参与人称为的i对手记为- i ； N代表自然。对参与人的决策来说，最重要的是必须有可供选择的行动集（策略集）和一个很好定义的支付函数。,理性（rational)的两种定义 1. 如果一个决策者在追逐其目标时能前后一致地做决策，就称他是理性的。 2. 广义而言指

5、的是一种行为方式，就是在给定的约束条件下追求效用最大化。具体地讲，理性大致有以下三项内容：（1）存在一组可供选择的备选或替代方案；（2）每一种方案均对应着某种特定的预期净收益或满足程度或目标实现程度；（3）人们总是选择那个能够带来最大预期净收益的方案。,讨论：人真的是理性的吗？,2. 行动（action or moves）行动是参与人在博弈的某个时点的决策变量。一般地，我们用ai表示第i个参与人的一个特定行动，Ai=ai表示可供i选择的所有行动的集合。在n人博弈中，n个参与人的行动的有序集a=（a1,.,ai,.an）称为行动组合，其中的第i个元素表示第i个参与人的行动。,行动的顺序

6、（the order of play）博弈中参与人实施决策活动的顺序。同时或有先有后。其他因素不变，但顺序不同，参与人的最优选择就不同，博弈的结果也不同。事实上，不同的顺序安排意味着不同的博弈。静态博弈和动态博弈。,3. 信息（information）参与人有关该博弈的知识，如关于N的选择、其他参与人的策略集、支付函数、行动时间等。信息集（information set）主要出现在动态博弈中，可理解为参与人在特定时刻上对有关变量的值的知识；一个参与人无法准确知道的变量的全体属于一个信息集。买古董。,完美信息（perfect information）指一个参与人对其他参与人（包括N）的

7、行动选择有准确了解的情况，即一个信息集只包含一个值。动态博弈的概念。完全信息（complete information）：指N不首先行动或N的初始行动被所有的参与人准确观察到的情况，即没有事前的不确定性。完全信息意味着各个参与人的支付函数是共同知识。显然，不完全（incomplete）信息意味着不完美（imperfect）信息。,共同知识（common knowledge）是与信息有关的一个重要概念。共同知识指“所有参与人知道，所有参与人知道所有参与人知道，所有参与人知道所有参与人知道所有参与人知道”。在博弈论中，一般假定参与人的行动空间Ai和行动顺序是共同知识。,一个关于共同知识的小

8、游戏,A还是B？两个人的推理过程：我看到你身上的A，如果我身上是B的话。因为我们俩至少有一个人身上是A，因此你因此判断自己身上的是A。但是由于你没有说，因此我可以断定自己身上是A。,脏脸博弈,题目：三个学生的脸都是脏的，但是他们各自都看不到自己的脸。老师对他们说，你们中至少有一个人的脸是脏的。三个学生对视一番后无人举手，随即又都举手表明自己的脸是脏的。请问为什么？,脏脸博弈的推理过程,三个人分别称为1号，2号，3号 1号看到2号和3号的脸是脏的，他就做了以下推理：首先1号假设自己的脸是干净的，那么2号将会看到一张干净的脸和一张脏脸。因此（1号知道）2号会想：“如果我（2号）的脸是干净的，

9、那么3号将会看到两张干净的脸，那么他就知道自己的脸是脏的，因此他就会举手说自己的脸是脏的。但他并没有举手，这就表明我（2号）的脸是脏的。”因此2号就会举手说自己的脸是脏的。但事实上2号也没有举手，这就表明了1号最初的假设（自己的脸是干净的）是错误的。因此1号可以断定自己的脸是脏的。同理每个人都会做这样的推理，因此在观察到没有人举手的情况下，他们都会举手表明自己的脸是脏的。,共同知识,以上的推断不仅要求每个参与人是理性的，还要求每个参与人知道每个参与人是理性的，以及每个参与人知道每个参与人知道每个参与人是理性的，等等。例如在两个人的例子中，你是理性的，所以如果你看到我身上的B就知道你身上的是

10、A，但正因为我知道你是理性的，所以我才可以站在你的立场上推理。也因为我知道你知道我是理性的，因此我知道你也会站在我的立场上推理。,4. 策略（strategies ）:又称策略，是参与人在给定信息集的情况下的行动规则，它规定参与人在什么时候的什么情况下采取什么行动。因而一个策略是参与人的一个“相机行动方案”（contingent action plan）。记参与人i的一个策略为si，参与人i在一个博弈中的全部可供选择的策略记为Si（策略集strategy set），即si Si ， Si =s1 ,s2 , si , sn,表示参与人i 在该博弈中共有n个可行的策略。如果n个参与人每人从自

11、己的Si中选择一个策略si,则向量s=（ s1,s2,si, sn）是一个策略组合(strategy profile),参与人i之外的其他参与人的策略组合可记为s-i=（ s1,s2,si-1 ,si+1 , sn）。,注意：1. 策略与行动是两个不同的概念，策略是行动的规则（告诉参与者在什么情况下应该做什么）而不是行动本身。回顾上章提到的父亲和女儿的博弈。在静态博弈中，由于参与人同时行动，没有人能掌握他人的之前行动的信息，故没有可针对的行动，从而策略的选择就变成了行动的选择，即策略和行动是同一的.2. 作为一种行动规则，策略必须是完备的，就是说，策略要给出参与人在每一种可能想象到的情况下的行

12、动选择，即使参与人并不预期这种情况会实际发生。,5. 支付（payoffs）：参与人从各种策略组合中获得的收益。收益往往采用效用（utility）概念。它或者是一个特定策略组合下某个参与人得到的确定效用水平，或者是期望效用水平。它是策略组合的函数，所以也称支付函数（payoff function），记为ui(s)，ui(s)= ui(s1, s2, ,si,sn-1,sn).,1. 博弈的一个基本特征是一个参与人的支付不仅取决于自己的策略选择，而且取决于所有其他参与人的策略选择；是策略组合的函数。2. 支付是参与人真正关心的东西，参与人在博弈中的目标就是选择自己的策略以最大化自己的支付函数。,

13、注意,6. 均衡（equilibrium）均衡是所有参与人的最优策略组合。一般记为s*=（ s1*,s2*,si*, sn*）,7. 结果（outcome）结果是（博弈达到均衡时）博弈分析者所感兴趣的所有东西，包括均衡策略组合，均衡行动组合，均衡支付组合等。,博弈的策略式表述,策略式表述又称为标准式表述，包括以下几方面的内容： 1. 博弈的参与人集合=1,2, ,i , ,n 2. 每个参与人的策略空间Si, i=1,2, ,n 3. 每个参与人的支付函数 ui(s1, s2, ,si,sn-1,sn)， i=1,2, ,n 策略式表述更适合于静态模型，但也可用于动态模型。,博弈的策略式

14、表述,囚徒困境囚徒2坦白抵赖囚坦白徒1 抵赖,G=S1 ,，Sn ；u1, ,un ,博弈分析的目的：预测博弈的均衡结果，即给定每个参与人都是理性的是共同知识，什么是每个参与人的最优策略？什么是所有参与人的最优策略组合？,占优策略均衡,（严格）占优策略与占优策略均衡的定义：见课本。一个参与人的最优策略可能并不依赖于其他参与人的策略选择，就是说，不论其他参与人选择什么策略，他的最优策略都是唯一的，这样的最优策略被称为“占优策略（dominant strategy）”。,囚徒困境博弈中的占优策略均衡,囚徒困境囚徒2坦白抵赖囚坦白徒1 抵赖,智猪博弈,有一头大猪和一头小猪住在同一个猪圈里，

15、猪圈的一侧放者猪食槽，另一侧安装着一个控制食物供应的按钮。按一次按钮，有8个单位的食物进槽，但需承担2个单位的成本。偌大猪小猪同时到达猪食槽，大猪吃到5个单位的食物，小猪吃到3个单位的食物；若大猪先到，大猪吃7个单位的食物，小猪只能吃到1个单位；若小猪先到，小猪吃到4个单位食物，大猪也吃到4个单位食物。,智猪博弈中的占优策略,小猪按等待按 3，1 2，4大猪等待 7，-1 0，0,请列举“搭便车”的现象,冲开水、搞卫生；股市上庄家与散户,劣策略和严格劣策略,令si 和s“i是参与人i可选择的两个策略,如果对于其他参与人任何选择s-i=（s1，si-1 , si+1 ,，sn

16、），参与人i从si 得到的支付严格小于从s“i得到的支付，即： ui(si , s-i ) ui(s“i , s-i ), s-i 我们说策略si 严格劣于策略s“i,“重复剔除严格劣策略（iterated elimination of strictly dominated strategies）” 首先，找出某个参与人的严格劣策略，并把它从他的策略空间中剔除，重新构造一个已不包含该严格劣策略的博弈；其次，剔除新博弈中某个参与人的严格劣策略；重复上述过程，直到只剩下唯一的策略组合。这个唯一剩下的策略组合就是博弈的均衡解，称为“重复剔除的占优均衡”。,博弈方2左中右博弈上方 1 下,

展开阅读全文

博弈论与信息经济学-1.完全信息静态博弈 讲义

博弈论与信息经济学-1.完全信息静态博弈讲义