不完全信息博弈－金锄头文库

资源描述

《不完全信息博弈》由会员分享，可在线阅读，更多相关《不完全信息博弈（41页珍藏版）》请在金锄头文库上搜索。

1、2.4不完全信息博弈本节内容：n不完全信息静态博弈n贝叶斯纳什均衡的应用举例n不完全信息动态博弈u很多时候，参与人并不清楚对手的偏好、战略空间、各种组合下的利润水平，即，只拥有不完全信息。每个人知己于必然，知人于或然u引入一个虚拟的参与人：自然。它选择了参与人的特征类型。海萨尼转换。u完全但不完美信息博弈。因为使博弈分析成为可能，故称“完全”，但所知不确，故“不完美”u给定自己的类型和别人的类型的概率分布的情况下，每个参与人的期望效用达到最大。不完全信息静态博弈：贝叶斯-纳什均衡不完全信息博弈l在信息上，各对手有时势均力敌，可能形成完全信息博弈l其技术标准是：支付函数是共同知识l大

2、量的对局中信息不对称，如l古董(他们坐店收购时从来不先出价，卖猫的故事)l企业选择员工l保险销售l至少有一个人不知道其他人的支付函数，即形成“不完全信息博弈”不完全信息博弈和贝叶斯纳什均衡不完全信息博弈例：市场进入博弈n进入者不知道在位者的成本函数，只能猜概率n如果你是高成本，我就进入,预期收益40，如果你是低成本，我就不进入。到底进还是不进？进入者进入不进入在位者高成本情况低成本情况默许斗争默许斗争 40，50-10，030，80-10,100 0，3000，3000，4000，400期望利润:p40+(1-p)(-10).为保证不亏,期望利润为0, 则p=0.2。大于0.2会赚钱

3、。对p的判断就是“贝叶斯理念”静态贝叶斯博弈的时间顺序为：1、自然选择类型向量，参与人i能观测到自己的类型，但参与人j只知道除i之外所有参与人类型，但不知道参与人i的类型。2、n个参与人同时行动；3、参与人i得到类型依存支付函数。给定参与人i只知道自己的类型而不知道其他参与人的类型，参与人i将选择使自己的效应最大化的期望效用。静态贝叶斯博弈不完全信息博弈和贝叶斯纳什均衡海萨尼在1967-1968年提出了一个处理不完全信息的方法引入一个虚拟的参与人“自然” ，自然首先行动，选择决定参与人的特征（如成本函数），参与人知道自己的特征，其他参与人不知道。这样不完全信息博弈就转换为完全但

4、不完美信息博弈，可以利用标准的分析技术进行分析，这就是“海萨尼转换”。海萨尼转换不完全信息博弈和贝叶斯纳什均衡类型：一个参与人拥有的所有的个人信息（即所有不是共同知识的信息）称为他的类型。根据这个定义，甚至允许参与人不知道其他参与人是否知道自己的类型。例如：市场进入博弈：在位者不知道进入者是否知道自己是高成本还是低成本，只知道进入者有p的概率知道自己的成本函数，（1-p）的概率不知道自己的成本函数。这种情况下，进入者也有两种类型：知道（在位者的成本）或不知道（在位者的成本）。不完全信息意味着，至少有一个参与人有多个类型。海萨尼转换不完全信息博弈和贝叶斯纳什均衡贝叶斯纳什均衡

5、贝叶斯纳什均衡：n人不完全信息静态博弈的纯战略均衡是一个类型依存战略组合，其中每个参与人i在给定自己的类型i和其他参与人类型依存战略的情况下，最大化自己的期望效用。不完全信息博弈和贝叶斯纳什均衡o贝叶斯纳什均衡的定义的理解n如果我是某种类型，则其他人属某类型的概率乘以这种情况下其他人的最好选择时，我所得到的效用。对此乘积加总，找出我的最大效用o贝叶斯均衡相当于“各人的类型之和”下参与人的纳什均衡不完全信息博弈和贝叶斯纳什均衡1、不完全信息古诺模型前面已经分析过完全信息静态古诺模型和动态斯坦克尔伯格模型。后者，由于先行者的优势而使均衡结果不同于完全信息下的结果(如果是选择价

6、格，均衡结果不利于先行者) （张维迎P148）贝叶斯纳什均衡的应用举例qi：第i个企业的产量 Ci：代表第i个企业的成本假定逆需求函数为：第i个企业的利润函数为：1、不完全信息古诺模型假定a=2， c1=1， c2l=3/4，c2h=5/4。给定企业2知道企业1的成本，企业2将选择q2最大化利润函数：t=a-c=a-3/4=5/4或t=a-5/4=3/4依赖于企业2的实际成本。从最优化一阶条件可得企业2的反应函数为：3 信息与非合作博弈理论也就是说，企业2的最优产量不仅依赖于企业的产量，而且依赖于自己的成本，令q2l为t=5/4时企业2的最优产量， q2h为t=3/4时企业2的最优

7、产量。那么，q2l=1/2*（5/4-q1）； q2h= 1/2*（3/4-q1）企业1不知道企业2的真实成本从而不知道企业2的最优反应究竟是q2l还是q2h，因此企业1将选择q1最大化下列利润函数：最优化一阶条件得企业1的反应函数为：是企业1关于企业2产量的期望值均衡意味着两个反应函数同时成立，解两个反应函数得贝叶斯均衡为：2、双方叫价拍卖double auction 两群人各自出价，有中间的拍卖商。叫价较低者容易卖出，但成交价格有可能高于他的出价；出价高者容易买到，但成交价格有可能低于他的出价Chatterjee & Samuelson “双方叫价拍卖模型” 假设你卖我买你觉得

8、这东西值c，要价ps；我觉得这东西值 v，要价pb。同时报数如果你要价较低，成交，价格为中间数如果你要价较高，不成交贝叶斯纳什均衡的应用举例贝叶斯纳什均衡的应用举例双方叫价拍卖double auctiono如果是完全信息，我知道那东西对你意味着什么，你也知道那东西对我来讲值多少钱。o这将形成一个均衡：你我出价相等，皆大欢喜o如果谁想沾便宜，生意就没法做o还可能出现无效率的均衡：双方都没有认真选择价格，漫天要价，坐地还钱，做不成生意贝叶斯纳什均衡的应用举例双方叫价拍卖double auction 如果是不完全信息，我不知道那东西对你意味着多少钱，你也不知道那东西对我来讲有多大价值。但

9、可以假设我们互相知道对方的分布函数根据纳什均衡的定义，我们都选择最大化根据均衡战略，即使我觉得它值1，但我最多只出3/4，如果想成交，你的要价必须不高于3/4贝叶斯博弈与混合战略均衡完全信息混合战略均衡可视为不完全信息纯战略均衡的极限混合战略均衡的纯化定理银行挤兑(1) 王则柯“银行挤兑的成因和预防”o两客户在同一银行各存有100元，银行将这200元投资于一个长期项目。如果在项目到期前银行要抽回资金，则只能收回140元；但如果到期后再收回投资，则可收回本息280元。对客户来说，抽回存款的日期也有两种：一是在银行投资项目到期之前，称日期1；一是在到期之后，称日期2。假定如果

10、两客户在日期1要求抽回资金则各得70元；如果只有一个客户在日期1要抽回资金则该客户得100元，另一客户只能得到剩余的40元。如果等到日期2两客户同时要收回资金，则各得140元；如果到日期2还只有一方要求收回资金，则要求收回资金一方得180元，另一方得100元；如果到日期2没有客户要求收回资金，则银行还是分给他们各140元。银行挤兑(2)日期1客户2客户1抽回不抽回抽回70, 70100, 40 不抽回40, 100下一日期日期2客户2客户1抽回不抽回抽回140, 140180, 100不抽回100, 180140, 140银行挤兑(3)日期1客户2客户1抽

11、回不抽回抽回70, 70100, 40不抽回40, 100140, 140不完全信息动态博弈o精炼贝叶斯均衡o二手车交易o市场类型o混同均衡与分离均衡o单一价格二手车交易u“自然”首先选择参与人的类型，参与人自己知道，其他参与人不知道；在自然选择之后，参与人开始行动，参与人的行动有先后，后行动者能观测到先行动者的行动，但不能观测到其类型。不完全信息动态博弈u后行动者可以通过观察而增加对先行者的了解，再修正其主观判断，并由此选择自己的行动。先行者知道自己的行为会被他人利用，就会设法传递有利信息。u博弈过程是不仅是参与人选择行动的过程，还是不断学习的过程。不完全信息

12、动态博弈u精炼贝叶斯均衡要求：给定其他参与人类型的信念，参与人的策略在每一个信息集开始的“ 后续博弈”上构成贝叶斯-纳什均衡，而且在所有可能的情况下，参与人要根据观察结果来修正对其他参与人的信念，据此选择自己的最优化行为。精炼贝叶斯均衡o精炼贝叶斯均衡是一个战略组合和一个概论分布，它们满足以下要求：o(1)在各个信息集，轮到选择的参与人必须具有一个关于博弈达到该信息集中各决策结的概率的判断 (即信息集上的概率分布)；o(2)给定概率分布和其他参与人的选择，每个参与人的战略是最优的；o(3)概率分布是使用贝叶斯法则从最优战略和观测到的行动得到的。精炼贝叶斯均衡 1、贝叶斯法则在日

13、常生活中，当面临不确定时，我们对某事件发生的可能性有一个判断，然后，会根据新的信息来修正这个判断。统计学上，修正之前的判断称为“先验概率”修正后的判断称为“后验概率”贝叶斯法则就是人们根据新的信息从先验概率得到后验概率的基本方法。1、贝叶斯法则假定参与人的类型是独立分布的，参与人i有K个类型，有H个可能的行动，k和ah分别代表一个特定的类型和一个特定的行动。如果我们观察到i选择了ah，i属于k的后验概率是多少？精炼贝叶斯均衡 1、贝叶斯法则人：好人（GP），坏人（BP）事：好事（GT），坏事（BP）一个好人干好事的概率等于他是好人的概率p（GP）乘以好人干好事的概率p（GT|G

15、 3）介于上述两种情况之间：好人肯定会干，但坏人可能会干也可能不会干：p（GT|GP）=1/2 p（GT|BP）=1/21、贝叶斯法则精炼贝叶斯均衡假定我们观测到他干了一件坏事，我们相信，好人绝对不会干坏事，那么可以肯定他绝对不是一个好人。假定我们原来认为他是个好人，大突然发现他干了一件好事，我们如何看待呢？1、贝叶斯法则精炼贝叶斯均衡 1）在每个信息集上，决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布（信念）； 2）给定该信息集上的概率分布和其他参与人的后续战略，参与人的行动必须是最优的； 3）每一个参与人根据贝叶斯法则和均衡战略修正后验概率。 2、精炼贝叶斯均

16、衡精炼贝叶斯均衡博弈顺序： 1）“自然”首先选择参与人1的类型，参与人1知道，但参与人2不知道，只知道1属于该类型x的先验概率。 2）参与人1观测到类型x后发出信号。 3）参与人2观测到参与人1发出的信号，使用贝叶斯法则从先验概率得到后验概率，然后选择行动。2、精炼贝叶斯均衡精炼贝叶斯均衡二手车交易o假定你现在到二手车市场去买一辆旧车，到了市场后，你却发现不知道每辆旧车真正的质量究竟怎样，因为它们看起来都象新车一样。o但通常卖方对旧车的质量要清楚得多。现在假定二手车只有“好”和“差”两种类型，卖者知道而买者不知道；不管好、差，卖者都有两种选择：卖或不卖，买者有“买”和“不买”两种选择。二手车交易的扩展式表述：首先，卖者确定旧车质量；其次，卖者决定是卖还是不卖；最后，在卖者卖车的情况下，买者确定买还是不买。二手车交易买者买者卖者卖者好坏卖不卖买不买卖

展开阅读全文