不完全信息博弈

上传人:子 文档编号:51712604 上传时间:2018-08-16 格式:PPT 页数:41 大小:340KB
返回 下载 相关 举报
不完全信息博弈_第1页
第1页 / 共41页
不完全信息博弈_第2页
第2页 / 共41页
不完全信息博弈_第3页
第3页 / 共41页
不完全信息博弈_第4页
第4页 / 共41页
不完全信息博弈_第5页
第5页 / 共41页
点击查看更多>>
资源描述

《不完全信息博弈》由会员分享,可在线阅读,更多相关《不完全信息博弈(41页珍藏版)》请在金锄头文库上搜索。

1、2.4不完全信息博弈本节内容:n不完全信息静态博弈n贝叶斯纳什均衡的应用举例n不完全信息动态博弈u很多时候,参与人并不清楚对手的偏好、战略空间、各 种组合下的利润水平,即,只拥有不完全信息。每个人 知己于必然,知人于或然u引入一个虚拟的参与人:自然。它选择了参与人的特征 类型。海萨尼转换。u完全但不完美信息博弈。因为使博弈分析成为可能,故 称“完全”,但所知不确,故“不完美”u给定自己的类型和别人的类型的概率分布的情况下,每 个参与人的期望效用达到最大。不完全信息静态博弈: 贝叶斯-纳什均衡不完全信息博弈l在信息上,各对手有时势均力敌,可能形成完全信息博弈l其技术标准是:支付函数是共同知识l大

2、量的对局中信息不对称,如l古董(他们坐店收购时从来不先出价,卖猫的故事)l企业选择员工l保险销售l至少有一个人不知道其他人的支付函数,即形成“不完全信 息博弈”不完全信息博弈和贝叶斯纳什均衡不完全信息博弈例:市场进入博弈n进入者不知道在位者的成本函数,只能猜概率n如果你是高成本,我就进入,预期收益40,如果你是低 成本,我就不进入。到底进还是不进?进入者进入 不进入在位者 高成本情况低成本情况 默许斗争默许斗争 40,50-10,030,80-10,100 0,3000,3000,4000,400期望利润:p40+(1-p)(-10).为保证不亏,期望利润为0, 则p=0.2。大于0.2会赚钱

3、。对p的判断就是“贝叶斯理念”静态贝叶斯博弈的时间顺序为:1、自然选择类型向量,参与人i能观测到 自己的类型,但参与人j只知道除i之外所有参与人 类型,但不知道参与人i的类型。2、n个参与人同时行动;3、参与人i得到类型依存支付函数。给定参与人i只知道自己的类型而不知道其 他参与人的类型,参与人i将选择使自己的效应最 大化的期望效用。静态贝叶斯博弈 不完全信息博弈和贝叶斯纳什均衡海萨尼在1967-1968年提出了一个处理不完全 信息的方法引入一个虚拟的参与人“自然” ,自然首先行动,选择决定参与人的特征(如成 本函数),参与人知道自己的特征,其他参与人 不知道。这样不完全信息博弈就转换为完全但

4、不 完美信息博弈,可以利用标准的分析技术进行分 析,这就是“海萨尼转换”。海萨尼转换不完全信息博弈和贝叶斯纳什均衡类型:一个参与人拥有的所有的个人信息(即所有不 是共同知识的信息)称为他的类型。根据这个定义,甚至允许参与人不知道其他参与人是 否知道自己的类型。例如:市场进入博弈:在位者不知道进入者是否知道 自己是高成本还是低成本,只知道进入者有p的概率知道 自己的成本函数,(1-p)的概率不知道自己的成本函数 。 这种情况下,进入者也有两种类型:知道(在位者的成本 )或不知道(在位者的成本)。不完全信息意味着,至少有一个参与人有多个类型。海萨尼转换不完全信息博弈和贝叶斯纳什均衡贝叶斯纳什均衡

5、贝叶斯纳什均衡:n人不完全信息静态博弈 的纯战略均衡是一个类型依存战略组合,其中 每个参与人i在给定自己的类型i和其他参与人 类型依存战略的情况下,最大化自己的期望效 用。不完全信息博弈和贝叶斯纳什均衡o贝叶斯纳什均衡的定义的理解n如果我是某种类型,则其他人属某类型的 概率乘以这种情况下其他人的最好选择时 ,我所得到的效用。对此乘积加总,找出 我的最大效用o贝叶斯均衡相当于“各人的类型之和”下参与 人的纳什均衡不完全信息博弈和贝叶斯纳什均衡1、不完全信息古诺模型前面已经分析过完全信息静态古诺模型和动 态斯坦克尔伯格模型。后者,由于先行者的优 势而使均衡结果不同于完全信息下的结果(如 果是选择价

6、格,均衡结果不利于先行者) (张维迎P148)贝叶斯纳什均衡的应用举例qi:第i个企业的产量 Ci:代表第i个企业的成本 假定逆需求函数为: 第i个企业的利润函数为:1、不完全信息古诺模型假定a=2, c1=1, c2l=3/4,c2h=5/4。给定企业2知道企业1的成本,企业2将选择q2最 大化利润函数:t=a-c=a-3/4=5/4或t=a-5/4=3/4依赖于企业2的实际成本。从最优化一阶条件可 得企业2的反应函数为:3 信息与非合作博弈理论也就是说,企业2的最优产量不仅依赖于企业的产 量,而且依赖于自己的成本,令q2l为t=5/4时企业2的最 优产量, q2h为t=3/4时企业2的最优

7、产量。那么,q2l=1/2*(5/4-q1); q2h= 1/2*(3/4-q1)企业1不知道企业2的真实成本从而不知道企业2的 最优反应究竟是q2l还是q2h,因此企业1将选择q1最大化 下列利润函数:最优化一阶条件得企业1的反应函数为:是企业1关于企业2产量的期望值均衡意味着两个反应函数同时成立,解两个反应函 数得贝叶斯均衡为:2、双方叫价拍卖double auction 两群人各自出价,有中间的拍卖商。 叫价较低者容易卖出,但成交价格有可能高于 他的出价;出价高者容易买到,但成交价格有 可能低于他的出价Chatterjee & Samuelson “双方叫价拍卖模型” 假设你卖我买你觉得

8、这东西值c,要价ps;我觉得这东西值 v,要价pb。同时报数 如果你要价较低,成交,价格为中间数 如果你要价较高,不成交贝叶斯纳什均衡的应用举例贝叶斯纳什均衡的应用举例双方叫价拍卖double auctiono如果是完全信息,我知道那东西对你意味着什 么,你也知道那东西对我来讲值多少钱。o这将形成一个均衡:你我出价相等,皆大欢喜o如果谁想沾便宜,生意就没法做o还可能出现无效率的均衡:双方都没有认真选 择价格,漫天要价,坐地还钱,做不成生意贝叶斯纳什均衡的应用举例双方叫价拍卖double auction 如果是不完全信息,我不知道那东西对你意味着 多少钱,你也不知道那东西对我来讲有多大价值 。但

9、可以假设我们互相知道对方的分布函数 根据纳什均衡的定义,我们都选择最大化 根据均衡战略,即使我觉得它值1,但我最多只 出3/4,如果想成交,你的要价必须不高于3/4贝叶斯博弈与混合战略均衡 完全信息混合战略均衡可视为不完全信息纯战略 均衡的极限 混合战略均衡的纯化定理银行挤兑(1) 王则柯“银行挤兑的成因和预防”o两客户在同一银行各存有100元,银行 将这200元投资于一个长期项目。如果 在项目到期前银行要抽回资金,则只能 收回140元;但如果到期后再收回投资 ,则可收回本息280元。对客户来说,抽回存款的日期也有两种:一是在银行投资 项目到期之前,称日期1;一是在到期之后,称日期2。假定如果

10、两客户在日期1要求抽回资金则各得70元;如果只 有一个客户在日期1要抽回资金则该客户得100元,另一客 户只能得到剩余的40元。如果等到日期2两客户同时要收回资金,则各得140元;如 果到日期2还只有一方要求收回资金,则要求收回资金一方 得180元,另一方得100元;如果到日期2没有客户要求收回 资金,则银行还是分给他们各140元。银行挤兑(2)日 期1客户2客 户1抽 回不抽 回抽回70, 70100, 40 不抽 回40, 100下一 日期日 期2客户2客 户1抽 回不抽 回抽 回140, 140180, 100不抽 回100, 180140, 140银行挤兑(3)日 期1客户2客 户1抽

11、 回不 抽 回 抽 回70, 70100, 40不 抽 回40, 100140, 140不完全信息动态博弈o精炼贝叶斯均衡o二手车交易o市场类型o混同均衡与分离均衡o单一价格二手车交易u“自然”首先选择参与人的类型,参与人自己 知道,其他参与人不知道;在自然选择之后, 参与人开始行动,参与人的行动有先后,后行 动者能观测到先行动者的行动,但不能观测到 其类型 。不完全信息动态博弈u后行动者可以通过观察而增加对先行者的了解 ,再修正其主观判断,并由此选择自己的行动 。先行者知道自己的行为会被他人利用,就会 设法传递有利信息。u博弈过程是不仅是参与人选择行动的过程,还 是不断学习的过程。不完全信息

12、动态博弈u精炼贝叶斯均衡要求:给定其他参与人类型的 信念,参与人的策略在每一个信息集开始的“ 后续博弈”上构成贝叶斯-纳什均衡,而且在所 有可能的情况下,参与人要根据观察结果来修 正对其他参与人的信念,据此选择自己的最优 化行为。精炼贝叶斯均衡o精炼贝叶斯均衡是一个战略组合和一个概论分布, 它们满足以下要求:o(1)在各个信息集,轮到选择的参与人必须具有一 个关于博弈达到该信息集中各决策结的概率的判断 (即信息集上的概率分布);o(2)给定概率分布和其他参与人的选择,每个参与 人的战略是最优的;o(3)概率分布是使用贝叶斯法则从最优战略和观测 到的行动得到的。精炼贝叶斯均衡 1、贝叶斯法则在日

13、常生活中,当面临不确定时,我们对某事件 发生的可能性有一个判断,然后,会根据新的信息 来修正这个判断。统计学上,修正之前的判断称为“先验概率”修正后的判断称为“后验概率”贝叶斯法则就是人们根据新的信息从先验概率得 到后验概率的基本方法。1、贝叶斯法则假定参与人的类型是独立分布的,参与人i有K个类型, 有H个可能的行动,k和ah分别代表一个特定的类型和一个 特定的行动。如果我们观察到i选择了ah,i属于k的后验概率是多少?精炼贝叶斯均衡 1、贝叶斯法则人:好人(GP),坏人(BP) 事:好事(GT),坏事(BP) 一个好人干好事的概率等于他是好人的概率p(GP)乘 以好人干好事的概率p(GT|G

14、P),加上他是坏人的概率 p(BP)乘以坏人干好事的概率p(GT|BP):ProbGT= p(GT|GP)* p(GP)+ p(GT|BP)* p( GT|BP)精炼贝叶斯均衡 1、贝叶斯法则假定观测到一个人干了一件好事,那么这个人的是 好人的后验概率是:假定我们认为这个人是好人的先验概率是1/2,观 测到他干了好事之后如何修正他的先验概率依赖于他 干的好事好到什么程度:精炼贝叶斯均衡 1、贝叶斯法则1)是一件非常好的好事,坏人绝对不可能干,则p( GT|GP)=1 p(GT|BP)=02)这是一个非常一般的好事,好人会干,坏人也会干 :p(GT|GP)=1 p(GT|BP)=1精炼贝叶斯均衡

15、 3)介于上述两种情况之间:好人肯定会干,但坏人 可能会干也可能不会干:p(GT|GP)=1/2 p(GT|BP)=1/21、贝叶斯法则精炼贝叶斯均衡 假定我们观测到他干了一件坏事,我们相信,好人绝 对不会干坏事,那么可以肯定他绝对不是一个好人。假定我们原来认为他是个好人,大突然发现他干了一 件好事,我们如何看待呢?1、贝叶斯法则精炼贝叶斯均衡 1)在每个信息集上,决策者必须有一个定义在属于该 信息集的所有决策结上的一个概率分布(信念); 2)给定该信息集上的概率分布和其他参与人的后续战 略,参与人的行动必须是最优的; 3)每一个参与人根据贝叶斯法则和均衡战略修正后验 概率。 2、精炼贝叶斯均

16、衡精炼贝叶斯均衡 博弈顺序: 1)“自然”首先选择参与人1的类型,参与人1知道,但 参与人2不知道,只知道1属于该类型x的先验概率。 2)参与人1观测到类型x后发出信号。 3)参与人2观测到参与人1发出的信号,使用贝叶斯法 则从先验概率得到后验概率,然后选择行动。2、精炼贝叶斯均衡精炼贝叶斯均衡 二手车交易o假定你现在到二手车市场去买一辆旧车,到了市场 后,你却发现不知道每辆旧车真正的质量究竟怎样 ,因为它们看起来都象新车一样。o但通常卖方对旧车的质量要清楚得多。现在假定二 手车只有“好”和“差”两种类型,卖者知道而买者不 知道;不管好、差,卖者都有两种选择:卖或不卖 ,买者有“买”和“不买”两种选择。二手车交易的扩展式表述:首先 ,卖者确定旧车质量;其次,卖 者决定是卖还是不卖;最后,在 卖者卖车的情况下,买者确定买 还是不买。二手车交易买者 买者卖者卖者好 坏卖 不卖买 不买卖

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号