博弈论与信息经济学教学5资料

上传人:f****u 文档编号:109439963 上传时间:2019-10-26 格式:PDF 页数:15 大小:303.33KB
返回 下载 相关 举报
博弈论与信息经济学教学5资料_第1页
第1页 / 共15页
博弈论与信息经济学教学5资料_第2页
第2页 / 共15页
博弈论与信息经济学教学5资料_第3页
第3页 / 共15页
博弈论与信息经济学教学5资料_第4页
第4页 / 共15页
博弈论与信息经济学教学5资料_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《博弈论与信息经济学教学5资料》由会员分享,可在线阅读,更多相关《博弈论与信息经济学教学5资料(15页珍藏版)》请在金锄头文库上搜索。

1、研究生博弈论与信息经济学 第七讲 不完全信息博弈第七讲 不完全信息博弈(1):Bayes 博弈博弈 董志强 dongzhq Spring,2006 本章主要参考阅读:Fudenberg 和 Tirole 博弈论 ,中文版 183-212;英文 版 209-241 纳什均衡观念的一个潜在假设是, 每个参与人对其他参与人的行动持有正确 的信念(the correct belief) 。为了满足这个假设,要求参与人必须了解其正在参 与的博弈;尤其是,她必须知道其他人的偏好(preferences) 。 但是,在许多情况下,参与人并不完全清楚对手的特征:讨价还价的人们往 往并不知道他人对所议价的物品之

2、价值评估, 企业之间彼此并不清楚对方的成本 函数,斗士并不清楚相互的力量,陪审员并不清楚其他陪审员对于诉讼证据的解 释。在某些情况下,某个参与人比其他的参与人更清楚对手的特征,但是却并不 清楚对手对自己的特征了解多少。 这样的情形中所发生的博弈,称不完全信息博弈。对此类博弈的分析是通过 “贝叶斯博弈”模型(Bayesian game model)来分析的。 71 直观的例子 71 直观的例子 考虑包括两个企业的行业博弈。 参与人参与人:在位者,进入者 行动空间行动空间:在位者选择“建厂” , “不建厂” ;进入者选择“进入”或“不进 入” 信息结构信息结构:在位者的成本有“高” 、 “低”两种

3、类型,其成本类型是其私有信 息。进入者不知道在位者的成本类型,但他先验地认为在位者高成本概率为p, 低成本概率为1p。在位者知道进入者的先验概率判断其实,为了获得均 衡,有必要假设( ,1)pp是双方的共同知识。进入者只有一种成本类型。 行动顺序行动顺序:两个参与人同时行动 赢利函数赢利函数: 各参与人在不同策略组合下的赢利不仅取决于双方的行动, 也取 决于各自的成本类型。以如下赢利表表示。 在位者高成本的情况在位者高成本的情况(p) 在位者低成本的情况在位者低成本的情况(1-p) 进入者 进入者 进入 不进入 进入 不进入 建厂 0,-1 2,0 建厂 3,-1 5,0 在位者 不建厂 2,

4、1 3,0 在位者 不建厂2,1 3,0 图 7.1 A 图 7.1 B 如果信息是完全的,那么参与人双方就均知道是进行的图7.1A的博弈还是 图7.1B中的博弈。如果是进行7.1A的博弈,那么纳什均衡是(不建厂,进入) ; 如果是进行7.1B的博弈,则纳什均衡是(建厂,不进入) 。 但是, 如果信息是不完全的, 那么进入者将不会知道自己处于哪个博弈之中。 当然,进入着可以对其所处的博弈有一个先验概率,即以概率p处于7.1A的博 弈,以概率1p处于7.1B的博弈之中。如前假设,( ,1)pp是双方的共同知识, 但是在位者很清楚自己的真实类型。 那么,这样的博弈怎么来进行分析呢?我们可以这样考虑

5、:分析图7.1A和 7.1B可发现,进入者2是否应该进入,应取决于在位者的成本:在位者高成本 则进入者应进入,在位者低成本则在位者应不进入。现在,进入者不知道在位者 成本高低,因此它分别计算进入和不进入的预期收益: 222 ()()(1)()EUpUHp UL=+= 11 进入不建厂,进入|t建厂,进入|t 其中, 1 t是在位者的类型,,H L分别表示高成本和低成本的情况。这里的预 期赢利计算为什么只考察了(不建厂,进入|t1=H)和(建厂,进入|t1=L)这两种 情况呢?因为在位者的行动是类型依存的即其行动依赖于其类型: 给定对方 进入,如果自己是高成本则应不建厂,自己是低成本则应建厂。由

6、此,可计算出 2( )1( 1)(1)21EUppp= + =进入 222 ()()(1)()0EUpUHp UL=+= 11 不进入不建厂,不进入|t建厂,不进入|t 因此有 1 2 1 2 p p 进入者进入 进入者不进入 博弈的均衡是: 如果在位者成本高,则不建厂;若 p1/2 则进入者进入,p1/2 则进入者不 进入; 如果在位者成本低,则建厂;进入者是否进入仍取决于对概率 p 的判断。 改进后的例子 改进后的例子 在图 7.1 博弈的例子中,在位者的行动完全依赖于其类型。有时候,情况可 能不象这么简单。考虑图 7.2 的例子该例子将在位者低成本下建厂的赢利改 成了 1.5(若对方进入

7、)和 3.5(若对方不进入)。 在位者高成本的情况在位者高成本的情况(p) 在位者低成本的情况在位者低成本的情况(1-p) 进入者 进入者 进入 不进入 进入 不进入 建厂 0,-1 2,0 建厂 1.5,-1 3.5,0 在位者 不建厂 2,1 3,0 在位者 不建厂2,1 3,0 图 7.2 A 图 7.2 B 从图 7.2 可以发现,当在位者成本较高,则其最优的策略仍是选择不建厂; 但是如果在位者的成本较低,那么是否建厂还要取决于对进入者进入概率的估 计。 在图 7.2B 中(在位者低成本情况) ,如果进入者进入则在位者应不建厂,若 进入者不进入,则在位者应建厂。不妨假设低成本下进入者进

8、入的概率为y,那 么,低成本下,在位者选择建与不建取决于进入者进入的概率。如果 1.53.5(1)23(1)yyyy+ 即 1 2 y ,则在位者选择不建厂。 如果 1 2 y =,那么在位者也将使用混合策略( ,1)xx,0,1x选择建厂或不 建厂。 上述结果描述了低成本在位者对于进入者的最优行动反应。 要求解均衡还需 要考虑进入者对于在位者的最优反应。进入者并不知道在位者的成本,因此她只 能考虑进入或不进入的预期赢利: 2( )1 (1)( 1)(1)11 2 (1)EUppxxxp= + += 进入 2( )0(1)0(1)00EUppxx= + +=不进入 当 1 2(1)p x 时,

9、进入者选择不进入,即0y =; 当 1 2(1)p x =时,进入者选择混合策略( ,1)yy,0,1y。 求解贝叶斯博弈的均衡(贝叶斯博弈纳什均衡)就是要寻找到这样一组 ( , )x y,使得x是低成本在位者的最优策略;同时,给定进入者对于在位者的类 型判断p以及参与人的策略,y是进入者的最优策略。例如,对于任何p,策略 组合(0,1)xy=是一个均衡 (即在位者不建厂, 进入者进入) ; 当且仅当 1 2 p 时, 策略组(1,0)xy=构成一个均衡(低成本在位者建厂,进入者不进入) ;此外, 还有一个混合策略均衡 11 2(1)2 (,) p xy =。 Harsanyi 转换 对于贝叶

10、斯博弈,Harsanyi(1967,1968)给出了一种模拟和处理此类博弈的 方法。即引入自然(Nature)作为一个参与人。在前述行业博弈的例子中,在位者 成本类型的有先验概率( ,1)pp,可以视为自然首先行动,以混合策略( ,1)pp 选择在位者的成本类型。然后,在位者观察到自然的选择,而进入者未能观察到 自然的选择。接着在位者选择建厂或不建厂,进入者选择进入不进入。 Harsanyi 转换使不完全信息博弈转换成不完美信息博弈进行分析。 转换之后 的博弈如下(图 7.3) : 图 7.3 Note: (1)逆向归纳已经没有用;(2)Harsanyi 转换克服了递阶期望问题。 72 不完全

11、信息博弈:基本概念 72 不完全信息博弈:基本概念 称参与人的私有信息(private information)为其“类型”(type)。许多情况 下,参与人的类型由其赢利函数决定,因此常将赢利函数等同于其类型。 用 i 表示参与人i的一个特定类型, i H表示参与人i所有可能类型的集合, 即 ii H,称 i H为参与人i的类型空间,1,2,in=?。 不同类型的参与人往往具有不同的行动空间,即i的行动空间 i A随其类型 i 而变化,即( ) iii AA=。比如,企业选择产量(产量是其行动空间)的范围倚赖 N 进入者进入者 进入者 在位者 在位者 进入者 高成本 p 低成本 1p 建厂

12、x=0 进入 进入 进入 进入 不进入 不进入不进入 不进入 (0,-1) (2,0) (2,1)(3,0) (1.5,-1)(3.5,0) (2,1) (3,0) 不建厂 1-x=1 不建厂 1-x 建厂 x 于其成本函数。而给定其他参与人任何一种策略组合,参与人i有最优的反应行 动 * i a,而此时最优行动 * i a也将因参与人类型不同而可能不同,即 *( ) iii aa=。 对于参与人i,她不知道其他人的类型。当她采取任何行动( ) iii aA时,对 于其他所有参与人i的任一可能的类型组合 111 ( ,) iiin + =?,若给定 其他参与人类型与其最优行动 j a的一个对应

13、组合 *( ),1,2, jj aji jn=?,参与 人i的赢利为 () * 11 ( ),( ),(), iiinni u aaa? 假定,其他参与人的类型组合刚好为 i 的概率为P(|) iii 。假设博弈开始 前参与人对 1, , n ?的分布具有共同的信念,可记联合概率 1 ( ,) in P?为任一参 与人i的先验信念。显然,P(|) iii 实际上就是参与人i观察到自身类型 i 后对 其他人刚好面临类型组合 i 的概率推断,它实际上是一个条件概率: ( ,) P(|) ( ) ( ,) (,) jj ii iii i ii ji H P P P P = = 上述公式即概率论中的B

14、ayes公式。 因为i并不知道 i ,因此我们假设她最大化不确定条件下的期望赢利。i的 期望赢利可根据V-N-M预期效用函数刻画如下: () * ( )P(|)(), i iiiiiiiii E uu aa = 参与人i的行动目标是最大化( ) i E u,其最优行动满足 () * () arg maxP(|)(), iii i iiiiiiiii aA au aa 1,in=? 显然, * i a将是类型依存的,即 *( ) iii aa=。 Harsanyi公理公理:假定概率分布函数 1 ( ,) n P?是所有参与人的共同知识。 这一公理表明参与人关于自然行动的理念是一样的。 Defin

15、ition: (n人静态Bayes博弈)参与人类型空间, in HH?;条件概率 1, , n PP?; 策略空间 11 ( ),() nn AA?; 赢利函数 1111 (,),(,) nnnn u aau aa?。 i知道 i 。则一个n人静态Bayes博弈可由四元组 , , , GAP u=表示。 博弈的顺序为: 自然N选择 1 ( ,) n =?, ii H;参与人i观察到 i ,但不能观察到 j , ji,但i知道(|) iii P n个参与人同时选择行动(策略)1 1 (,) n aaa=?,( ) iii aA 1 请注意,这里是静态博弈,行动和策略被看作是一回事。 i得到赢利 1 (,) ini u aa? Note: 这个定义并不排除局中人j可能获取i类型的某种信息。譬如当所有 人的类型空间只有一个元素时,不完全信息静态博弈就退化成完全信息静态博 弈。 Definition: (n人静态Bayes博弈的纯策略纳什均衡纯策略Bayes纳什 均衡)n人静态Bayes博弈 , , , GAP u=的纯策略Bayes纳什均衡是一个类型依 存的策略组合 * 1 ( ) n ii i a = ,满足 (

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号