12第十二章贝叶斯纳什均衡及其精炼资料

上传人:E**** 文档编号:107581406 上传时间:2019-10-20 格式:PDF 页数:33 大小:254.84KB
返回 下载 相关 举报
12第十二章贝叶斯纳什均衡及其精炼资料_第1页
第1页 / 共33页
12第十二章贝叶斯纳什均衡及其精炼资料_第2页
第2页 / 共33页
12第十二章贝叶斯纳什均衡及其精炼资料_第3页
第3页 / 共33页
12第十二章贝叶斯纳什均衡及其精炼资料_第4页
第4页 / 共33页
12第十二章贝叶斯纳什均衡及其精炼资料_第5页
第5页 / 共33页
点击查看更多>>
资源描述

《12第十二章贝叶斯纳什均衡及其精炼资料》由会员分享,可在线阅读,更多相关《12第十二章贝叶斯纳什均衡及其精炼资料(33页珍藏版)》请在金锄头文库上搜索。

1、1 第十二章第十二章 贝叶斯纳什均衡及其精炼贝叶斯纳什均衡及其精炼 前两章讨论的是完全信息条件下的博弈完全信息条件下的博弈,给出 了博弈的基本分析框架。 本章将讨论不完全信息下的博弈不完全信息下的博弈行为, 包括不 完全信息静态博弈和不完全信息动态博弈。 12.112.1 不完全信息博弈与贝叶斯纳什均衡不完全信息博弈与贝叶斯纳什均衡 一、不完全信息博弈一、不完全信息博弈 完全信息博弈完全信息博弈指博弈中的参与人对所有其他 参与人的支付(偏好)函数有完全的了解,并且支 付 函 数 是 所 有 参 与 人 的 共 同 知 识 ( common knowledge)的博弈。 反之, 不满足完全信息博

2、弈假设的博弈称为不 完全信息博弈。 二、海萨尼二、海萨尼(Harsanyi)(Harsanyi)转换转换 在博弈中, 信息不完全使得博弈参与人必须预 测其他参与人的类型。 至于“类型”概念,以两个企业博弈的例子说 明。 假设参与人 1 为在位者企业, 参与人 2 为进入 者企业。 2 进入者依据在位者的生产成本高低选择是否 进入该行业,高则进,低则不进。但是进入者不知 道在位者的成本是高还是低。 因此,进入者必须预测在位者的成本“类型”, 究竟是高成本的还是低成本的。 海萨尼提出通过引入“自然”概念解决这个问 题。 即由自然实现行动,确定其他参与人的类型, 从而转换成我们已讨论过的扩展式动态博

3、弈结构扩展式动态博弈结构。 即通过自然选择类型, 实现不完全信息向完全信息 的转换,我们称之为海萨尼转换海萨尼转换。 在本例中,通过自然选择在位者的成本类型, 进入者再针对高成本或低成本进行是否进入的博 弈决策。 应当指出,通过自然选择类型的划分,不仅是 针对支付函数而言的, 其包括参与人所拥有的所有 个人信息,如战略空间和信息集等等。 通过上述分析可知道,不完全信息意味着,不完全信息意味着,至至 少有一个参与人拥有多种类型, 否则就成为完全少有一个参与人拥有多种类型, 否则就成为完全信信 息博弈息博弈。 用表示参与人 的一个特定类型,表示参 i i i 与人 所有可能类型的集合,并假定i i

4、i 取自某个客观的分布函数。 n ii1 = ),( 1n PL 3 为简化起见,假定只有参与人 本人观察到自i 己的类型,其他人都不能察到。但依据海萨尼 i i 公理, 我们假定分布函数是所有参与),( 1n PL 人的共同知识,就是说,在博弈开始时,所有参与 人关于自然行动的信念是相同的。 用表示除 之),( 111niii LL + =i 外 的 所 有 参 与 人 的 类 型 组 合 , 这 样 , 。),(),( 1iin =L 定义为参与人 的条件概率即给定)( iii pi 参与人 属于类型的条件下,其他参与人属于i i 的概率。 i 根据条件概率规则: (12.1) = = i

5、i iii iii ii iii iii p p p p p ),( ),( )( ),( )( 这里,是边缘概率。)( ii p 如 果 类 型 的 分 布 是 独 立 的 , 。 )()( iiiii pp = 4 三、战略表达式三、战略表达式 不完全信息静态博弈又称静态贝叶斯博弈不完全信息静态博弈又称静态贝叶斯博弈。 如同在完全信息静态博弈中一样, 静态贝叶斯 博弈的所有参与人同时行动,参与人 的战略空间i 等同于他的行动空间。所不同的是,参与人 i S i A 的行动空间可能依赖于他的类型,即行动空i i A i 间是类型依存的。 比如一个企业能选择什么产量依赖于它的成 本函数,等等。

6、 用表示参与人 的类型依存行动空间,)( ii A i 表示 的一个特定行动。)()( iiii Aa i 类似地, 参与人 的支付函数也是类型依存的。i 用表示参与人 的效用函数。于是,),( iiii aau i 可以用下列战略式表述代表静态贝叶斯博弈。 其定义为: 人静态贝叶斯博弈的战略式表述包括:n 参与人的类型空间, n , 1 L 条件概率, n pp, 1 L 类型依存战略空间)(.),( 11nn AAL 类型依存支付函数 );,(,),;,( 1111nnnn aauaauLLL 参与人 知道自己的类型,条件概率i ii 描述给定自己属于的情况下,)( iiii pp= i

7、5 参与人 有关其他参与人类型的不确定i ii 性。 我们用 ,;,;,;., 1111nnnn uuppAAGLLLL= 代表这个博弈。 静态贝叶斯博弈的时间顺序如下: (1)自然选择类型向量,其),( 1n L= 中,参与人 观测到,但参与人 ii i i )(ij 只知道,观测不到。)( jjj p i ( 2 )个 参 与 人 同 时 选 择 行 动n ,其中。),( 1n aaaL= ii Aa (3)参与人 得到。 i );,( 1ini aauL 给出四点讨论 (1)如果所有参与人的类型空间只包含一个 元素,即对于所有的 ,不完全信息静i i = 态博弈就退化为完全信息静态博弈,

8、 所以后者是前 者的一个特例。 (2)我们给出参与人类型相互独立的意义在 于其保证不完全信息的存在。 (3)准确地说,其他参与人不知道参与人i 的支付函数是指,其不知道参与人 的支付函数是i ,还是,这里);,( 1ini aauL);,( 1ini aauL ,。 ii ii ii 6 (4)参与人 的期望效用函数为:i (12.2) ),);(),()( iiiiiiiiiii aaupv i = 四、贝叶斯纳什均衡四、贝叶斯纳什均衡 通过上述讨论, 可以给出贝叶斯纳什均衡的定 义: 人不完全信息静态博弈n ,;,;,;., 1111nnnn uuppAAGLLLL= 的纯战略贝叶斯纳什均

9、衡是一个类型依存战略组 合,其中每个参与人 在给定自己的类 n iii a 1 )( = i 型和其他参与人类型依存战略的情况 i )( ii a 下最大化自己的期望效用函数。 i v 换言之,战略组合 是一个贝叶斯纳什均)(,),( 11nn aaa =L 衡,如果对于所有的 ,有:i)( iii Aa (12.3) ),);(),( )(maxarg)( iiiiiii iii a ii aau pa i 混合战略的贝叶斯纳什均衡概念可以类似定 义。 均衡的存在性定理是纳什均衡存在性定理的 7 一个直接推广。 五、一个例子:不完全信息古诺模型五、一个例子:不完全信息古诺模型 1.基本假定

10、参与人的类型是成本函数,假定逆需求函数为 ,令为企业 的成本,那么企业 21 qqaP= i ci 的利润函数为: (12.4)2 , 1)( 21 =icqqaq iii 假定企业 1 只有一种类型, 企业 2 有两种类型 , 企业 1 的单位成本是共同知识, 企业 2 的单位成 1 c 本是私人信息。 企业 2 知道自己的真实成本类型,而企业 1 只 知道的概率为,的概率为 L cc 22 = H cc 22 = ;是共同知识。)1 ( 为了简化讨论,进一步假定,2=a1 1 =c ,。43 2 = L c45 2 = H c21= 2.均衡求解 给定企业 2 知道企业 1 的成本,企业

11、2 将选择 以最大化利润函数: 2 q (12.5))( 2122 qqtq= 关于古诺模型的传统分析框架,可以参考 7.3 “寡头垄断与垄断竞争市场”。 8 其中或,依4543=at4345=at 赖于企业 2 的实际成本。 由一阶条件,得到企业 2 的反应函数为: (12.6))( 2 1 );( 112 qttqq= 这意味着, 企业 2 的最优产量不仅依赖于企业 1 的 产量,而且依赖于自己的成本(或类型) 。 为时企业 2 的最优产量, L q245=t 为时企业 2 的最优产量。 H q243=t 那么, ,) 4 5 ( 2 1 12 qq L = (12.7)) 4 3 ( 2

12、 1 12 qq H = 企业 1 不知道企业 2 的真实成本, 进而无法判 断企业 2 的反应函数是还是, 因此企业 1 将 L q2 H q2 选择最大化下面的期望效用函数: 1 q (12.8) )1 ( 2 1 )1 ( 2 1 211211 1 HL qqqqqq E + = 解最优化的一阶条件,得到企业 1的反应函数为: 9 (12.9) )1 ( 2 1 ) 2 1 2 1 1 ( 2 1 2 221 Eq qqq HL = = 其中,是企业 1 关于企业 2)( 2 1 222 HL qqEq+= 产量的期望值。 均衡意味着两个反应函数同时成立,解两个反 应函数得到贝叶斯均衡为

13、: ;, 3 1 1 = q 24 11 2 = L q 24 5 2 = H q 3.结论 比较不完全信息下贝叶斯均衡与完全信息下 的纳什均衡, 会有助于我们对二者区别与联系的理 解。 完全信息下,如果企业 2 的成本是,43 2 =c 而且企业 1 知道,则反应函数分别为:43 2 =c (12.10) ) 4 5 ( 2 1 )1 ( 2 1 12 21 qq qq = = 纳什均衡产量为:,其中41 1 = NE L q21 2 = NE L q 下标中的表示企业 2 为低成本的情况。L 类似可以得到,当时,纳什均衡产量45 2 =c 10 为:,。125 1 = NE H q61 2

14、 = NE H q 因此,我们有: , 3 1 41 11 = LNE L qq , 3 1 125 11 = qq NE H 24 5 61 22 = h aob 人必须以正的概率选择,否则后验概率没有定 h a 义。 如果,我们允许0Pr= h aob Pr hk aob 在0,1区间取任何值,只要该取值与均衡战略相 容。 在动态博弈中,对应着非均衡0Pr= h aob 路径上的信息集。 17 三、精炼贝叶斯均衡三、精炼贝叶斯均衡 下面给出精炼贝叶斯均衡的正式定义。 假 定 有个 参 与 人 , 参 与 人的 类 型 是ni ,是私人信息私人信息,是属于类型 ii i )( iii p 的

15、参与人 认为其他个参与人属于类型 i i1n 的先验概率。),( 111niii LL + = 令是参与人 的战略空间,是一个依 i Si ii Ss 赖于类型的特定的战略。 i 是在第个),( 111 h n h i h i hh i aaaaaLL + =h 信息集上参与人 观察到的其他个参与人的i1n 行动组合,它是战略组合 所规定的行动的一),( 111niii sssssLL + = 部分。 是在观察到的情况下,参与人)( h iii ap h i a 认 为 其 他个 参 与 人 属 于 类 型i1n 的后验概率。),( 111niii LL + = 是所有后验概率的集合, i p )( h iii ap 表示参与人 的效用函数。),( iiii ssu i 于是,精炼贝叶斯均衡可以定义如下: 精 炼 贝 叶 斯 均 衡 是 一 个 战 略 组 合 和一个后验概率组)(,),()( 11nn

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号