博弈论完全信息静态博弈

上传人:宝路 文档编号:52817105 上传时间:2018-08-26 格式:PPT 页数:109 大小:642.43KB
返回 下载 相关 举报
博弈论完全信息静态博弈_第1页
第1页 / 共109页
博弈论完全信息静态博弈_第2页
第2页 / 共109页
博弈论完全信息静态博弈_第3页
第3页 / 共109页
博弈论完全信息静态博弈_第4页
第4页 / 共109页
博弈论完全信息静态博弈_第5页
第5页 / 共109页
点击查看更多>>
资源描述

《博弈论完全信息静态博弈》由会员分享,可在线阅读,更多相关《博弈论完全信息静态博弈(109页珍藏版)》请在金锄头文库上搜索。

1、知彼知己,百战不殆,摘自孙子兵法,完全信息静态博弈概念,各参与人对彼此的策略集、支付函数有准确了解 博弈行为同时进行 一些实例 石头、剪子、布游戏 彼此了解的两个厂商的价格战,完全信息静态博弈概念,有些实际博弈 虽然决策不是在绝对时间意义上的“同时” 但决策的时间先后差别跟博弈结果没有关系,也可看成是“同时进行的博弈”。 如不同竞标单位作出的工程投标决策,纳什均衡(Nash Equilibrium),定义。对于一个策略式表述的博弈G= N,Si, ui, iN。称策略组合s*=(s1, si, , sn)是一个纳什均衡,如果对于每一个i N, si*是给定其他参与人选择 s-i*=s1*, ,

2、si-1*, si+1*, ,sn* 情况下参与人i的最优策略(经济理性策略),即: ui(si*, s-i*) ui(si, s-i*), 对于任意的 siSi ,任意的 iN均成立。,一类简单的纳什均衡求解方法划线法 一个抽象例子,见表图1-8,图1-8,纳什均衡(Nash Equilibrium),先考虑A,当B分别采用策略L, C, R时,A的最优策略分别为M, U, D,图1-8,纳什均衡(Nash Equilibrium),同理,当A分别采用U, M, D时,B的最优策略分别为 注意两个元素都标有横杆的格子,对应的策略为纳什均衡(为什么?),图1-8,纳什均衡(Nash Equil

3、ibrium),纳什均衡(Nash Equilibrium),纳什均衡、占优均衡、重复剔除严劣策略均衡的关系 定理a 每一个占优均衡、重复剔除严劣策略均衡一定是纳什均衡,但反过来不一定成立; 定理b 纳什均衡一定不能通过重复剔除严劣策略方法剔除。,纳什均衡的一致预测性质 一致预测性:如果所有参与人都预测一个特定的博弈结果会出现,那么所有的参与人都没有偏离这个结果的愿望,这个预测结果最终将成为博弈的结果。 纳什均衡具有一致预测性质。,纳什均衡(Nash Equilibrium),纳什均衡应用举例:古诺模型,这里考虑连续形式的古诺模型 两个企业,分别表示为企业1、企业2 每个企业的策略是选择产量(

4、用qi表示),支付是利润(用i表示),它是两个企业产量的函数,生产成本与产量有关,用Ci(qi)表示,市场出清价格为P=P(q1+q2) 第i个企业的利润函数为: i=qi P(q1+q2) Ci (qi), i=1, 2,(q1*, q2*)是均衡产量意味着: q1*argmax1(q1, q2*) q2*argmax2(q1*, q2) 根据上面两个式子可以得出反应函数(reaction function): q1*=R1(q2) q2*=R2(q1) 两个反应函数的交叉点就是纳什均衡(q1*, q2*),见图1-9,纳什均衡应用举例:古诺模型,q2,q1,图1-9 古诺模型的纳什均衡,N

5、E,纳什均衡应用举例:古诺模型,R2,R1,纳什均衡应用举例:古诺模型,实际验证 假定每个企业具有相同的不变单位成本,即C1(q1)=q1c, C2(q2)=q2c, 价格出清函数取线性形式: P=a-(q1+q2)。根据 q1*argmax1(q1, q2*) = q1P(q1+q2*) C1(q1) q2*argmax2(q1*, q2) = q2P(q1*+q2) C2(q2) 通过求一阶导数,得,于是可得到反应函数为:,纳什均衡应用举例:古诺模型,纳什均衡应用举例:古诺模型,进而可以得出每个企业的纳什均衡产量下的利润,为,可以同垄断企业的最优决策类比,纳什均衡应用举例:古诺模型,垄断条

6、件下的最优产量,可通过计算 Q*argmax=Q*(a-Q*-c) 求出最优的产量值,垄断条件下的最优利润为,最优纳什均衡总产量,最优纳什均衡利润总和,纳什均衡应用举例:古诺模型,古诺模型的启示 寡头竞争的总产量大于垄断竞争产量的原因在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。这是一个典型的囚徒困境 从另一个层面我们也了解到为什么国外有反垄断法,为什么有AT&T分拆事件。,豪泰林价格竞争模型,古诺模型中,产品是同质的(homogenous); 豪泰林模型中,引入了产品的差异性; 产品的差异性可以有很多体现形式:如品牌、外观、功能、空间差别(如房

7、地产) 豪泰林模型中,产品的差异通过空间差别来体现 豪泰林模型的主要假设是产品的差异完全是由空间位置的不同而造成的,豪泰林价格竞争模型,模型描述 假定有一个长度为1的线性城市,消费者均匀地分布在0,1区间上。假定有两个商店,分别位于城市的两端,商店1在x=0处,商店2在x=1处,出售完全相同的产品 每个商店提供单位产品的成本为c,消费者购买商品的旅行成本与离商店的距离成正比,单位距离的成本为t 假定消费者有单位需求:要么消费1单位,要么消费0个单位(如住房消费)。消费者从消费中得到的消费者剩余为s。,豪泰林价格竞争模型,纳什均衡分析 假定两个商店同时选择自己的销售价格。假定消费者剩余s相对于购

8、买总成本(价格加旅行费用)足够大从而所有消费者都购买一个单位的产品 令pi为商店i的价格,Di ( p1, p2)为需求函数,i=1, 2,豪泰林价格竞争模型,如果住在x的消费者在两个商店之间是无差异的,那么,所有住在x左边的将都在商店1购买,而住在x右边的将在商店2购买,需求比例分别是 D1=x, D2=1-x。 这里的x满足: p1+tx=p2+t(1-x) 解上面两个式子,可得出需求函数为,豪泰林价格竞争模型,利润函数分别为,豪泰林价格竞争模型,通过一阶导数法,可以求出两个企业的最优价格,为,均衡价格下,每个企业的最优利润为,可以进一步设想,若两个商店为了争夺顾客源,可以自由选择商店位置

9、,那么可以计算,纳什均衡位置在0,1区间的中点0.5处,即最终两个商店汇聚一点; 这在一定程度上可以说明,为什么商店通常都聚集在一处的原因。这个现象还有其他原因吗?,豪泰林价格竞争模型,贝特兰德的双头垄断模型,1.3.B 贝特兰德的双头垄断模型贝特兰德(1883)提出企业在竞争时选择的是产品价格而不象古诺模型中选择产量。,贝特兰德的双头垄断模型,公共地悲剧,问题描述 考虑一个有n个农民的村庄共同拥有一片草地,每个农民都有在草地上放牧的自由。每年春天,每个农民要决定自己养多少只羊。用gi 0,)代表第i个农民饲养的数量,i =1, ,n,G=gi表示n个农民饲养的总数量, v代表每只羊的平均价值

10、。 一个重要的假设是v是G的函数,v=v (G)。因为每只羊至少要一定数量的草才不至于饿死,因此有一个最大的存活量Gmax,即,公共地悲剧,问题描述 当G 0; 当G Gmax时,v(G)=0。 当草地上的羊很少时,增加一只羊也许不会对其他羊的价值有太大的不利影响,但随着饲养量的不断增加,每只羊的价值会急剧下降,因此假定:,可用图1-10描述这个特征,Gmax G,v,图1-10 每只羊的价值随饲养总量的增加而下降曲线,公共地悲剧,均衡分析 在该博弈中,每个农民的问题是选择gi以最大化自己的利润。假定购买一只羊羔的价格为c,那么利润函数为,公共地悲剧,公共地悲剧,最优化一阶条件为,该式表明,对

11、于每个农民来说,增加一只羊有正负两方面效用,将上面n个式子相加,在同时除以n,得,公共地悲剧,整个社会的最优化饲养量,用G*表示,为,一阶最优化条件为,公共地悲剧,比较上面两个式子,可推出GG*.,反证法 假设G G*,那么由于 v 0,因此 v(G) v (G*)。类似的,由于v0, 又可推出 0v(G) v (G*) 。另外,从G G*还可推出G/n G*,最后要价仲裁,许多公共部门的职工是不允许罢工的,这时有关工资的分歧通过具有约束力的仲裁解决。较为重要的仲裁形式有两类:协议仲裁和最后要价仲裁。在最后要价仲裁中,争议双方各自就工资水平要价,仲裁人选择其中之一作为仲裁结果;在协议仲裁中,仲

12、裁人可自由选定任意工资水平作为仲裁结果。本例根据法伯(1982)的研究,导出在最后要价仲裁模型处于纳什均衡时,博弈双方对工资水平的要价。,最后要价仲裁,最后要价仲裁,最后要价仲裁,博弈论在实际中应用的 一般分析框架,描述实际问题问题 问题本身的描述(文字、图表为主) 用数学模型描述 描述合理 易于处理,博弈论在实际中应用的 一般分析框架,选择合适博弈模型 完全信息静态博弈 完全信息动态博弈 合作博弈 等等,博弈论在实际中应用的 一般分析框架,描述博弈基本要素,如 参与人 参与人策略集 各参与人的效用函数 等等,博弈论在实际中应用的 一般分析框架,博弈的均衡分析 纳什均衡分析(纳什均衡与博弈结果

13、的预测) 一些相关分析(数学的、经济的、业内的) 分析结果的“翻译” 结论,前面介绍的纳什均衡分析方法 对于相当多一类博弈问题无能为力。 如图1-11的猜硬币博弈,不存在已经定义的各种均衡,图1-11 猜硬币博弈,混合策略的提出,混合策略的提出,利用生活经验不难知道,若硬币是均匀的,以0.5的概率去猜测正面无疑是最佳决策 这就引出了用概率来确定采用何种策略的方法,这就是混合策略(mixed strategies)概念的由来 在此之前所说的策略,实质上是以概率1选取某个确定的策略或行动,我们称之为纯策略 (pure strategies),混合策略的提出,混合策略的定义:在博弈G=N, Si,

14、ui, iN中,假设参与人i的纯策略构成的策略集合为Si=si1, sik,若参与人i以概率分布pi=(pi1, pik) 在其k个可选策略中随机选择“策略”,称这样的选择方式为混合策略。这里,0pij 1,对于j=1 , k都成立,且有: pi1+ pik=1 纯策略可看成特殊的混合策略 上述定义是在有限博弈前提下进行的,混合策略意义下的相关表述,混合策略意义下策略组合的表述 x1X1, , xnXn,其中Xi , i =1, , n表示参与人i所有纯策略生成的概率空间,xi为参与人i的一个具体混合策略 猜硬币博弈的一个混合策略就可记为(1/2, 1/2),(1/2, 1/2) 混合策略意义

15、下支付函数如何表述?,预备知识关于风险结果的偏好,基本概念 Lotteries(风险结果). 由机会点和该机会点发出的n个机会枝的概率及相应后果构成的结构称为lottery (抽奖,意译为风险结果)。 一个风险结果可以表示为L = ( p1, a1; pn, an) 若确定性结果 ci 是众所周知的事实,风险结果也可以简记为L= (p1, , pn),预备知识关于风险结果的偏好,若对前面介绍的效用理论进行概括 仅满足序关系的效用为序数效用理论 用支付函数表示的效用关系,采用的是基数效用理论 上述两类关于确定性结果的偏好理论,无法描述决策者对不同风险结果的偏好程度,预备知识关于风险结果的偏好,针

16、对风险结果的偏好,在一些相对合理假设的基础上,可以给出用以描述风险结果的支付函数 用数学形式表述,就是说U是一个支付函数,满足 U (p1,pK) U (p1,pK) 当且仅当(if and only if)某个决策者偏好(p1,pK) 的程度高于(p1,pK),预备知识关于风险结果的偏好,描述关于风险结果的标准方法,是由博弈论的奠基人 von Neumann 和Morgenstern,通过一系列独立性公理 (independence axiom),得出的期望效用函数或期望支付函数。详见文献4: 713 这些独立性公理,保证了通过确定性结果的支付函数u,推出决策者关于风险结果的偏好,可以用期望支付来表示。 理性决策者选择风险结果的依据是期望支付的最大化,预备知识关于风险结果的偏好,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 中学教育 > 教学课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号