博弈论教材2013

上传人:汽*** 文档编号:464467274 上传时间:2024-02-06 格式:DOCX 页数:13 大小:43.91KB
返回 下载 相关 举报
博弈论教材2013_第1页
第1页 / 共13页
博弈论教材2013_第2页
第2页 / 共13页
博弈论教材2013_第3页
第3页 / 共13页
博弈论教材2013_第4页
第4页 / 共13页
博弈论教材2013_第5页
第5页 / 共13页
点击查看更多>>
资源描述

《博弈论教材2013》由会员分享,可在线阅读,更多相关《博弈论教材2013(13页珍藏版)》请在金锄头文库上搜索。

1、第三章 纳什均衡及其应用3.1 混合策略纳什均衡1 鹰鸽博弈我们知道老鹰具有攻击性,而鸽子爱好和平。在原始社会里有两个部落,可以做出两个行动:一是进攻一是和平,分别用鹰和鸽表示。表 1 鹰鸽博弈甲鹰-25, -2514,-9-9,145,5乙 鹰鸽该博弈的那是均衡为(鹰,鸽),(鸽,鹰)。一些学者研究发现,在同一个地域内,“鹰”和“鸽”的比例为0.36: 0.64。事实上,设鹰鸽比为z :1 - z,可以得出如下结果:E(e) = -25z +14(1- z)二 14 - 39z ;E(d) = -9z + 5(1-z)二 5 -14z9z 二二 0.3625聪明的做法是:当鹰鸽比小雨0.36

2、时,选择鹰策略;否则选择鸽策略。使用混合策略 方法分析:-25, -2514,-9-9,145,5鹰鸽q1-q第一步:混合策略型表示:甲鹰 p鸽 1-p 第二步:计算期望效用:E 二 p(9 - 25q) + 5 - 14q甲E 二 q(25p + 9) + 5 -14p乙第三步:作出最优反应函数1p = 0,10若=25,0q=0,11如果p 25第四步:作出反应函数的图像091q25第五步:根据交点,找出纳什均衡:其中(善,25)是混合策略纳什均衡。2 斗鸡博弈我的老家地处安徽最北部,苏鲁豫皖四省交界之处,东北处有条小河。河边的棉花地 里,经常有鹌鹑栖息在其间。秋末冬初的农闲时节,小鹌鹑刚

3、好长成。村民结网捕鹌鹑把玩、 斗鸟儿为乐。每天早晨4点多钟出发,大约 7点钟回来,雄性的鹌鹑留起来先要整夜整夜的 熬鹌鹑、放在手里把鹌鹑,真正熟练了,才拿出来和别人的相斗。设想两只鹌鹑要在场子里 一决雌雄。每只鹌鹑都有两个策略:攻击或逃跑。由于两只鹌鹑实力相当,若同时选择进攻 会两败俱伤;若一只进攻,一只逃跑,进攻者胜利。逃跑的鹌鹑算是玩完了,以后再也没胆 量进场子,主人也不回在把玩它,会用一块黑布把它的笼子蒙起来,培养成“叫子”,以后 后捕鹌鹑的时候拎出去吸引同伴。若同时逃跑不会败掉,以后还能斗,但是都会挨饿一天。大将军表 2-10 斗鸡博弈攻击逃跑猛英雄攻击逃跑-3, -32, -1-1,

4、 2-1, -13 猜币博弈(matching pennies)甲、乙两个人各持有一枚硬币,同时决定显示正面(数字)朝上还是反面(国徽或花纹)朝上,若两人朝上的一面相同甲输给乙10 元钱,若不同,则乙输给甲10 元钱。表 2-1 猜币博弈乙正反甲正-10, 1010,-10反10,-10-10,10我们观察表 2-1 可以发现,甲与乙效用之和为零,这种博弈称为零和博弈,是你死我活的博弈,双方有着激烈的冲突,不存在合作的可能。4 足球比赛中的点球大战守门员左中右射手左-1,10.5,-0.51,-1中0.5,-0.5-1,10.5, -0.5右1,-10.5, -0.5-1,1同学们,请你找出这

5、个博弈的纳什均衡。是不是发现没有纯策略纳什均衡呢?如果确定性策略无法奏效,就要果断引入不确定性。它将使两难问题不再是难题:5 流浪汉问题在社会保障体系比较完善的国家,总会或多或少的存在流浪汉的问题。这些依靠政府的 失业救济过活的无业游民,虽然可以成为某些正科口中标榜的民主生活的佐证。但是他毕竟 是高度发达的经济社会无法根治的一块牛皮癣。参与人是政府和一个流浪汉,流浪汉有两个 选择:寻找工作和终日游荡,政府在对流浪汉的管理上也有两个策略:救济和不救济。政府 想帮助流浪汉摆脱这种难堪的生活,但前提是后者必须试图寻找工作,否则帮助失效。但是,流浪汉可不认为这种生活难堪,除非没有办法生存,他们不会去寻

6、找工作的。流浪汉找工作 流浪q 1-q政救济p3,2-1,3府不救济1-p-1,10,0请你使用混合策略纳什均衡的求法,找出该博弈的纳什均衡。6 有限博弈的纳什均衡存在定理与奇数定理定理 1 一个有限博弈至少存在一个纳什均衡,一般而言,纳什均衡的个数是奇数个。定理 2 在 n 人策略式博弈中,若参与人的纯策略空间 S 是欧式空间上的一个非空闭集,且 i是有界的凸集,支付函数是连续的,对 S 是拟凹的,那么存在一个纯策略纳什均衡。i定理 3 在 n 人策略式博弈中,若参与人的纯策略空间 S 在欧式空间上世连续的,则存在一 i个混合策略纳什均衡。3.2 反应函数法学一点数学极大值与极小值1 库诺特

7、寡头竞争理论库诺特(Cournot,1838)寡头竞争模型可以说是纳什均衡的最早版本,它比纳什(Nash,1950)本人的定义早了100 多年。在库诺特模型里有两个参与人,分别称为企业1,企业 2;每个企业的策略是选择产量。效用是利润,它是两个企业产量的函数。我们用q w 0,表示第i个企业的产量。c (q )代表成本函数,p二p(q + q )代表i i i12逆需求函数。第i个企业的利润函数为兀(q ,q )二q p(q + q ) -c (q ),i = 1,2。(q*,q*)是i 12i 12 i i12纳什均衡产量意味着:q* e argmax 兀(q ,q*)二 q p(q + q

8、*) c (q ),1 1 1 2 1 1 2 1 1q* e argmax 兀(q*, q )二 q p(q* + q ) c (q )。2 2 1 2 2 1 2 2 2求解上述关系式找出纳什均衡的一个步骤是对每一个企业的利润函数求一阶导数并令其等于零,即d兀1 一 p(q + q ) + qp (q + q )c (q) - 0dq1 2 1 1 2 1 11d兀2 - p(q + q ) + q p (q + q ) c (q ) - 0dq1 2 2 1 2 2 22上述两个一阶条件分别定义了两个反应函数,解之可得:q* = R (q ),q* = R (q )。若1 1 2 2 2

9、 1 两条曲线仅有唯一交点,则该点处取纳什均衡图 2-3 反应函数交点图【例 2】 考虑库诺特模型的简单情况,假定两个企业具有相同的不变单位成本,即 c (q )二qc, c (q )二q c。逆需求函数取如下的线性形式:p二a - (q + q )。1 1 1 2 2 2 1 2解:最优化的一阶条件为:i = a -( q + q) - q - c =0dq12112 = a (q + q ) q c = 0dq1222反应函数为:q* 二 R(q)二, q* 二 R (q )二。1 1 2 2 2 2 1 2a c1解之得:q*二q*二。每个企业的利润为兀(q*,q*)二兀(q*,q*)二

10、(a c)2。1 2 3 1 1 2 2 1 2 9下面将之与垄断情况作比较,垄断企业的问题是:max兀二q(a- q c)。容易得出qa c 2/、/、2、q* =(a c)2。2 3 4 92 豪泰林模型假定有一个长度为 1 的线性城市,消费者均匀地分布在0,1 区间内,分布密度为 1。假定有两个商店,分别位于城市两端,商店1在x 0,商店2在x 1,出售物质性能相 同的产品。每个商店提供单位产品的成本为c。消费者购买商品的交通成本与距商店的距离 成比例,单位距离的成本为t。这样,住在x的消费者如果在商店1采购,需花费tx的交通 成本,如果在商店2采购需要花费t(1 x)的成本。假定消费者

11、得到的消费者剩余为s,且s相对于产品成本和交通成本足够大,从而每个消费者消费者都购买1 个单位的产品。令P为商店i的价格,D (P , P )为需求函数,i 1,2。如果住在x的消费者在两个商ii 12店之间买商品无差异,那么住在x左边的都在商店1购买,住在x右边的都在x购买。需2求分别为 D x,D 1 x。12这里,x满足p + tx p +1(1 x),综合需求函数的定义可得:122t 1 x p p +11 22t利润函数为:1兀(p , p ) (p c)D 丁 (p c)(p p +1)1 1 2 1 1 2t 1 2 11兀(p , p ) (p c)D 丁 (p c)(p p

12、+1)2 1 2 2 2 2t 2 1 2商店i选择自己的价格p,通过求驻点最大化利润兀:ii1 (p 一 2 p + c +1) 0dq2t21)1。兀1 /dq22 =(p 一 2 p + c +1) = 02t12p* = p* = c +1123 公共地悲剧设某村庄有n个农户,该村有一块大家都可以自由放牧羊群的草地。这片草地只能让不 超过一定数量的羊吃饱。超过这个限度,则每只羊都无法吃饱,从而降低了每只羊的产出, 草地也遭到破坏。假设这些农户决定养羊数是同时决策的,而且农户知道这片草地的最大养 羊数及不同养羊数下每只羊的产出。这就构成了n个农户的一个完全信息静态博弈问题。此博弈的参与人

13、有n个农户,其策略空间是各自养羊数q , i = 1,2,., n。养羊总数 iQ = %+ q2 + q。每只羊的产出卩(Q)是减函数。假设购买和照料每只羊的成本相同,设为c。则农户i养q只羊的效用函数为u = qV(Q)-qc。ii ii为方便起见,设n = 3,V(Q) = 100 - Q, c = 4。则u =q(100-q -q -q )-4q111231u = q (100 - q - q - q ) - 4q221232u = q (100 - q - q - q ) - 4q3 31233尽管羊的数量是整数,我们仍然可以将之视为连续函数,根据极值的条件得到最优解 之后圆整。反应

14、函数为:1q = R (q , q ) = 48只(q + q )1 1232231q = R (q, q ) = 48 - (q + q )2 2132131q = R (q, q ) = 48- &(q + q )3 312212三个反应函数的交点为: (24,24,24),相应的效用为( 576,576,576)。但是,如果qi= q2 = q3 =16,则效用组合为(76&76&768)。因此纳什均衡可能是低效率的一般而言,公共性质的物品,都有类似的结论,达到的稳定结果效率较低,称之为公共地悲剧。3 重复博弈3.4 应用1 社会福利博弈在这个博弈里,参与人是政府和一个流浪汉,流浪汉有两个选择:寻找工作和终日游荡, 政府在对流浪汉的管理上也有两个策略:救济和不救济。政府想帮助流浪汉摆脱这种难堪的 生活,但前提是后者必须试图寻找工作,否则帮助失效。但是,流

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 学术论文 > 其它学术论文

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号