策略性博弈与纳什均衡

上传人:蜀歌 文档编号:147426771 上传时间:2020-10-10 格式:PDF 页数:26 大小:122.55KB
返回 下载 相关 举报
策略性博弈与纳什均衡_第1页
第1页 / 共26页
策略性博弈与纳什均衡_第2页
第2页 / 共26页
策略性博弈与纳什均衡_第3页
第3页 / 共26页
策略性博弈与纳什均衡_第4页
第4页 / 共26页
策略性博弈与纳什均衡_第5页
第5页 / 共26页
点击查看更多>>
资源描述

《策略性博弈与纳什均衡》由会员分享,可在线阅读,更多相关《策略性博弈与纳什均衡(26页珍藏版)》请在金锄头文库上搜索。

1、策略性博弈与纳什 均衡 张涵 本章要点 博弈论理论背景 博弈论中的几个基本概念 策略博弈与占优 最优反应与纳什均衡 混合策略与最大最小(max min)策略 理论背景 传统微观经济学中的完全竞争市场假设 寡头市场上企业间的产量博弈和价格博弈 诺依曼与摩根斯坦的博弈论与经济行为 塔克的“囚徒困境” 纳什均衡 基本概念 游戏者(players):博弈中的游戏者是作决 策的个人。 行动或步骤 行动集:游戏者的行动集合(action set)记 为A i =a i ,是该游戏可能采取的全部行动 之集合。 基本概念 行动组合:一个行动组合是一个有序集a = a i (i=1,2,n),是由一个博弈中几个

2、游戏者各采取 一个行动而组成的。它实质上是博弈中的某一个 解。 游戏的顺序(order of play)它是指在什么时候该 谁下棋?可分为“同时”(Simultaneously)与“序列” (Sequential)。“同时”是指游戏者同时决定自己 的行动,“序列”需明确谁先行,谁后走。 基本概念 信息集(information set)是指在博弈的某一时点 上关于不同变量的取值的全部知识之和。 游戏者的策略(Players Strategy) 策略:即按什么规则到行动集中去选择行动。 策略集或策略空间(Players Strategy or Strategy Space):S i 是游戏I所有

3、策略的集合。 基本概念 策略组合(Strategy Combination):S= (S1,S2,Sn)。 游戏者的收益(Players Payoff) payoff 是指(1)在所有别的游戏者选择了 策略之后,并在老天(自然)选择以后,进 行了博弈之后,带给游戏者的效用;(2) 或是由游戏者与别的游戏者选择的策略的函 数带给游戏者的预期效用。 基本概念 结果(out come) 均衡(equilibrium) 博弈均衡,记为S*=(S1*,S2*,Sn*), 是博弈中几个游戏者各自都采取了其最优策 略而产生的一个策略组合。由均衡所产生的 结果叫均衡结果。 策略博弈与占优 策略博弈的定义 策略

4、博弈又称标准型博弈(normal form game),该博弈由三个要素构成: 游戏者名单(a list of players);每个 游戏者的策略单(a list of strategies for i);每一策略组合所对应的收益单(a list of payoff)。 策略博弈与占优 例2:石头、布、剪刀的博弈 这是一个“零和博弈”。 策略博弈与占优 占优(dominance) 在非协同博弈里,有两种解的技术:一种是 占优解,一种是均衡解(又称纳什均衡Nash epulibrium)这里先分析占优解。 例4,考虑由表10.4 所给出的策略型博弈, 可以看出:无论B 会选择U 还是V,对于A

5、来 说,选择Y 总比选择X 好。我们称X被Y占优 了,而Y 是占优于X。 策略博弈与占优 策略博弈与占优 经过推理,博弈的结果是(Y,V)。 我们把以上A排除X 的过程叫做“简单占优”,即只 排除一次。一旦在第一个游戏者排除了一个策略之 后,一个或几个策略会在此基础上相继被排除掉, 则称占优过程为“相继占优”(successive dominance),或“重叠占优”(iterated dominance)。上例中,(Y,V)就是重叠占优得 到的。而在表10.4 左图中,只有“简单占优”,我们 无法预测博弈的最终结果。 最优反应与纳什均衡 在博弈中,占优只给我们带来极少的分析结果。 在博弈理论

6、的文献里,最典型的方法是纳什 (Nash)均衡分析。 最优反应(best response) “所有别的游戏者的策略”的表述 对于某一策略组合S=(S1,S2Si, Si+1Sn),记S-i=(S1,S2,Si1, Si+1,Sn)为所有别的游戏者的策略,即一个策 略组合中去掉第i 个游戏者的所选策略。 最优反应与纳什均衡 最优反应的定义 给定S-i,游戏者的最优反应记为Si*,是指能 给他带来最大收益的策略,即 (10.2) 如(10.2)式为严格不等式,则“最优反应” 为严格的最优反应。 最优反应与纳什均衡 纳什均衡 纳什均衡的定义 一个策略组合S* =(S 1*, S 2*, , S n

7、 *)被 称为纳什均衡,如果别的游戏者不背离这一 组合,就没有人会背离他自己的最优反应 Si*,换言之,对于所有的i (10.3) 最优反应与纳什均衡 这就是说,当参与博弈的每一个游戏者都发挥了自 己的最优反应策略时,并且这些最优反应形成一个 组合,便形成了纳什均衡。可见,古诺均衡是一个 纳什均衡。 纳什均衡的另一种表达式 若记B (S-i)为给定S-i 时游戏者i 的最优反应集,显 然Nash 均衡是一个策略组合S* =(S 1*, S 2*, , S n*) ,使得S i * B i(S- i * ) ,对所有游戏者i。 这实质上启示我们如何找Nash均衡。 最优反应与纳什均衡 举例:囚犯

8、的困境中的纳什均衡 纳什均衡不唯一的例证 性别的冲突 Nash 均衡两个:(拳击、拳击),(芭蕾,芭蕾),说明:两个在 如何协调上存在冲突,但毕竟合作比分裂对各方都好。 混合策略与 最大最小(max min)策略 定义:对于游戏者i,其一个混合策略是一个 概率密度函数i: SiR ,使得对于所有 的s i Si,都有i (s i ) 0,且 i(s i ) = 1 对于i来说,所有的i的集合记为M i= i 混合策略与 最大最小(max min)策略 混合策略纳什均衡:如果对于博弈中所有的 游戏者i,对于所有的iMi,都有U i (* ) U i(i*, -i* ),则称*为一个混合策 略的纳

9、什均衡。 定理:如果*是一个混合策略的纳什均 衡,则对于具有i给定的正概率的每一个策 略si S i ,都有U i (* ) = U i (si, -i* ) 混合策略与 最大最小(max min)策略 该实例告诉我们求混合纳什均衡的方法。 例7,考虑下列博弈: 纯战略的纳什均衡为(U,L)与(D,R)。 以下求混合策略的纳什均衡。 混合策略与 最大最小(max min)策略 若B选择L的概率为q,选择R的概率为1q;则A 的收益应满足 2q0(1q)=0q(1q)1 (10.7) 若A选择U 的概率为P,选D的概率为1P,则B 的 收益应满足 1P0(1P)(1P)2 (10.8) 可求得q

10、=1/3,P=2/3。 因此,A=(2/3,1/3) 与B=(1/3,2/3)便是一个 混合的纳什均衡 最大最小化策略 (max min strategy) 最大最小化策略 (max min strategy) 如果B 是以损害A 为目标,则B 知道A 会选 择“下”时,会故意选择“左”,尽管B 这样做自 己并没有什么好处,但B 达到了损害A 最厉 害的目标。A 如果估计到这一可能性,则还 是保守一点为妙,即“两害之间取其较好的” 策略。即“最大最小策略”。 最大最小化策略 (max min strategy) A首先考虑,如选“上”,min1,1=1,如选 “下”,min-1000,2= -1000,A的决策是从 两个坏结果中挑一个相对好的结果。所以, A会选择“上”。 如果B仍想以损害A为目标,这时便不可能得 逞,只好选择“右”。结果是(上,右)。 最大最小化策略 (max min strategy) A如选择maxmin策略,结果不是“收益极大 化”,但却确保了“风险极小化”,所以 maxmin 策略又称为保守策略。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 经营企划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号