混合策略纳什均衡－金锄头文库

资源描述

《混合策略纳什均衡》由会员分享，可在线阅读，更多相关《混合策略纳什均衡（35页珍藏版）》请在金锄头文库上搜索。

1、博弈论第三章混合策略纳什均衡第二节混合策略纳什均衡的求解方法二、支付最大化法例：扑克牌对色游戏(p77) u无纯策略NE u给定混合策略p甲=(r,1-r); p乙=(q,1-q) v甲(p甲, p乙)=rq(-1)+(1-q) 1+ (1-r)q1+(1-q)(-1)= 2r(1-2q)+(2q-1) v乙(p甲, p乙)=q r1+(1-r)(-1)+ (1-q)r(-1)+(1-r)1 =2q(2r-1)-(2r-1)u混合策略纳什均衡是甲在策略空间红，黑上以概率分布 p甲*=（ 1/2，1/2）进行选择，乙也在策略空间红，黑上以概率p乙*=（1/2 ，1/2）进行选择解：Max

2、甲(p甲, p乙)rq*=1/2f.o.c. 1-2q=0Max 乙(p甲, p乙)qr*=1/2f.o.c. 2r-1=0博弈论第三章混合策略纳什均衡第二节混合策略纳什均衡的求解方法二、反应对应法例：扑克牌对色游戏(p77) u无纯策略NE u给定混合策略p甲=(r,1-r); p乙=(q,1-q) v甲(p甲, p乙)= 2r(1-2q)+(2q-1) l整理原则：一项含r，一项不含r v乙(p甲, p乙)= 2q(2r-1)-(2r-1) l整理原则：一项含q，一项不含q u按照NE的条件，一个策略组合如过是一个NE，那么其中的每一个策略都是参与人针对其他参与人策略组合的最优

3、反应，在纯策略NE中，这个“最优反应”可能是一个具体的纯策略 (离散情形)，也可能是一个反应函数(reaction function,如连续情形、古诺模型)。而在一个混合策略NE中，这个“最优反应”将是一个概率或很多个概率被称为“反应对应 ”(reaction correspondence)博弈论第三章混合策略纳什均衡第二节混合策略纳什均衡的求解方法二、反应对应法例：扑克牌对色游戏(p77)u先看甲的最优反应，记为r*=R(q)： v观察甲(p甲, p乙)= 2r(1-2q)+(2q-1)rq0 1 （红）1(红)1/21/2r*=R(q)反应对应曲线博弈论第三章混合策略纳什

4、均衡第二节混合策略纳什均衡的求解方法二、反应对应法例：扑克牌对色游戏(p77)u再看乙的最优反应，记为q*=R(r)： v观察乙(p甲, p乙)= 2q(2r-1)-(2r-1)rq0 1 （红）1(红)1/21/2q*=R(r)反应对应曲线博弈论第三章混合策略纳什均衡第二节混合策略纳什均衡的求解方法二、反应对应法例：扑克牌对色游戏(p77)u作为NE，各个参与人的反应应该同时为最优，只有两个反应对应的交点满足uNE：r*=1/2, q*=1/2uNE支付为：甲(p甲, p乙)= 2r(1-2q)+(2q-1)=0乙(p甲, p乙)= 2q(2r-1)-(2r-1)=0rq0

5、1 （红）1(红)1/21/2q*=R(r)r*=R(q)博弈论第三章混合策略纳什均衡第二节混合策略纳什均衡的求解方法二、反应对应法作业：社会福利博弈。使用反应对应法找到纳什均衡。流浪汉寻找工作游荡救济政府不救济3，2-1，3-1，10，0博弈论第三章混合策略纳什均衡第三节寻找多重纳什均衡例：情侣博弈两个（多个）纯策略纳什均衡问题：纳什均衡找完了吗？有无混合策略纳什均衡？一、支付最大化法给定混合策略p陈明=(r,1-r); p钟信=(q,1-q)Max 陈明(p陈明, p钟信)=r3q+(1-q) + (1-r)0+2(1-q) =r(4q-1)+2(1-q)Max

6、钟信(p陈明, p钟信)=q (2r+0)+ (1-q)r+3(1-r) =q(4r-3)+(3-2r)u NE：(r*, q*)=(3/4, 1/4)二、反应对应法rq博弈论第三章混合策略纳什均衡第三节寻找多重纳什均衡二、反应对应法：情侣博弈先看陈明的最优反应，记为r*=R(q)：u 陈明(p陈明, p钟信) =r(4q-1)+2(1-q)rq0 1 （钟信德语）1(陈明德语)1/4r*=R(q)博弈论第三章混合策略纳什均衡第三节寻找多重纳什均衡二、反应对应法：情侣博弈再看钟信的最优反应，记为q*=R(r)：u 钟信(p陈明, p钟信)=q(4r-3)+(3-2r)rq0 1

7、（钟信德语）1(陈明德语)1/4q*=R(r)3/4博弈论第三章混合策略纳什均衡第三节寻找多重纳什均衡二、反应对应法：情侣博弈反应对应曲线有三个交点：三个NE：ur*=0, q*=0 纯策略（确定性）ur*=3/4, q*=1/4 混合策略（不确定性）ur*=1, q*=1 纯策略（确定性）rq0 1 （钟信德语）1(陈明德语)1/43/4r*=R(q)q*=R(r)博弈论第三章混合策略纳什均衡第三节寻找多重纳什均衡二、反应对应法：情侣博弈支付的帕累托优势：初步印象陈明=r(4q-1)+2(1-q)，钟信=q(4r-3)+(3-2r)ur*=0, q*=0 纯策略（确定性）

8、v 双方NE支付: 陈明*=3，钟信*=2ur*=3/4, q*=1/4 混合策略（不确定性） v双方NE支付: 陈明*=3/2，钟信*=3/2ur*=1, q*=1 纯策略（确定性） v双方NE支付: 陈明*=2，钟信*=3u纯策略纳什均衡比混合策略纳什均衡具有支付优势，这称为帕累托优势u如果博弈同时存在纯策略纳什均衡和混合策略纳什均衡，前者往往得到优先考虑博弈论第三章混合策略纳什均衡第三节寻找多重纳什均衡二、反应对应法：情侣博弈夫妻之争博弈博弈论第三章混合策略纳什均衡第四节纳什均衡的存在性不同均衡概念的关系优势均衡纯策略纳什均衡混合策略纳什均衡博弈论第三章混合策略纳

9、什均衡第四节纳什均衡的存在性L 问题：是否所有的博弈都存在NE（纯的或混合的）？u Nash在1950年证明：任何有限博弈，都至少存在一个NE 。纳什定理：在一个由n个博弈方的G=S1，, Sn; u1, un中，如果n是有限的，且 Si都是有限集，则该博弈至少存在一个纳什均衡，但可能包含混合策略u Wilson（1971）证明，几乎所有有限博弈，都存在有限奇数个NE，包括纯策略NE和混合策略NE。u（纯策略）纳什均衡的存在性定理(Debreu,1952； Glicksberg,1952；Fan,1952)：考虑一个n人策略式博弈,如果每个参与人的纯策略空间Si是欧氏空间中的非空、紧（

10、闭而有界）的凸集,支付函数ui(s)连续且对si拟凹,则博弈存在一个纯策略Nash 均衡。博弈论第三章混合策略纳什均衡第四节纳什均衡的存在性例：凹但不连续的支付函数二人博弈：策略空间为S1=S2= (0, 1)支付函数：反应对应：反应对应曲线：s2s11/31/3s1=s2=无纳什均衡博弈论第三章混合策略纳什均衡第四节纳什均衡的存在性L 问题：是否所有的博弈都存在NE（纯的或混合的）？u（纯策略）纳什均衡的存在性定理(Debreu,1952； Glicksberg,1952；Fan,1952)：考虑一个n人策略式博弈,如果每个参与人的纯策略空间Si是欧氏空间中的非空、紧（闭

11、而有界）的凸集,支付函数ui(s)连续且对si拟凹,则博弈存在一个纯策略Nash 均衡。u（混合策略）纳什均衡的存在性定理 (Glicksberg,1952) ：在n人策略式博弈中,如果每个参与人的纯粹策略空间Si是欧氏空间中的非空、紧（闭而有界）的凸集,如果支付函数ui(s)为连续函数,那么博弈至少存在一个混合策略Nash均衡.博弈论第三章混合策略纳什均衡第五节多重纳什均衡的筛选一个博弈可能有多个均衡，但仍然存在不稳定性你预测出现这个纳什均衡，因而有相应选择，我却以为会出现另一个，乃有我的选择，此时的组合可能并不构成纳什均衡博弈论并没有一个一般的理论证明纳什均衡结果一定

12、能出现如何保证纳什均衡出现？一、帕累托优势标准：按照支付大小筛选纳什均衡例：猎人博弈博弈论第三章混合策略纳什均衡第五节多重纳什均衡的筛选如何保证纳什均衡出现？二、风险优势标准：风险小的NE优先假设概率，比较期望支付大小u 例：虚拟博弈u 两个纳什均衡，哪个更优？u 假设 r=1/2, q=1/2u 给定q=1/2：甲采用上策略的期望支付为：9/2+0/2=4.5甲采用下策略的期望支付为：8/2+7/2=7.5u 给定r=1/2：乙采用左策略的期望支付为：9/2+0/2=4.5乙采用右策略的期望支付为：8/2+7/2=7.5u 期望支付越大，风险越小：甲采用下策略，乙采用右策略

13、u 选择的纳什均衡为：（下策略，右策略）博弈论第三章混合策略纳什均衡第五节多重纳什均衡的筛选如何保证纳什均衡出现？二、风险优势标准：风险小的NE优先u 风险偏离损失乘积比较法1. 甲：单独偏离均衡的损失（1）偏离A的损失：6-5=1 （2）偏离B的损失：4-0=4 2. 乙：单独偏离均衡的损失（1）偏离A的损失：6-5=1 （2）偏离B的损失：4-0=4 3. 风险优势标准方法：偏离A的损失VS偏离B的损失 11444. 结论（1）偏离B的损失更大：16（2）不偏离Bu 选择的纳什均衡偏离损失更大者为：B,即(下策略，右策略)AB博弈论第三章混合策略纳什均衡第五节多重纳什均衡的

14、筛选如何保证纳什均衡出现？二、风险优势标准：风险小的NE优先u 风险偏离损失乘积比较法1. 甲：单独偏离均衡的损失（1）偏离A的损失：6-5=1 （2）偏离B的损失：4-0=4 2. 乙：单独偏离均衡的损失（1）偏离A的损失：6-5=1 （2）偏离B的损失：4-0=4 3. 风险偏离损失乘积比较法：偏离A的损失 VS 偏离B的损失 11444. 结论（1）偏离B的损失更大：16 （2）不偏离Bu 选择的纳什均衡偏离损失更大者为：B,即(下策略，右策略)AB博弈论第三章混合策略纳什均衡第五节多重纳什均衡的筛选如何保证纳什均衡出现？二、风险优势标准：风险小的NE优先5. 风险偏离损

15、失乘积比较法的缺陷：u 例：假设M远远大于m1. 甲：单独偏离均衡的损失(1)偏离A的损失： (M-m)-M/2=M/2-m (2)偏离B的损失：M-(M-m)=m2. 乙：单独偏离均衡的损失(1)偏离A的损失：0-0=0 (2)偏离B的损失：0-0=0 u 如果使用风险偏离损失乘积比较法：偏离A的损失VS偏离B的损失 (M/2-m)0=m0u 一种建议：甲偏离A的损失 VS 甲偏离B的损失 M/2-mmu 选择的纳什均衡为：A, 即(D，L)AB博弈论第三章混合策略纳什均衡第五节多重纳什均衡的筛选如何保证纳什均衡出现？二、帕累托优势标准和风险优势标准的关系如果帕累托优势标准和风险优势标准的选择冲突？例：u 帕累托优势标准法：选择的纳什均衡为Au 风险优势标准： 1. 甲：单独偏离均衡的损失 (1)偏离A的损失： 6-5=1 (2)偏离B的损失：4-(-1000)=1004 2. 乙：单独偏离均衡的损失 (1)偏离A的损失：6-5=1 (2)偏离B的

展开阅读全文

混合策略纳什均衡

最新文档