混合策略纳什均衡

上传人:ji****72 文档编号:50966246 上传时间:2018-08-11 格式:PPT 页数:28 大小:421.50KB
返回 下载 相关 举报
混合策略纳什均衡_第1页
第1页 / 共28页
混合策略纳什均衡_第2页
第2页 / 共28页
混合策略纳什均衡_第3页
第3页 / 共28页
混合策略纳什均衡_第4页
第4页 / 共28页
混合策略纳什均衡_第5页
第5页 / 共28页
点击查看更多>>
资源描述

《混合策略纳什均衡》由会员分享,可在线阅读,更多相关《混合策略纳什均衡(28页珍藏版)》请在金锄头文库上搜索。

1、3 混合策略纳什均衡一、案例分析:门卫与小偷 二、混合策略纳什均衡 三、多重纳什均衡博弈 四、多重纳什均衡博弈的分析主要内容门卫与小偷:有一家公司为了防止盗窃聘请了一名门卫,但 是长期以来却发现仍有盗窃案件发生,公司讨论了两种方案 ,一是只要有失窃案件,则加重惩罚门卫,另一方案是,只要抓住小偷,则联合公安机关加重对小偷的惩罚。请分析哪 种方法对降低盗窃率有长效作用?V,-D-P,00,S0,0睡不睡偷不偷守卫小 偷一、案例分析猜硬币博弈-1, 11, -11, -1-1, 1正 面反 面猜硬币方盖 硬 币 方正 面反 面(1)不存在前面定义的纳什均衡策略组合 (2)关键是不能让对方猜到自己策略

2、二、混合策略纳什均衡这类博弈很多,还有哪些例子呢?行 参 与 人列参与人混合策略:在博弈 中,博弈方 的策略空间为 ,则博弈方 以概率分布 随机在其 个可选策略中选择的“策略”,称为一个“混合策略”,其中 对 都成立,且混合策略扩展博弈:博弈方在混合策略的策略空间 (概率分布空间)的选择看作一个博弈,就是原博 弈的“混合策略扩展博弈。设行参与人的策略选择概率为 ,列参与人的策略选择概率为则参与人1的期望支付为则参与人2的期望支付为混合策略纳什均衡设 是 人战略式博弈 的一个混合策略组合,如果对于所有的 , 对于每一个 都成立,则称混合策略组合 是这个博弈的一个纳什均衡。注意:在纳什均衡下,没有

3、参与人有积极性单独偏离或改 变该策略或策略组合。例1 流浪汉 找工作 游荡0 , 0-1 , 1-1 , 33 , 2政府救济 不救济假设政府救济的概率为 ;流浪汉找工作的概率为 ; 则博弈方1的混合策略博弈方2的混合策略2, 35, 23, 11, 5CDAB博弈方2博 弈 方 1策略 得益 博弈方1 (0.8,0.2) 2.6 博弈方2 (0.8,0.2) 2.6例2例3 扑克牌对色游戏B 红 黑-1 , 11 , -11 , -1-1 , 1A红 黑假设A出红牌的概率为 ;B出红牌的概率为 ;则因此A的最佳反应函数为因此A的最佳反应函数为同理纳什均衡是:A和B出红牌还 是出黑牌的概率都是

4、1/2.反应函数法练习1:利用反应函数法找出政府与流浪汉博弈的纳什均衡流浪汉 找工作 游荡0 , 0-1 , 1-1 , 33 , 2政府救济 不救济假设政府救济的概率为 ;流浪汉找工作的概率为 ; 则纳什均衡是:政府以1/2的概 率选择救助,流浪汉以1/5的 概率选择找工作。练习2:利用反应函数法找出情侣博弈的所有纳什均衡丽娟 足球 芭蕾1 , 20 , 00 , 02 , 1大海足球 芭蕾例4 (激励的悖论)有一家公司为了防止盗窃聘请了一名门 卫,但是长期以来却发现仍有盗窃案件发生,公司讨论了两 种方案,一是只要有失窃案件,则加重惩罚门卫,另一方案 是,只要抓住小偷,则联合公安机关加重对小

5、偷的惩罚。请 分析哪种方法对降低盗窃率有长效作用?V,-D-P,00,S0,0睡不睡偷不偷守卫小 偷假设小偷选择偷的概率为 ;守卫选择睡觉的概率为 ;则V,-D-P,00,S0,0睡不睡偷不偷守卫小 偷加重对守卫的处罚:短期中的效果是使守卫尽职 在长期中并不能使守卫更尽职,但会降低盗窃发生的概率分析得到纳什均衡0- D- D守卫 得益(睡)S小偷 偷的概率1V,-D-P,00,S0,0睡不睡偷不偷守卫小 偷加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会使得守卫更多的偷懒睡觉0- P- P小偷 得益(偷)V守卫 睡的概率1监督博弈的纳税检查 A 为应纳税款,C为检查成本

6、, F是偷税罚款 。假定 C甲离B损失乙离B损失=16对于第一个博弈,甲离A损失乙离A损失4 甲离B损失乙离B损失=9对于第二个博弈,3)聚点均衡 利用博弈设定以外的信息和依据进行选择 的均衡 文化、习惯或者其他各种特征都可能是聚 点均衡的依据 城市博弈(城市分组相同)、时间博弈( 报出相同的时间)是聚点均衡的典型例子4)相关均衡5, 14, 40, 01, 5LR博弈方2UD博 弈 方 1相关均衡例子三个纳什均衡:(U,L)、(D,R)和混合策略均衡(1/2,1/2), (1/2,1/2)结果都不理想,不如(D,L)。可利用聚点均衡(天气,抛硬 币),但仍不理想。相关装置:1、各1/3概率A

7、、B、C2、博弈方1看到是否A,博弈方2看 到是否C3、博弈方1见A采用U,否则D;博弈 方2见C采用R,否则L。相关均衡要点:1、构成纳什均衡2、有人忽略不造成问题5)防联盟均衡博弈中若有三个及三个以上的局中人,就有可能部分人结 成“联盟”,在极大化联盟成员利益的同时损害了其他局中 人的利益。(U,L,A)、(D,R,B)纯策略纳什均衡(U,L,A) Pareto优于(D,R,B)丙L RU 0,0,10 -5,-5,0D -5,-5,0 1,1,-5乙 甲L RU -2,-2,0 -5,-5,0D -5,-5,0 -1,-1,5乙 甲ABL RU 0,0 -5,-5 D -5,-5 1,1

8、乙 甲(U,L)、(D,R)纳什均衡(D,R) Pareto 最优均衡(D,R,B)有效地防止了甲乙二人可能的联盟,避免了 丙的损失。在防联盟均衡这一层意义上,(D,R,B)优 于(U,L,A)。甲与乙组成一个联盟与丙博弈,联盟的一方互相协调,尽可能地 极大化联盟各个成员的赢利。这时甲乙两人条件博弈的最优均衡仍是(D,R)设(U,L,A)是博弈的预测解,让丙固定于A,则甲、 乙两人之间的条件赢得矩阵为A BL 0,10 -2,0 R -5,0 -5,0丙 乙从甲 的角度看,不管乙与丙是 否结盟,条件博弈的均衡仍为 (L,A),不违背原博弈的均 衡(U,L,A)。对博弈的预测需要从整体出发,防联盟均衡应全面考虑 。 固定任何一个局中人的策略选择,其他局中人将协调在 条件博弈的最优均衡上。 如果协调的结果偏离了原纳什均衡,则该纳什均衡不能 成为合理预测。多人博弈中,如果存在多重纯策略均衡,任何k人 联盟都不会发生背离现象的均衡是一个合理预测 ,符合这种推理的预测结局称为防联盟均衡。

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号