博弈论混合策略

上传人:豆浆 文档编号:56869871 上传时间:2018-10-16 格式:PPT 页数:30 大小:837KB
返回 下载 相关 举报
博弈论混合策略_第1页
第1页 / 共30页
博弈论混合策略_第2页
第2页 / 共30页
博弈论混合策略_第3页
第3页 / 共30页
博弈论混合策略_第4页
第4页 / 共30页
博弈论混合策略_第5页
第5页 / 共30页
点击查看更多>>
资源描述

《博弈论混合策略》由会员分享,可在线阅读,更多相关《博弈论混合策略(30页珍藏版)》请在金锄头文库上搜索。

1、博弈论 Game Theory,蔡树彬 13510646162(66162) 科技楼1406,2,第7讲 连续策略,基本定义:划拳博弈 支付均等化:小偷与守卫 导数法:政府救助 BR函数法:性别大战,3,划拳博弈,锤,剪,包,锤,剪,包,0,0,1,-1,-1,1,-1,1,0,0,1,-1,1,-1,-1,1,0,0,1,2,1. 写出1和2所有的最佳应对:BR1(锤2)=包1. 2. 在上面的矩阵里把相应的最佳应对画上圈,这个博弈有没有占优策略? 有没有Nash均衡策略? 3. 使用箭头的方法再次寻找均衡 4. 假如是你来玩这个游戏,你将如何来玩这个游戏?,4,不存在Nash均衡,如何应

2、对? 假定对方是个高手,你愿意和他一局定胜负还是5局3胜? 假定对方是个低手呢? 假定5局3胜,对手“包包包包包”,你有什么策略获胜? 假定5局3胜,对手“包包剪包包”,你有什么策略获胜? 假定5局3胜,对手“包包锤剪包”,你有什么策略获胜? 假定5局3胜,你知道对手会出3包1锤1剪,但是不知道顺序,你有什么策略获胜? 假定3局2胜,你知道对手会出1包1锤1剪,但是不知道顺序,你有什么策略获胜? 假定1局定胜负,你知道对手喜欢出包,你有什么策略获胜? 假定1局定胜负,你知道对手随便乱出拳,你有什么策略获胜?,5,划拳博弈,锤1,剪2,包3,锤1,剪2,包3,0,0,1,-1,-1,1,-1,1

3、,0,0,1,-1,1,-1,-1,1,0,0,1,2,取胜关键:不能让另一方猜到自己的策略 尽可能猜出对方策略,6,混合策略的提出,利用生活经验不难知道,为了获胜,不能让对手知道自己要出什么,所以要用随机的方法来出拳,而且要等概率(为什么?) 在这个例子里,A的策略是(1/3锤,1/3剪,1/3包) 这就引出了用概率来确定采用何种策略的方法,这就是混合策略(mixed strategies)概念的由来 在此之前所说的策略,实质上是以概率1选取某个确定的策略或行动,我们称之为纯策略 (pure strategies),7,混合策略的提出,博弈G=N, Ai, ui, iN 参与人i的纯策略构成

4、的策略集合为Si=Ai =si1, sik, 参与人i有j个不同的策略 混合策略:若参与人i以概率分布pi=(pi1, pik) 在其k个可选策略中随机选择“策略” 0pij 1,对于j=1 , k都成立 pi1+ pik=1 纯策略可看成特殊的混合策略,8,混合策略意义下的相关表述,混合策略空间: (pi1, pik) (si1, sik)T 混合策略意义下策略组合的表述 x1X1, , xnXn,其中Xi , i =1, , n表示参与人i的混合策略空间,xi为参与人i的一个具体混合策略,9,纳什均衡的存在性问题,每一个有限博弈至少存在一个纳什均衡(纯策略或混合策略); 如果一个博弈存在两

5、个纯策略纳什均衡,那么,一定存在第三个混合策略纳什均衡,10,为什么要不能严打,加大打击力度 加大处罚力度(多判死刑) 加大酒驾的惩罚力度 猎虎行动,11,小偷和守卫的博弈,小偷和守卫的博弈,这个博弈的均衡是什么?概率是多大? 加重对小偷的处罚会有什么结果?(增大P值) 加重对守卫的处罚会有什么结果?(增大D值),12,支付均等化,如果对手猜出自己的行为,则自己必败 为了不让对手猜出自己的行为,必须以一定概率选择纯策略 该概率的选择使得每种纯策略带来的支付都相等,所以不会偏向任何一种策略,13,支付均等化,小偷以的概率偷,守卫以的概率睡觉,14,理解混合策略,1。 参与人随机做出某种行为(偷或

6、者不偷) 2. 有许多参与人,每个人的行为是确定的,但是大家在一起表现出统计特征 3. 参与人是确定行为,但是对其他人来说是随机的。守卫随机抽取一人,并不能确定该人是偷还是不偷,15,加重对小偷的处罚:短期内能抑制盗窃发生率 长期并不能降低盗窃发生率,但会是的守卫更多的偷懒,16,加重对守卫的处罚:短期效果是使守卫更尽职 但长期中并不是使守卫更尽职,而是会降低盗窃发生的概率,17,如何使失窃率下降? 加大对小偷的处罚 只会一时改善治安 长期作用是使监管者更懒惰 加大对守卫的处罚 短期使守卫更尽职 长期是使偷窃率下降 如何治理贪污? 加大对贪官的处罚力度? 加大对纪委的处罚力度 不能头痛医头,脚

7、痛医脚 加大酒驾的惩处力度,只会使执法者更懒,不会制止酒驾 要制止救驾,就要加大对警察的惩罚力度,使得警察增大查处的概率 物价降不下来?不能只是处罚供应商,不能只是约谈。 要加大对发改委的惩处力度(干不好就下去) 引咎辞职,18,救助的困境,被救助者在老家盖房子 汶川的救助物资现在都没用(救助款更不知道到哪里去了) 郭美美事件 救助会不会养懒汉? 为治疗某个病人的捐款常在治好病之后被人侵吞,19,混合策略:政府以某个概率救济,贫民以某个概率失业,20,贫民必须以20%的概率迷惑政府,21,22,均衡是(0.5,0.5),(0.2,0.8),如果偏离均衡,会怎么样? 比如如果乐善好施的政府,其救

8、助概率大于0.5,比如说0.6,会如何? 贫民都游手好闲 不是救助得越多越好,要有一个度 饿不死,吃不饱是救济的要领 利益高于道德(只要利益更高,人们就倾向于游手好闲,不劳而获) 自私的基因 农民和地主的区别,23,r:妻,时装,q:夫,时装,0 1/3 1 图1-19 性别战的图解法,1,r=R1(q),q=R2(r),3/4,这三个点的坐标为(0, 0), (1/3, 3/4),(1, 1)。对应的三个策略分别是:(足球,足球);丈夫、妻子分别以1/3、3/4的概率选择时装;(时装,时装)。,BR法:性别大战,策略 期望得益 妻 (0.75,0.25) 0.67 夫 (1/3,2/3) 0

9、.75,24,制式问题,A B 得益 厂商1: 0.4 0.6 0.664 厂商2: 0.67 0.33 1.296,25,市场机会博弈,进 不进 得益 厂商1: 2/3 1/3 0 厂商2: 2/3 1/3 0,问题:,你跟舍友打球(羽毛球、乒乓球), 假设可以打远球、近球,你的击打策略是? 请建模求解 其他例子,26,27,足球点球,单号为球员,双号为守门员,选择你的策略 选择纯策略 选择混合策略 如果守门员左边的扑球技巧提高,(50,50)-(30.70),他是否应该更多地往右边射门?,28,所有的运动都要使用混合策略 篮球:三分远投还是内线攻击 足球:近角、远角、高球、低球 棒球:快球、慢球、曲线球、膝关节球 打牌:诈叫 兵者,诡道也。,29,你和对方比牌的大小(斗地主、赌神) 你该如何下注? 大牌下大注,小牌下小注行不行? 有时候大牌下大注,有时候下小注,平均概率行不行? 以多大概率下大注,多大概率下小注?,30,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 行业资料 > 其它行业文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号