不完全信息博弈分析

上传人:mg****85 文档编号:56647807 上传时间:2018-10-14 格式:PPT 页数:93 大小:343KB
返回 下载 相关 举报
不完全信息博弈分析_第1页
第1页 / 共93页
不完全信息博弈分析_第2页
第2页 / 共93页
不完全信息博弈分析_第3页
第3页 / 共93页
不完全信息博弈分析_第4页
第4页 / 共93页
不完全信息博弈分析_第5页
第5页 / 共93页
点击查看更多>>
资源描述

《不完全信息博弈分析》由会员分享,可在线阅读,更多相关《不完全信息博弈分析(93页珍藏版)》请在金锄头文库上搜索。

1、不完全信息博弈分析,完全信息与不完全信息 不完全信息博弈问题 Static Bayesian Game(SBG) Dynamic Bayesian Game(DBG),完全信息的一般表达式,G=S1,Sn;u1,un n 个参与人博弈 Si 是player i 的策略集,即所有可选策略集 ui 是player i 的支付函数,且ui = ui(s1,sn) 求均衡解,例如,Cournot Model,G=S1,S2,u1,u2 S1=q1,S2=q2 u1= u1 (q1,q2)=6q1-q1q2- q12 u2= u1 (q1,q2) =6q2-q1q2 -q22,p=a-Q Q= q1+q

2、2 U=pq-cq 假定a=8,c=4,反应函数求解法,反应函数 Si*=R(S1*,Si-1*,Si+1*,Sn*) 即最佳策略之间的相互依存关系 博弈的解(如果有解) 就是各个反应函数的交点,古诺博弈解的几何意义,类似的例子,反应函数的概念和思路可以应用到一般的无限多种策略博弈的求解中,可以使博弈问题的解法简约 如Bertrand双寡头模型 它与Cournot Model 不同的是,该模型中厂商的可选策略是价格而不是产量 Hotelling 价格竞争模型,混合策略求解法,正面 反面,猜硬币方,盖硬币方,正面 反面,这是一个零和博弈 显著的特征 最好的选择 随机选择按一定的概率分布选择自己的

3、策略,如何设计自己的概率分布?,盖方 设计:P正面=,P反面=1- 如果1-( 1/2)或1-( 1/2)? 猜方的期望收益: E正面= 1+(1-)(-1)=2(-1/2) E反面= (-1)+(-)1=2(1/2-) 最好的方法 E正面E反面,即1/2,猜硬币博弈的Mixed Strategy,对盖方来说, 1/2 猜方也以相同概率(=1/2)随机选择策略 在本博弈中 博弈双方的决策内容都不是确定性的具体策略,而是以一定的概率分布随机选择策略,这样的决策被称为“混合策略”(1/2,1/2),(1/2,1/2) 区别 纯策略及纯策略纳什均衡 混合策略及混合策略纳什均衡,混合策略的定义,在G=

4、S1,Sn;u1,un中,博弈方i 的策略为Si=si1,sik则博弈方i以概率分布pi=(pi1,pik)随机选择其k个可选择策略则这Pi就称为一个混合策略,其中0pij 1,j=1,k都成立,且pi1+ pik=1.,混合策略决策的基本原则,第一个原则 不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性。 第二个原则 他们选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过有针对性地倾向某一策略而在博弈中占上风。,斗鸡博弈,进 退,A,B,进,退,如何设计? :进退 :进退 期望值相等 A:E进退 B:E进退 混合策略 (进,退) (进,退),完全信息动态博弈的求解问题,讨

5、价还价博弈 两人为买卖一物讨价还价 最高出价300元 最低出价200元 双方报价在200,300中 价差300-200=100元是一块“蛋糕” P0,100是个连续区间,用逆推归纳法求解 假定P2是共识 B先开出P1就知道S会反开出P2 B为了不让S反开出P2 则必须保证P1开出后 S的所得P1-200P2-200, 就有P1=P2 这个Game的特点 S作为后开价者,享有“后动者优势”,(300-P2,P2-200),B与有两个轮回,B与只有一个轮回,B先开价 S接受就成交,S拒绝就Game Over. 显然,只要B开出的价格P1 200元, S就会接受 这在现实中是常见的。,P3是共识;

6、第三阶段 (300-P2)2( 300-P3) P2=300-300+P3 第二阶段 P1-200 ( P2-200) P1=200+100 -(300-P3) 2 本博弈的解: (300- P1 ,P1-200 ) 300- P1 =100-100+3002 P1-200=100-300 2 - P32,如果B与S有三个轮回 05+/(1-) 即 =0.25 即当时,囚犯2会选择合作,否则不合作 这样可以说明,当,两博弈方都以触发策略为最佳选择,即为NE。,的意义,如果ei对任意player i 都成立 而足够接近1 那么无限次重复博弈G(,)中一定存在一个子博弈完美的纳什均衡路径能实现各p

7、layers平均支付为(x1xn) 。 如囚徒困境中, (e1,en)=(1,1)=NE存在(x1xn)=(4,4),且xiei,i=1,2则(4,4)=SPNE,可实现支付(x1,xn),P1的支付,P2 的支付,(1,1),(4,4),(0,5),(5,0),可以用纯策略组合支付的加权平均表示,(x1, x2),对不完全信息的处理,Harsanyi转换 虚拟参与人自然 自然先决定参与人特征类型 参与人知道自己的特征,而其他参与人不知道 这样不完全信息博弈就转换“完全但不完美信息博弈,不对称信息下的 Cournot Model,厂商 S1q1 类型1=C1 1=1 先验信念 Prob.(C2

8、H)= , Prob.(C2L)=1- 支付函数u1=u1(q1,q2,1),厂商 S2=q2 类型2=C2H 或 C2 = 21, 22 支付函数 u2=u2(q1,q2,2),类型依存的支付函数: ui=ui(q1,q2,i),G=S1,S2, 1,2, p1 ,p2 u1,u2 S1=q1,S2=q2 1 =C1 =1 2 =C2H ,C2=21 ,22 p1=1,0 p2=,1- ui=ui(q1,q2,i),一般性处理,Cournot Models支付函数,厂商1的期望收益:,厂商2的期望收益:,最优化问题,上述三个最优化一阶条件,最优解,条件概率,厂商1对厂商2成本的主观信念:Prob.(C2H)= , Prob.(C2L)=1- 是在自己既定的成本C1情况下做出的,即 p(C2H |C1)= ,p(C2L |C1)= 1- P(2|1)-条件概率,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号