博弈与决策作业任务1-4培训课件

上传人:tang****xu7 文档编号:147542248 上传时间:2020-10-11 格式:DOCX 页数:15 大小:35.63KB
返回 下载 相关 举报
博弈与决策作业任务1-4培训课件_第1页
第1页 / 共15页
博弈与决策作业任务1-4培训课件_第2页
第2页 / 共15页
博弈与决策作业任务1-4培训课件_第3页
第3页 / 共15页
博弈与决策作业任务1-4培训课件_第4页
第4页 / 共15页
博弈与决策作业任务1-4培训课件_第5页
第5页 / 共15页
点击查看更多>>
资源描述

《博弈与决策作业任务1-4培训课件》由会员分享,可在线阅读,更多相关《博弈与决策作业任务1-4培训课件(15页珍藏版)》请在金锄头文库上搜索。

1、博弈与决策平时作业(1)一、名词解释1. 博弈论:是指研究多个个体或团队之间在特定条件制约下的对局中,利用相关方的策略而实施对应策略的学科2 .完全信息:是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。3.静态博弈:是指博弈中参与者同时采取行动,或者尽管参与者行动的采取有先后顺序,但后行动的人并不知道 先采取行动的人采取的是什么行动。4 .动态博弈:指的是参与人的行动有先有后,而且后选择行动的一方可以看到先采取行动的人所选择的行动。5 .非合作博弈:如果参与者之间不可能或者根本没办法达成具有约束力的协议,不能在一个统一的框架下采取行 动的话,这种博弈类型就是非合作

2、博弈。6. 纳什均衡:是对于每一个博弈参与者来说是这样的一个战略组合,即给定其他参与者的战略,每一个参与者的 这个战略能使其期望效用最大化。7. 纯策略:如果在每个给定信息下,只能选择一种特定策略,而且参与者选择了这个策略之后就不会单方面改变 自己的策略,这个策略就是纯策略。8. 纯策略纳什均衡:是指在一个纯策略组合中,如果给定其他的策略不变,在该策略组合下参与者不会单方面改 变自己的策略,否则会使策略组合令人后悔或者不满意。二、请用剔除劣势策略的方法寻找以下博弈的最优策略。要求:(1)写出剔除的步骤或顺序;(2)画出相应的剔除线;(3)给出最优的博弈结果。乙-3-30501-5-1坦白抵赖坦

3、白甲抵赖答:(1)对甲而言,抵赖是劣势策略,用横线划去“抵赖”所对应的行;(2)对乙而言,抵赖是劣势策略,用竖线划去“抵赖”所对应的列;(3)余下的策略组合是 (坦白,坦白),这就是该博弈的最优结果。注:步骤(1) (2)颠倒亦可百事可乐低价高价3可口可乐低价6515高价答:(1)对可口可乐而言,高价是劣势策略,用横线划去“高价”所对应的行;(2) 对百事可乐而言,高价是劣势策略,用竖线划去“高价”所对应的列;(3) 余下的策略组合是 (低价,低价),这就是该博弈的最优结果。注:步骤(1) (2)颠倒亦可员工乙LMR112201n312000231001U员工甲CD答:(1)对员工乙而言,策略

4、 R是明显劣势策略,用竖线划去“ R”所对应的列;(2) 对员工甲而言,在员工乙剔除 R策略之后,C策略是劣势策略,用横线划去“ C”所对应的行;(3) 对员工乙而言,此时劣势的策略是L,用竖线划去“ L”所对应的列;(4) 对员工甲而言,此时劣势的策略是D,用竖线划去“ D”所对应的行;(5) 余下的策略组合是 (U, M ),这就是该博弈的最优结果。三、根据优势策略下划线法找出以下博弈的纯策略纳什均衡,并指出是否存在混合策略纳什均衡。要求:(1)划出相应优势策略的下划线;(2)给出最优的博弈结果。2号厂商XYA1041011号J商B7471答:(1)下划线如图所示;(2)只形成一个纯策略纳

5、什均衡,即( A, X)。(3) 博弈的结果为(10, 4),即1号厂商获得10单位支付,2号厂商获得4单位支付(4) 按照纳什均衡存在性定理,这里不存在混合策略纳什均衡。注:括号的数字和字母顺序不能颠倒2号厂商XY1号J商A1-1-11B-111-1答:(1)下划线如图所示;(2)没有形成一个纯策略纳什均衡。(3)按照纳什均衡存在性定理,这里还存在一个混合策略纳什均衡。注:括号的数字和字母顺序不能颠倒2号厂商WXY730245862205A1号厂商B答:(1)下划线如图所示;(2)形成两个纯策略纳什均衡,即( A, Y)和(B, W)。(3)博弈的结果有两个:(4, 5),即1号厂商获得4单

6、位支付,2号厂商获得5单位支付;(8, 6),即1号 厂商获得8单位支付,2号厂商获得6单位支付。(4)按照纳什均衡存在性定理,这里还存在一个混合策略纳什均衡。注:括号的数字和字母顺序不能颠倒 四、在以下博弈矩阵图中找出哪一个是囚徒困境博弈,并简要解释理由。乙坏心好心坏心1012502甲好心126010039图1-11012110050390100坏心好心坏心好心图1-2乙坏心好心坏心1020300好心0301112图1-3答:(1)利用下划线法找出博弈的纳什均衡,如图所示。(2) 囚徒困境反映的是基于个人理性的个体最佳选择并非集体最佳选择,参与者之间会选择相互“坏心”,而 且对双方而言,(好

7、心,好心)的结果一定要比(坏心,坏心)更好。(3) 在三个博弈中,图1-1不是囚徒困境博弈,因为参与者甲在选择“好心”(即合作)策略时才能实现均衡。图1-2所示的博弈为囚徒困境博弈,因为参与者只有在都选择“坏心”(即不合作)策略时才能实现均衡。图 1-32所示的博弈也不是囚徒困境博弈,因为对乙而言,(坏心,坏心)的结果比(好心,好心)的结果有利。五、博弈分析假设你所在的公司现在的发展虽然还可以,但是未来前景不容乐观,所以老板只能对一个人加薪。如果你和 你的同事之间只有一个人提出来加薪的请求,老板会考虑为提出要求的这个员工加薪,当然不会对那个没有提出 来的员工加薪了。但是假如你和你的同事两个人一

8、起提出来要加薪,那么老板就只有选择同时辞退你们俩。请给出这个博弈的矩阵分析图,并解释你最优的策略。答:该博弈矩阵如下:同事要求不要求要求被辞退被辞退加薪无影响加薪宓响不要求无影响无影响根据下划线方法,在这个博弈中,我们可以找到两个纳什均衡,即(要求,不要求)和(不要求,要求) 这个结果说明,你和同事只能一方提出加薪的要求才可以,同时选择要求加薪的行动只会带来最坏的结果一一都 被辞退。换句话说,你要想获得福利的改进, 就应该先行一步提出来加薪的要求。而假如你看到你的同事首先选择了要求加薪的策略之后,你最好不再提出来这样的要求。博弈与决策平时作业(2)一、名词解释1 .不确定性:就是指经济行为者在

9、事先不能准确地知道自己的某种决策的结果,或者说,只要经济行为主体的一 种决策的可能结果不止一种,就会产生不确定性。2. 最大期望收益法: 就是在事件结果不确定的情况下,应该选择给他带来期望收益”最大的策略。3. 混合策略:如果在每个给定信息下,参与者只能以某种概率选择不同地策略,就称为混合策略。4. 支付均等法:当一个参与者在均衡中应用一个混合策略时,他所得到的支付必须与他在混合策略中所应用的每 一个纯策略的支付相同。5. 子博弈:如果从第一阶段以外的某个阶段开始的后续博弈阶段,也有初始信息集,具备进行博弈所需要的各种信息,能够自成一个博弈,我们就将这个博弈阶段称为原动态博弈的一个“子博弈”。

10、6. 逆向归纳法:从最后一个阶段或最后一个子博弈开始逆推上去,逐步向前倒推以求解动态博弈均衡,这就是逆 向归纳法。7. 承诺:就是对愿意与你合作的人给予回报的方式。8. 空洞威胁:当发出威胁的博弈参与者选择威胁所宣称的行动策略时,对自己并没有好处,这就不可信了,这叫做“空 洞威胁”。二、请用最大期望收益法寻找最优策略。要求:(1)写出计算步骤;(2)给出最优的策略结果。甲乙两家企业,为了市场份额的争夺,在价格定制问题上各有两种纯策略,如图 2-1所示。两家企业都知道自己在各个策略组合下的收益情况,但是并不知道对方的收益。假设甲采取U的概率为0.3,乙采取R的概率为 0.6。1423乙LRU42

11、41D答:(1)当乙采取R策略的可能性为0.6时,采取L策略的可能性为0.4,那么甲据此判断采取自己的策略 U时 所获得的可能的期望收益EU(U)=0.6亥+0.4 =2.4。甲采取自己的策略D时所获得的可能的期望收益 EU(D)=0.6 4+0.4 1=2.8。很显然,甲应该选择策略 D,因为EU(D) EU(U)。(2) 当甲采取U策略的可能性为0.3时,采取D策略的可能性为0.7,那么乙据此判断采取自己的策略 L时 所获得的可能的期望收益EU(L)=0.3 X+0.7 4=3.1。乙采取自己的策略R时所获得的可能的期望收益 EU(R)=0.3 4+0.7)2=2.6。很显然,乙应该选择策

12、略 L,因为EU(L) EU(R)。(3) 最终该博弈的结果就是(D , L),均衡的支付为(4, 4)。三、求解以下博弈的所有纳什均衡。要求:(1)写出计算步骤;(2)给出所有纳什均衡策略。曹操华容道其它路华容道2-2-23关明其它路-212-1答:(1)对该博弈矩阵利用下划线法,发现没有纯策略纳什均衡。(2)假设关羽选择华容道的概率为p,选择另外一条道的概率为 1-p;也假设曹操选择华容道的概率为q,选择另外一条道的概率为1-q。根据支付均等法:对关羽而言,U华容道=U其他路,即2 q+(-2) (1-q)= (-2) q+2 (1-q),可以得到q=1/2。对于曹操而言,V华容道=V其他

13、路,即(-2) p+1 (1-p)=3 p+(-1) (1-p),可以得到p=2/7。该博弈的混合纳什均衡为(2/7, 1/2)。2号厂商XYA1010141号J商B4155答:(1)对该博弈矩阵利用下划线法,发现有两个纯策略纳什均衡(A, X)和(B, Y)。(2)假设1号厂商选择A的概率为p,选择B的概率为1-p;也假设2号厂商选择X的概率为q,选择Y的精品文档概率为1-q。根据支付均等法:对 1 号厂商而言,Ua= Ub,即 10 q+1 (1-q)=4 q+5 (1-q),可以得到 q=2/5。对 2 号厂商而言,Vx= Vy,即 10 p+1 (1-p)=4 p+5 1-p),可以得

14、到 p=2/5。该博弈的混合纳什均衡为(2/5, 2/5)。四、请用逆向归纳法分析以下博弈的可能结果。答:(1)逆向归纳法画图如图所示。(2) 可能的均衡路径为 A U , 1号参与者选A, 2号参与者选U,结果为(20, 20),双方各得到20单 位的报酬。(3) C-Y路径上的报酬(1000, 1000)远大于A U路径上的(20, 20),但是并不能成为均衡。因为 如果1号参与者选择了 C, 2号参与者选择Z就可以获得做大的报酬,并使 1号只能获得0单位报酬。1号参与 者并不能保证2号参与者会选择Z,而且2号即使有这种保证也是不可信的。五、寻找可信的威胁。好心(7,7)1)坏心好心(20, 3)假如有两个博弈参与者,2号威胁1号说,假如1号参与者对他使坏心, 他就会对1号参与者也使坏心。那么在以 下哪些博弈图中,1号会相信2号的威胁?图2-1图2-2

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 其它办公文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号