于三章完全且完美动态博弈

上传人:kms****20 文档编号:51267363 上传时间:2018-08-13 格式:PPT 页数:36 大小:263.50KB
返回 下载 相关 举报
于三章完全且完美动态博弈_第1页
第1页 / 共36页
于三章完全且完美动态博弈_第2页
第2页 / 共36页
于三章完全且完美动态博弈_第3页
第3页 / 共36页
于三章完全且完美动态博弈_第4页
第4页 / 共36页
于三章完全且完美动态博弈_第5页
第5页 / 共36页
点击查看更多>>
资源描述

《于三章完全且完美动态博弈》由会员分享,可在线阅读,更多相关《于三章完全且完美动态博弈(36页珍藏版)》请在金锄头文库上搜索。

1、第三章 完全且完美动态博弈博弈种类:静态,动态;完全信息,不完全信息;完美信息,不完美信息 3.1 动态博弈的表示法和特点n动态博弈根本特征是各博弈方不是同时 的,而是先后、依次进行选择或行动。n信息不对称:后行为的博弈方有更多的 信息帮助自己选择行为。n具有较多信息就一定有较好结果并不总 是成立;n单人博弈,两人博弈n完美博弈与不完美博弈3.1.1 阶段和扩展形(扩展式)表示n各博弈方选择行动有先后次序,各博弈方的选 择行动会形成依次相连的时间阶段,因此,动 态博弈中一个博弈方的一次选择行动常称为一 个“阶段”(stage)。n动态博弈中也可能存在几个博弈方同时选择的 情况,这时这些博弈方的

2、同时选择构成一个阶 段。n一个动态博弈至少有两个阶段。动态博弈又称 “多阶段博弈”(multistage games),又称 “序列博弈”(“序贯博弈”)(sequential games)。n n通过选择节点、从选择节点出发表示博弈方各 种可能选择的线段,以及博弈终端处的得益数 组表示动态博弈的方法。这种表示法称为“扩 展形”(“扩展式”),“博弈树”。n扩展式可以反映动态博弈中博弈方的选择次序 和博弈的阶段,因此是表示动态博弈的最佳方 法。因此,动态博弈有时被称为“扩展式博弈” (extensive form game)n枝n信息集3.1.2 动态博弈的基本特点n动态博弈的策略和结果n静态

3、博弈:博弈方一次性同时选择的行动(行 为)就是博弈方的策略,这些策略的策略组合 ,以及所对应的各方得益,就是博弈的结果。n动态博弈:动态博弈博弈方决策的内容,也是 决定博弈结果的关键,不是博弈方在单个阶段 的行为,而是各博弈方在整个博弈中轮到选择 的每个阶段,针对前面阶段的各种情况作相应 选择和行为的完整计划,以及由不同博弈方的 这种计划构成的组合。这种计划就是动态博弈 中博弈方的“策略”。n动态博弈的结果:n 首先是指各博弈方上述类型的策略构成的 策略组合。n 其次,是各博弈方的策略组合形成的一条 联接各个阶段的“路径”(path)。n 最后,实施上述策略组合的最终结果,落 实到上述路径终端

4、处得益数组中的数字。n在一个动态博弈中,博弈的结果包括双方(多 方)采用的策略组合,实现的博弈路径和各博 弈方的支付(得益)。n动态博弈的非对称性n先后次序,且后行动者能观察到此前选择行动 博弈方的选择行动,地位是不对称的。同样 存在,信息综合症。 3.2 可信性(可信度)和纳什均衡的问题n所谓可信性是指动态博弈中先行为的博 弈方是否该相信后行为的博弈方会采取 对自己有利的或不利的行为。n后行为方将来会采取对先行为方有利的 行为相当于一种“许诺”,而将来会采取 对先行为方不利的行为相当于一种“威胁 ”,因此我可将可信性分为“许诺的可信 性”和“威胁的可信性”。n开金矿: 3.2.1 相机选择和

5、策略中的可信性问题n动态博弈中,博弈方的策略是他们自己预先设 定的,在各个博弈阶段,针对各种情况的相应 行动选择的计划。这种策略实际上没有强制力 ,而且实施起来有一个过程,因此只要符合博 弈方自己的利益,他们完全可以在博弈过程中 改变计划。我们称这种问题为动态博弈中的“ 相机选择”(contingent play)问题。n相机选择的存在使得博弈方的策略中,所设定 的各个阶段、各种情况下会采取行为的“可信 性”(credibility)有了疑问。n乙的策略:“第一阶段借,当甲第二阶段选择不分时,第三阶段选 择打”,甲的策略“第二阶段无条件分”,构成纳什均衡。n 内在不稳定性:“不可信的”incr

6、edible“空头威胁”(empty threats)n先来后到:1122进 不进 进 不进(0,10) (0,10)打 不打 打 不打 (-3,6) (5,5) (-3,6) (5,8)先来后到博弈 先来后到不可信博弈3.2.2 逆推归纳法(逆向归纳法) n逻辑基础:动态博弈中先行动的理性的 博弈方,在前面阶段选择行动时,必然 会考虑后行动博弈方在后面阶段中将会 怎样选择行动,只有在博弈的最后一个 阶段选择的,不再有后续阶段牵制的博 弈方,才能直接作出明确选择。而当后 面阶段博弈方的选择确定以后,前一阶 段博弈方的行动也就容易确定了。n方法:从动态博弈的最后一个阶段开始分析, 每一次确定所分

7、析阶段博弈方的选择和路径, 然后再确定前一个阶段的博弈方选择和路径。 逆推归纳到某个阶段,那么这个阶段及以后的 博弈结果就可以肯定下来,该阶段的选择节点 等于一个结果终端。我们甚至可以用不包括该 阶段与其后所有阶段博弈的等价博弈来代替原 来的博弈。n方法:就是从动态博弈的最后一个阶段或最后一 个子博弈开始,步向前倒推以求解动态博弈的方 法.n开金矿:n先来后到:112进 不进 进 不进(0,10) (-3,6) (0,10)打 不打 (-3,6) (5,5) 先来后到博弈 n逆推归纳法把多阶段动态博弈化为一系列的单 人博弈,通过对一系列单人博弈的分析,确定 各博弈方在各自选择阶段的选择,最终对

8、动态 博弈结果,包括博弈的路径和各博弈方的得益 等作出判断,归纳各个博弈方各阶段的选择则 可得到各个博弈方在整个动态博弈中的策略。n逆推归纳法确定的各个博弈方在各阶段的选择 ,都是建立在后续阶段各个博弈方理性选择的 基础之上,因此自然排除了包含不可置信的威 胁或承诺的可能性,因此得出的结论是比较可 靠的,确定的各博弈方的策略组合是稳定的。3.3 子博弈和子博弈完美纳什均衡 n3.3.1 子博弈n定义:子博弈即能够自 成一个博弈的某个动态 博弈的从其某个阶段开 始的后续阶段,它必须 有一人初始信息集,且 具备进行博弈所需要的 各种信息3.3.2 子博弈完美纳什均衡n定义1: 如果在一个完美信息的

9、动态博弈中, 各博弈方的策略构成的一个策略组合满足,在 整个动态博弈及它的所有子博弈中都构成纳什 均衡,那么这个策略组合称为该动态博弈的一 个“子博弈完美纳什均衡”。n定义2:如果动态博弈中各博弈方的策略在动 态博弈本身和所有子博弈中都构成一个纳什均 衡,则称该策略组合为一个“子博弈完美纳什 均衡”。满足条件:n1.既是纳什均衡,从而具有策略稳定性;n2.又不能包含任何的不会信守的许诺或 威胁,nSubgame perfect Nash equilibrium 子博弈精 炼纳什均衡(Selton,1965)泽尔腾n目的:将不可置信的威胁策略的纳什均衡从均 衡中剔除,从而给出动态博弈结果的一个合

10、理 预测。n与纳什均衡的根本不同之处:能够排除均衡策 略中不可信的威胁或承诺,因此是真正稳定的 。n n子博弈完美纳什均衡本身也是纳什均衡,是比 纳什均衡更强的均衡 注意点:n第一:在动态博弈中强调要求各博弈方的 策略对每阶段每种可能的情况都设定一 个行动方案;n第二:在分析动态博弈时,必须始终假定和 强调所有博弈方都有是理性的和不会犯 错误.3.4.1 寡头的Stackelberg模型- - 动态的寡头市场产量博弈 n寡头市场两厂商,一方强一方弱,决策内容是产量n产量由较强的一方先进行选择,较弱方则根据较强 一方的产量选择自己的产量n领先企业1,追随企业2n决策内容:产量的选择,无数个,扩展

11、式,得益函 数(支付函数)n策略空间都是中的所有实数n最大限度产量,企业生产能力中较低的一个水平n同古诺模型惟一区别只是两博弈方的选择是先后而 不是同时厂商1是领头企业,厂商2追随者,生产同 质产品,先后决定各自的产量;n产量分为q1、q2,总产量Q= q1+q2nP是产品价格=市场出清价格,P是所有厂商生 产的总产量的减函数,即:P=P(Q)=a-Q=8- Q,说明当一个厂商增加产出时,它不仅对自己 的产出降低价格,而且同时降低价格的行为被 所有别的厂商接受;n两厂商的生产都无固定成本,且每增加一单位 产量的边际生产成本相等C1=C2=2 生产q1、q2产量的成本为2q1、2q2;nU1=

12、q1P(Q)-C1q1= q18-(q1+q2)-2q1=6q1q1q2 q1q1nU2= q2P(Q)-C2q2= q28 (q1+q2) 2q2=6q2 q1q2 q2q2采用逆向归纳法:n先分析第二阶段厂商2的决策,厂商1的q1已决定,并且厂商2 知道q1,即对厂商2来说相当在给定q1的情况下求使其U2实现最 大化的q2,q2满足:n6 q1 2q2=0 q2=3-q1 /2n厂商1在选择q1时已知道厂商2按上式确定其产量,则将q2代入 :nU1 =6q1 - q1 q2 - q1q1 =3q1-q1q1 /2 nq1=3 q2 =1.5 U1= 4.5 U2= 2.25 p=33.4.

13、2 劳资博弈n里昂惕夫(Leontief,1946):代表劳资双方的工会和企业 之间的博弈n该博弈模型假定工资完全由工会决定,企业只是根据工会要 求的工资高低决定雇佣工人的数量。n工会追求的目标:工资率,就业数n企业:假设收益 ,企业只有劳动成本,总成本 , 利润函数n假定博弈过程:先由工会确定工资率,再由企业据以决定劳 动数n假定工资率和雇佣数是连续可分的,因此双方都有无限多种 选择。工会和企业的得益分别是效用 ,利润3.4.3 讨价还价博弈Bargaining 议价n三回合讨价还价n两个人1,2 分享10000元n规则:n1提出方案,2接受,结束;拒绝,继续进行n2提出方案,1接受,结束;

14、拒绝,继续进行;n1提出方案,2必须接受,结束。n谈判费用,利息损失等,消耗系数n第一回合:1 S1,10000S1 ; S1,10000S1 2 S2,10000S2;3 ;3.5 有同时选择的两阶段动态博弈n博弈中存在在同一阶段有两个或两个以 上博弈方同时选择的情况;n不是完美信息,介于完美信息和非完美 信息间。案例:银行挤兑的成因和预防n假定一银银行,只有两存户户各存100万,银银行 的全部资资金就是这这200万。银银行拿总总数为为 200万的这这笔钱钱做投资资。项项目完成投资资收回 280万,银银行全部偿还给偿还给 存户户,每个存户户得 到140万。但未到期抽回存款,则只能收回 140元,银银行只有拿出140万付给储户给储户 。n客户日期两种:日期1-未到期;日期2到期n如果双方同时提前抽调存款,每人只能得70万;n如果双方期满支取存款,每人可得140万;n如果只有一方提前支取,那么他得到原来的存额 100万,而银行被迫提前抽回投资,可动用资金只 有140万,而另一储户期满时来兑现其存款时,银 行就要破产,他只能得到40万的补偿;n 储户乙抽回 不抽抽回 储户甲不抽银行挤兑-日期1n 储户乙抽回 不抽抽回 储户甲不抽银行挤兑-日期270,70 100,4040,100

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号