第十一讲 广延型博弈与反向归纳策略

上传人:wt****50 文档编号:54622027 上传时间:2018-09-16 格式:PPT 页数:73 大小:263KB
返回 下载 相关 举报
第十一讲  广延型博弈与反向归纳策略_第1页
第1页 / 共73页
第十一讲  广延型博弈与反向归纳策略_第2页
第2页 / 共73页
第十一讲  广延型博弈与反向归纳策略_第3页
第3页 / 共73页
第十一讲  广延型博弈与反向归纳策略_第4页
第4页 / 共73页
第十一讲  广延型博弈与反向归纳策略_第5页
第5页 / 共73页
点击查看更多>>
资源描述

《第十一讲 广延型博弈与反向归纳策略》由会员分享,可在线阅读,更多相关《第十一讲 广延型博弈与反向归纳策略(73页珍藏版)》请在金锄头文库上搜索。

1、第十一讲 广延型博弈与反向归纳策略,广延型博弈适合于分析动态博弈过程,其强调的重点在行动的时序性,以及参与人决定策略时所拥有的信息集。 第一节 广延型博弈的定义与形式 一、广延型博弈的定义 信息完美(perfect information),是指每一个参与人在其作决策时,对于以前所发生的事件具有完全的信息。,广延型博弈构成要素,(1)决策点与决策分枝的结构,在初始决策点与最终结局点之间不存在任何闭环(closedloops); (2)清楚地指明什么决策点属于哪一个参与人; (3)在自然决策点上选择的概率是公共知识; (4)参与人作决策时所依据的信息集;信息集把参与人在某一时刻的所有决策点分成若

2、干类; (5)在博弈的终极点上每一个参与人的收益,二、广延型博弈的形式,广延型博弈是以“决策树”或“博弈树” 的形式来表达的。,1,2,2,(2,0),(2,1),(1,0),(3,1),L,R,M,N,M,N,三、广延型博弈的规则,第一,初始点没有一条箭头指向它;对其他所有箭头,都只有一条箭头指向它。 第二,如果我们从某一点向初始点返回,我们就不可能再通过迂回的途径回这一点,我们只能按反向逐次返回原点。,第二节完美信息广延(动态)博弈,一、特征。 (一)决策有先后顺序 (二)关于博弈进程的信息是不对称的 后决策者拥有更多信息。,(三)具有完美信息: 即参与人决策时完全了解之前的博 弈过程的信

3、息。 (四)动态博弈至少有两个阶段; 阶段: 参与者在某一时点进行的一次决策。,二、可信性:,先决策者对后决策者行为的信任性。 即先决策者是否相信后决策者是否采取 有利的(许诺)或不利的(威胁)行为。,例1:父女博弈。,女儿交了一个父亲不喜欢的男友, 父亲威胁说:“你如果不断绝与他的关系,我与你断绝关系。” 女儿是否相信父亲的威胁?这一博弈可如下表示:,女儿,父亲,断绝,交往,不交往,不断绝,(1,-1),(2,1),(0,1),作为女儿,知道父亲断绝与女儿的关系 损失是非常大的, 因此,对父亲来讲,即使女儿不听话,“断 绝”是下策,应被剔除掉:,聪明的女儿在看到父亲的威胁不可信时, 一定不会

4、选择“不交往”,父亲的威胁是不可信的。,因此,所谓不可信的威胁, 就是指一旦采取该策略, 给他本人带来的收益 并非最大的策略,例2:开金矿(二阶段):,参与人2欲开采一价值4万元的金矿, 但缺乏1万资金,参与人1恰拥有 一万元资金。参与人2对参与人1说: “如果你把钱借给我, 我与你平分开金矿所得。” 参与人1是否应相信2把钱借给他?,在参与人借的资金开发金矿后, 平分所得是其下策,故应被剔除:,这时,“借”成为参与人1的下策, 故应被剔除:,参与人2的许诺是不可信的。,所谓不可信的许诺, 就是指一旦采取该策略, 给他本人带来的收益 并非最大的策略,例3:开金矿(三阶段),在有完善的法律制度的

5、条件下, 参与人1可以在参与人而不信 守承诺的情况下选择与其打官司, 这样就变成了一个三阶段博弈。 这时参与人1是否应相信2的承诺?,1,2,分,借,不借,不分,(2,2),(0,4),(1,0),1,不打,打,(1,0),在参与人2不信守承诺的情况下, 不打官司是参与人1的下策故应被剔除,由于参与人1必定会选择打官司, 故不分是参与人2的下策因此被剔除,在这种情况下,参与人1知道参与人2 必定会其起平分收益,不借则变成了 他的下策,剔除之。,在法律制度建立后, 参与人2 的许诺变为可信 在法律健全时, 既可保障社会公平, 又可提高社会经济活动效率。,所谓可信的许诺(威胁), 就是指一旦采取该

6、策略, 给他本人带来的收益一定 最大的策略,三、子博弈和逆推归纳法,(一)子博弈: 从一个博弈的某个阶段开始的 能够自成一个博弈的后续阶段。 它必须有一个初始信息集, 具备进行博弈的需要的各种信息。,(二)逆推归纳法:,从动态博弈的最后一个阶段 或最后一个子博弈开始, 逐步倒推以求解动态博弈的方法。,四、子博弈精炼纳什均衡,如果动态博弈中各参与人 的策略在动态博弈本身和 所有子博弈中都构成一个 纳什均衡,则称该策略组合为 一个子博弈精炼纳什均衡。,例4.讨价还价博弈(三阶段),设两人就如何分割1万元进行谈判, 规则如下:首先由1提出 一个分割比例S1,2可以接 受也可以拒绝,如果2拒绝, 则提

7、一个分割比例S2, 这时1可以接受, 也可以拒绝,如果拒绝, 则出价S则2必须接受,假设每经过一轮要有一定的折扣, 折扣因子为,。,的大小与谈判者的耐心, 通货膨胀以及资金的时间 价值等有关。,1,2,接受,出S1,不接受出S2,(S1,1-S1),(2S,2(1-S),(S2,(1-S2),1,接受,不接受出S,解:展开表示为,应用逆推归纳法。 第三阶段: 1出S,2必须接受,因此S=1,第二阶段:2知道在第三阶段 1必出S=1,因此,为了避免 这一情况的出现,自己出的S2 (即1的所得)应满足:,这时博弈树变为,第一阶段,如果1的出价S1满足 1-S1(1-) 即S11-+2 则2不会拒绝

8、,因此,1的最优出价 S1=1-+2 这时 S1=1-+ 22 避免进入下一段谈判, 双方获得的收益均达到最大。 ¥,最终的博弈路径 (子博弈精炼纳什均衡)为,例5.求下列四阶段动态博弈 的子博弈精炼纳什均衡。,第三节 有同时选择的动态博弈,一、特征: 在博弈的某些阶段, 有多个参与者同时进行决策,例1,D,当博弈进行到第三阶段时,1,2必须同时作了决策, (或者说,每个参与人在决策时,并不知道对方作出了什么选择)。 这样在第三阶段构成了一个策略(静态)博弈(二人零和博弈)。,这一策略(静态)博弈的收益矩阵为:,这个策略(静态)博弈有唯一的 一个混合策略纳什均衡: ( (1/2,1/2), (

9、1/2,1/2) , 其带给双方的期望收益(0,0) 这样这个博弈可以简化为,继续运用逆推归纳法, 易求得子博弈精炼纳什均衡为,二、求解方法,(一)按逆推归纳法的思路进行求解。 (二)对同时选择构成策略(静态)博弈的阶段,分别应用策略(静态)博弈求解法求解 (三)将求解结果分别代入原博弈简化, 再按逆推归纳法求解。,例2,银行挤兑,两客户在银行各存100元,银行 将这200元投资于一个长期项目, 如果在项目到期前抽回资金, 则只能收回140元(记为日期1), 如果到期后(日期2)再收回投资, 则可回收本利280元。,客户抽回存款的日期也是这两种, 这一博弈可扩展表示如下:,解:应用逆向归纳法的

10、思想求解。 在日期2(即第二阶段), 两客户决策构成了一个策略(静态)博弈, 其正规型表示如下,日期2,显然,这一策略(静态)博弈有唯一的 纳什均衡为(抽,抽),其收益分别为140,140。 将这一结果代入原博弈, 可简化为:,它又构成了一个策略(静态)博弈 其正规型表示如下,日期1,这一博弈有两个纯策略纳什均衡 (抽,抽)和(不抽,不抽), 还有一个混合策略纳什衡, 即各以4/7的概率在第1日 期抽回资金。,结果分析:,1.当信用环境非常好的情况下, 客户的选择是在第1日期 “不抽”,在第二日期“抽回”, 双方获利最大(140,140),2.当信用环境非常不好的情况下, 客户的选择是在第1日

11、期“抽”, 在双方获利最小(70,70),3.当信用环境一般的情况下, 客户数量很大时,将有4/7的 客户在第1日期抽回资金。 或者说,客户将抽回4/7的资金,例3,关税与不完全国际竞争 设有两个国家1,2,分别 有两上企业(分别记为企业1, 企业2),企业1,2生产既内 销又出口的相互竞争商品, 确定国家1,2的关税策略和 企业1,2的产量策略。,例3,关税与不完全国际竞争,设有两个国家1,2,分别有两上企业(分别记为企业1,企业2), 企业1,2生产既内销又出口的相互竞争商品,确定国家1,2的关税策略和企业1,2的产量策略。,设Qi为国家i的市场商品总量,反需求函数Pi=a-Qi,企业i生产hi个单位供内销,ei单位供出口,因此Qi=hi+ej(ij)单位成本为常数C, 国家i的关税率为ti,设设首先由两国政府同时制定关税率ti, 企业1、2根据t1,t2同时决定各自内销和 出口的产量(h1,e1)和(h2,e2)。,解:企业以利润最大化为目标, 利润函数为,国家以社会福利最大化 为目标,包括消费者剩 余,本国企业的利润和 国家关税三部分,社会 福利函数为:,应用逆时归纳法来分析此博弈 先从第二阶段开始, 可设t1,t2已定,求maxi的解,再回到第一阶段两国之间的博弈。 将上述结果分别代入wi得,即两国的最佳关税选择为,将这一结果代入得,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 建筑机械

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号