姜启源等编《数学模型》第四版-课件-第十一章博弈模型

上传人:F****n 文档编号:107460316 上传时间:2019-10-19 格式:PPT 页数:80 大小:1.70MB
返回 下载 相关 举报
姜启源等编《数学模型》第四版-课件-第十一章博弈模型_第1页
第1页 / 共80页
姜启源等编《数学模型》第四版-课件-第十一章博弈模型_第2页
第2页 / 共80页
姜启源等编《数学模型》第四版-课件-第十一章博弈模型_第3页
第3页 / 共80页
姜启源等编《数学模型》第四版-课件-第十一章博弈模型_第4页
第4页 / 共80页
姜启源等编《数学模型》第四版-课件-第十一章博弈模型_第5页
第5页 / 共80页
点击查看更多>>
资源描述

《姜启源等编《数学模型》第四版-课件-第十一章博弈模型》由会员分享,可在线阅读,更多相关《姜启源等编《数学模型》第四版-课件-第十一章博弈模型(80页珍藏版)》请在金锄头文库上搜索。

1、第十一章 博弈模型,11.1 进攻与撤退的抉择 11.2 让报童订购更多的报纸 11.3 “一口价”的战略 11.4 不患寡而患不均 11.5 效益的合理分配 11.6 加权投票中权力的度量,单一决策主体,决策变量目标函数约束条件,决策主体的决策行为发生直接相互作用 (相互影响),博弈模型,非合作博弈,合作博弈,三要素,多个决策主体,决策问题(Decision Problem),军事、政治、经济、企业管理和社会科学中应用广泛,1944年6月初,盟军在诺曼底登陆成功. 到8月初的形势:,背景,11.1 进攻与撤退的抉择,双方应该如何决策 ?,模型假设,博弈参与者为两方(盟军和德军),盟军有3种使

2、用其预备队的行动:强化缺口,原地待命,东进;德军有2种行动:向西进攻或向东撤退.,博弈双方完全理性,目的都是使战斗中己方获得的净胜场次(胜利场次减去失败场次)尽可能多.,完全信息静态博弈,共同知识(以上信息双方共有),双方同时做出决策,博弈模型,博弈参与者集合N=1,2(1为盟军,2为德军),用u1(a1,a2)表示对盟军产生的结果,即净胜场次,称为盟军的效用函数.,盟军行动a1 A1=1,2,3(强化缺口/原地待命/东进); 德军行动a2 A2=1,2(进攻/撤退)。 (行动:即纯战略),支付矩阵 (Payoff Matrix),完全竞争: 零和博弈 (常数和博弈),u2(a1,a2)对应

3、-M,博弈的解的概念:纳什均衡 (NE: Nash Equilibrium),不存在(纯)NE,(纯战略)纳什均衡,Nash: 1994年获诺贝尔经济学奖,NE: 单向改变战略不能提高自己效用,即每一方的战略对于他方的战略而言都是最优的, 称为最优反应.,(纯)NE: a*=(a1*, a2*) =(2, 2),非常数和博弈(双矩阵表示),混合战略(策略:Strategy),盟军的混合战略集,期望收益,盟军,德军,S1=p=(p1, p2, p3) | ,德军的混合战略集,S2= q=(q1, q2) | ,完全信息 静态博弈 有限博弈 矩阵博弈 (2人) 零和博弈 常数和博弈,模型求解,理性

4、推理:不管自己怎么做,另一方总是希望尽量使自己得分尽量低. (二人零和博弈,完全竞争),盟军,德军,线性规划,从一个给定的战略中期望得到的赢得,总是采用该策略时他们可能得到的最坏的赢得!,盟军可以用min pM来衡量策略p的好坏,max U1(p) = min pM,min U2(q) = max MqT,德军可以用max MqT来衡量策略q的好坏,(p*, q*): 混合(策略)纳什均衡(Mixed NE),p2*=3/5,p3*=2/5,q1*=1/5,q2*=4/5,最优值均为2/5,占优(dominate):盟军的行动2占优于1 (前面的非常数和博弈M类似),混合策略似乎不太可行! 但

5、概率可作为参考. -现实:盟军让预备队原地待命(行动2),而德军没有选择撤退(行动2),结果德军大败.,模型评述,博弈规则至关重要的,如参与人决策的时间顺序、决策时拥有哪些信息等.,多人(或非常数和)博弈问题,一般不能用上面的线性规划方法求解,而通过纳什均衡的定义求解.,小结:博弈模型的基本要素,参与人,理性假设,行动顺序(静态、动态),信息结构(完全、不完全),行动空间(及战略空间),效用函数,参与者完全理性(最大化效用),其他因素,纳什均衡,单向改变战略不能提高自己效用,11.2 让报童订购更多的报纸,报童模型回顾,订购价w,零售价p,处理价v(pwv0) 需求量:密度函数f(x)、分布函

6、数F(x), F(0)=0,订购Q份报纸,期望销售量为,期望存货量,期望利润,最优订购量Qr, Qr(w),11.2 让报童订购更多的报纸,问题,假设报社报纸成本价为c,wcv, w*,完全信息动态博弈:常称Stackelberg Game (两阶段) 子博弈完美均衡: (w*,Qr(w),一般w*c Qr(w*) Q* 整体利润有损失,能否改善(协调)?,假设报社与报童联合,整体利润最大,价格折扣协议模型,折扣方案wd(Q) 下,报童效用(期望利润),达到协调,假设报社与报童联合,整体期望利润,关于Q的减函数(非线性),,报童利润 ,报社利润 利润的任意分配比例都可达到,模型一 回收价格协议

7、,原订货量,达到协调,整体最优,b,报童利润 ,报社利润 利润的任意分配比例都可达到,回收价b (pwbv),回收协议模型,模型二 回收数量协议,报社回收,达到协调,报童回收,,报童利润, 报社利润; 利润任意分配都可达到,按批发价回收,比例为,报童利润,回收协议模型,模型评述,协议参数的确定: 不能单方决定 双方谈判(合作博弈),还有很多其他类型的协议,也可以达到协调,一种更简单的协议 批发价w成本c 收取一定加盟费,如何评价比较协议的优缺点?,是否能达到协调,是否能任意分配利润,协议执行成本有多高,11.3 “一口价”的战略,背景,为了节省“讨价还价”时间,考虑“一口价”模式.,双方同时报

8、价:若买价卖价,则以均价成交; 否则不成交.,问题,双方应如何报价?,双方总能成交吗?(效率估计),“讨价还价”很浪费买卖双方的宝贵时间.,模型假设与建立,卖方知道物品对自己的价值,但买方不知道.,买方知道物品对自己的价值,但卖方不知道.,双方都知道(如猜出)对方价值的分布信息.,卖方价值vs, 买方价值vb, 均服从U0,1 (均匀分布),卖方报价ps, 买方报价pb, pb ps时成交价p (pb+ps)/2,成交效用:卖方U1=p- vs, 买方U2= vb p; 不成交: 0,双方完全理性(最大化自己的期望效用 ).,以上为双方的共同知识.,卖方报价ps ps(vs) 买方报价pb p

9、b(vb),双方战略,战略组合( ps(vs), pb(vb) 何时构成均衡?,定义在0,1区间上、取值也在0,1区间上的非减函数.,不完全信息静态博弈(静态贝叶斯博弈),贝叶斯纳什均衡,单向改变战略不能提高自己效用.,信息非对称(不完全信息),模型假设与建立,均衡条件,具体战略(函数)形式不同,均衡就可能不同.,单一价格战略,卖方: 买方:,双方战略互为最优反应,所以构成贝叶斯纳什均衡!,模型假设与建立,单一价格战略效率为,x(1-x)/0.50.5,x0.5 效率最大(1/2),对给定的(vs, vb),当vsvb时称为交易是有利的.,在给定的战略组合下,有利的全部交易中能够 实际发生交易

10、的比例称为该战略的交易效率.,单一价格战略,线性价格战略,卖方报价ps(vs) as+csvs; 买方报价pb(vb) ab+cbvb,双方战略互为最优反应, 构成贝叶斯纳什均衡!,买方:,买方: (同理),不成立时也适用(不唯一),线性价格战略,评述,效率(线性价格战略),效率为 1/4*3/4 =9/16,可以证明,线性均衡效率最大.,不存在使所有有利的交易都成交的均衡战略组合.,信息的不完全(非对称信息)降低了交易效率.,包含了交易价值(交易给双方带来的效用之和,即vbvs) 大于1/4的所有有效交易.,11.4 不患寡而患不均,最后通牒博弈(Ultimatum Game),问题,甲乙两

11、人就分配笔钱(如100元)进行博弈.,甲首先提出分配方案 (分给乙的钱: s).,现实中的情况果真如此吗? 多数s总额的4050% s越小,越容易被乙拒绝,完全信息动态博弈:均衡结果是(s=0,乙接受); 如果要求严格均衡,则s=分钱.,如果乙接受,则按此分配 ;否则双方什么也得不到.,公平:利他互惠?,自私: 理性 非理性?,模型假设与建立,1. 每个参与者都喜欢对所有参与者公平的结果;,2. 每个参与者自己受到不公平对待时的“愤怒”,胜过其他参与者受到不公平对待时的“愧疚”,否则,xixj=1-xi时, i(x)xi-i (xi -xj)= i -(2i -1)xi 关于xi的系数非正 (

12、过分“愧疚” ),效用函数,财富总额为1 接受提议:甲乙所得x1=1-s, x2= s;否则:x1=x2=0,模型求解,如果不接受,则x1=x2=0; U1(s)=U2(s)=0 .,若s1/2,则x2 x1,乙的最优反应,乙的最优反应(给定s),如果接受,则x1=1-s, x2=s.,若s1/2,则x2x1,U2(s)0,1/20,易知,(s1/2, 两者一致),模型求解,Case 1: 甲知道乙的2,若s1/2,则x2 x1,甲的决策,s=1/2时达到最大值1/2,甲的决策(只需考虑乙接受情形),均衡: (s*,接受),s*严格小于50%; 是乙的“愤怒”系数2的增函数.,模型求解:甲的决

13、策,Case 2: 甲不知道乙的2, 但知道2知道分布F(2),若s1/2,则x2 x1,甲的决策,若s1/2,则x2 x1,U1(s)=1-s-1(2s-1) 同前,期望效用,乙接受概率,s*,模型解释,甲永远不会提出大于/的方案s,乙拒绝过小的方案s,很好地解释了实际中的最后通牒博弈,乙接受概率随s增加不减,参考文献,11.5 效益的合理分配,例,甲乙丙三人合作经商,若甲乙合作获利7元, 甲丙合作获利5元,乙丙合作获利4元, 三人合作获利11元. 又知每人单干获利1元. 问三人合作时如何分配获利?,记甲乙丙三人分配为,解不唯一,(5,3,3) (4,4,3) (5,4,2) ,(1) Sh

14、apley合作对策, I,v n人合作对策,v特征函数,n人从v(I)得到的分配,满足,v(s) 子集s的获利,公理化方法,s子集 s中的元素数目, Si 包含i的所有子集,由s决定的“贡献”的权重, i 对合作s 的“贡献”,Shapley合作对策,三人(I=1,2,3)经商中甲的分配x1的计算,1/3 1/6 1/6 1/3,1 1 2 1 3 I,1 7 5 11,0 1 1 4,1 6 4 7,1/3 1 2/3 7/3,x1=13/3,类似可得 x2=23/6, x3=17/6,1 2 2 3,合作对策的应用 污水处理费用的合理分担,污水处理,排入河流.,三城镇可单独建处理厂,或联合

15、建厂(用管道将污水由上游城镇送往下游城镇).,Q污水量,L管道长度 建厂费用P1=73Q0.712 管道费用P2=0.66Q0.51L,污水处理的5 种方案,1)单独建厂,总投资,2)1, 2合作,3)2, 3合作,4)1, 3合作,总投资,总投资,合作不会实现,5)三城合作总投资,D5最小, 应联合建厂,建厂费:d1=73(5+3+5)0.712=453 12 管道费:d2=0.66 50.51 20=30 23 管道费:d3=0.66 (5+3)0.51 38=73,D5,城3建议:d1 按 5:3:5分担, d2,d3由城1,2担负,城2建议:d3由城1,2按 5:3分担, d2由城1担负,城1计算:城3分担 d15/13=174C(1),不同意!,D5如何分担?,特征函数v(s)联合(集s)建厂比单独建厂节约的投资,三城从节约投资v(I)中得到的分配,Shapley合作对策,计算城1从节约投资中得到的分配x1,x1 =19.7,城1 C(1)-x1=210.4, 城2 C(2)-x2=12

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 幼儿/小学教育 > 小学教育

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号