博弈论及其应用-课节4

上传人:cl****1 文档编号:486796899 上传时间:2024-01-13 格式:DOCX 页数:22 大小:104.73KB
返回 下载 相关 举报
博弈论及其应用-课节4_第1页
第1页 / 共22页
博弈论及其应用-课节4_第2页
第2页 / 共22页
博弈论及其应用-课节4_第3页
第3页 / 共22页
博弈论及其应用-课节4_第4页
第4页 / 共22页
博弈论及其应用-课节4_第5页
第5页 / 共22页
点击查看更多>>
资源描述

《博弈论及其应用-课节4》由会员分享,可在线阅读,更多相关《博弈论及其应用-课节4(22页珍藏版)》请在金锄头文库上搜索。

1、教案工教学题目:学时数2(第二章完全信息静态博弈,23)教学目的和要求:理解Nash均衡的表达。掌握Nash均衡的应用。教学基本内容:基本方法:理解Nash均衡的表达。掌握Nash均衡的应用教学重点与难点:重点在于Nash均衡的应用;难点在于帔.6的讨论教学过程:1. 课前复习理解博弈均衡的概念。2. 讲授新课:3. 2.2Nash均衡我们再以囚徒困境为例讨论如下:囚徒B坦白囚徒B抗拒囚徒A坦白-6,-60,-10囚徒A抗拒-10,0-1,-1显然,不论囚徒A选择坦白还是抗拒,囚徒B的最优策略都是坦白;不论囚徒B选择坦白还是抗拒,囚那的最优策略都是坦白;由收益函数:UA(抗拒,坦白)=T0;U

2、A(坦白,坦白)=-6;UA(抗拒,抗拒)=1;UA(坦白,抗拒)=0。UB(抗拒,坦白)=0;UB(坦白,坦白)=-6;UB(抗拒,抗拒)=T;UB(坦白,抗拒)=-10。UA(坦白,O)UA(抗拒O);Ub(。坦白)Ub(。抗拒);这时,“坦白”策略就成为囚徒A,B的严格优策略,如果一个博弈中的所有局中人都存在严格优策略,那么由这些严格优策略组成的局势,就是该博弈的惟一均衡解。在囚徒困境中的囚徒A,B的严格优策略“坦白”组成的局势(坦白,坦白)就是该博弈的惟一均衡解。记Si(4,S2,L,01,s1,L,Sn),则局势s(%,S2,L,0i,4,Si1,L,Sn)(Si,si)SSLS。定

3、义2-2(严格优策略)在n人博弈G(N,S,U)中,除局中人i外,其余n1个局中人的所有可能的局势Sj(S1,s2,L,s(1,si1,L,sn),局中人i存在着一个自己的策略Si,使得对一切的,Si(SiS*),有Ui(Si,Si)Ui(Si,S2,L,Si1,0,S1,L,Sn)uL,sL,s)q(S,Si),则称Si*6是局中人的严格优策略。囚徒A,B在囚徒困境中都有自己白铲格优策略“坦白;组成的局势(坦白,坦白:为该博弈的惟一均衡解。这种现象是一般规律吗?命题2 1 在n人博弈G(N,S,U)中,如果每一个局中人都有自己的严格优策略si (i 1,L , n),那么,n个局中人每人的严

4、格优策略组成的局势(Si, L , Si, L , S|n)是博弈G(N, S,U )的惟一均衡解并称(Si,L,Si,L,Sn)为严格优策略均衡局势或严格优策略均衡解证明:由以上的讨论,n个局中人的严格优策略组成的局观*(s*,L,s*,L,sn)是博弈G(N,S,U)的一个均衡解。如果博弈G(N,S,U)有两个均衡解s*,S*,则至少有一个局中人j有两个严* * * *格优策略Sj , Sj ,设S(S1 , L , Sj , L , Sn),*S*(Si, L ,Sj , L ,Sn).*一.一.一一.因为Sj是局中人j的严格优策暗所以*Uj(S)Uj(S);又因为S*也是局中人j的严格

5、优策暗所以一*.*.Uj(s)Uj(s).结合(1)(2)两式有:*Uj(s)Uj(S)Uj(S),.*.-*一.八.、此为矛盾因此SjSj.从而ss,即解是唯一的口定义2-4(优策略)在n人博弈G(N,S,U)中,除局中人外,其余n1个局中人的所有可能的局势si(s1,s2,L,S1,si1,L,sn),局中人i存在着一个自己的策略s*,使得对一切的siSi,有,*、,.*.、,.、,、Ui(si,si)Ui(s1,s2,L,1i,0,si,L,sJUi(s1,L,,L,sn)(s),并且局中人i至少存在着一个自己的策略S,使得,*、,*.、,、,、Ui(1,si)Ui(si,L,i,,,s

6、i,L,sn)Ui(si,L,1,L,s)Ui(,si),则称s*Si是局中人的优策略。显然严格优策略一定是优策略但在许多情况下,不要说严格优策略,就是优策略都未必存在!我们以例2-1(猎鹿博弈)为例讨论如下猎人B-猎鹿猎人B-猎兔猎人A-猎鹿阿园0,1猎人A-猎兔1,01Q由收益函数:UA (猎鹿,猎鹿)=10;UA (猎鹿,猎兔)=0;UB (猎鹿,猎鹿)=10;UB (猎鹿,猎兔)=0;但是,Ua (猎鹿,O) UUA (猎兔,猎鹿)=1;UA (猎兔,猎兔)=1。UB (猎兔,猎鹿)=1;UB (猎兔,猎兔)=1。(猎兔,O)不成立,因为UA(猎鹿,猎鹿)=10UA(猎兔,猎鹿)=1;

7、UA(猎鹿,猎兔)=0UA(猎兔,猎兔)=1;因此,猎人A没有优策略,更没有严格优策略。对31人B的讨论也同样没有优策略但却存在两个Nash均衡解博弈解的第一组值为(10,10)(双值),对应博弈的解为(猎鹿,猎鹿);博弈解的第二组值为(1,1)(双值),对应博弈的解为(猎兔猎兔),它们都是Nash均衡,即此博弈有2个解或两个均衡点。问题是:这两个解应当如何去看?如果将博弈改为猎人乙-猎鹿猎人乙-猎兔猎人甲-猎鹿10,100,1猎人甲-猎兔1,00,0请同学们发表意见。毛泽东的思考由收益函数:UA (猎鹿,猎鹿)=10;UA (猎鹿,猎兔)=1;UB (猎鹿,猎鹿)=10;Ub (猎鹿,猎兔)

8、=0;UA (猎兔,猎鹿)=0;UA (猎兔,猎兔)=0Ub (猎兔,猎鹿)=1;Ub (猎兔,猎兔)=0 Ua(猎兔,O)成立,UA(猎鹿,猎鹿)=10Ua(猎兔,猎鹿)=1;UA(猎鹿,猎兔)=1UA(猎兔,猎兔)=0;因此,猎人A有严格劣策略猎兔”;同理,猎人B也有严格劣策略猎兔”我们在上述基本式中剔除严格劣策略,我们就只剩下一个均衡解:猎人B般鹿猎人A-猎鹿10,10我们为什么要割资本主义的尾巴?智猪博弈产生了,我的经历:猎鹿博弈智猪博弈囚徒困境例2-2斗鸡博弈首先依据情景描述写出博弈的基本式再列出博弈双方的收益矩磔双矩阳飞车党党徒B让飞车党党徒B撞飞车党党徒A让-10-10-10+1

9、0飞车党党徒A撞+10-10OOOO最后,用相对优势策略的划线法求解飞车党党徒B让飞车党党徒B撞飞车党党徒A让-10-10飞车党党徒A撞叵0日0OOOO博弈解的第一组值为(10,+10)(双值),对应博弈的解为(让,撞);博弈解的第二组值为什10,10)(双值),对应博弈的解为(撞让),它们都是Nash均衡,即此博弈有2个解或两个均衡点。例2-3双寡头垄断博弈(Cournot模型(1838年)首先依据情景描述写出博弈的基本式;再列出博弈双方的收益矩微矩阵)企业乙-定身价企业乙-定低价企业甲-定身价1000,1000500,1500企业甲-定低价1500,500700,700最后,用相对优势策略

10、的划线法求解企业乙-定身价企业乙-定低价企业甲-定身价1000,1000500,1500企业甲-定低价|1500|,500画回博弈的值为(700,700)(双值),对应博弈的解为(低价,低价);它是Nash均衡。思考它与哪一个博弈是一致的?例2-4(双人抬物)博弈G(N,S,U)的基本式为局中人的集合N1,2;策略空间SGS2出力,不出力X出力,不出力收益函数:U1 (出力,出力)=v c 0,Ui (出力,不出力)=v 2c 0,U1 (不出力,出力)=v 0,U1 (不出力,不出力)=0。容易看出局中人1的偏好序为:(不出力,出力)f (出力,出力)f容易看出局中人2的偏好序为:(出力,不

11、出力)f (出力,出力)f 显然,两局中人均有U1 (不出力,O) U1 (出力,。),U2 (出力,出力)=v c 0,U2 (出力,不出力)k 2c 0,U2 (出力,不出力)k 0, U2 (不出力,不出力)=0。(不出力,不出力)f (出力,不出力);(不出力,不出力)f (不出力,出力);U2 (不出力,O) U2 (出力,O);即,选择“不出力”是两局中人的严格优策略,因此,惟一的Nash均衡为(不出力,不出力)博弈的值为(0,0)我们还可以用划线法解决:局中人2出力局中人2不出力局中人1出力vc,vcv2c,v局中人1不出力v,v2c0,0讨论:1 .例25(双人抬物)和哪一个博

12、弈一致?2 .关于道德风险;3 .如何从技术上改变这种情况?例26(双虎争猎物博弈G(N,S,U)的基本式为局中人的集合NA,B;策略空间SSASB坚持,放弃X坚持,放弃;收益函数:Ua(坚持,坚持)=Ub(坚持,坚持)=c0,UA(坚持,放弃)=UB(放弃,坚持)=f0,UA(放弃,坚持)=UB(坚持,放弃)=0,UA(放弃,放弃)=UB(放弃,放弃)=0。容易看出两老虎没有严格优策略,我们还是用划线法解决:老虎B坚持老虎B放弁老虎A坚持c,c国,0老虎A放弃耳国0,0因此,Nash均衡为(坚持,放弃)和(放弃,坚持),博弈的值分别为(f,0)和(0,f)。讨论:1 .例210和哪一个博弈一

13、致?2 .现实中有何意义?例27(情侣分为博弈G(N,S,U)的基本式为局中人的集合N甲(男),乙(女);策略空间S08古典首乐,流行首乐X古典首乐,收益函数用矩阵表示为:流行音乐乙-古典音乐乙一流行音乐甲一古典音乐a,b0,0甲一流行音乐0,0b,a,用划线法解决:乙-古典音乐乙一流行音乐甲一古典音乐,M0,0甲一流行音乐0,0因此,Nash均衡为(古典音乐,古典音乐)和(流行音乐,流彳二分别为(a,b)和(b,a),(0ba)。讨论:1 .例27和哪个博弈T?2 .协调型博弈在现实中有何意义?(总收益高)亍音乐)博弈的值例28(公共产品的提供一一集资建桥博弈G(N,S,U)的基本式为局中人的集合N1,2,L,n;策略空间SS2LSn出资,不出资乂乂出资,不出资收益函数根据参加出资的人数有不同的情况:1)出资人数kn(人人出资才能建桥)Ui5LUn(出资,出资)kt0,出资居民i的收益Ui(至少有一个人不出资)=t0,不出资居民j的收益Uj(至少有一个人不出资)=0。我们简化问题为两个局中人的情况:局中人j出资局中人j不出资局中人i出资vt,vtt,0局中人i不出资0,t0,0因此,Nash均衡为(出资,出资)和(不出资,不出资)2)出资人数kn如果恰有k个居民出资而nk个居民不出资。有2种情况,讨论如下:如果已经有k1个居民出资而nk个居民不出资,局中人

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 商业/管理/HR > 营销创新

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号