文档详情

1对策论的基本概念

公****
实名认证
店铺
DOC
93KB
约10页
文档ID:474654798
1对策论的基本概念_第1页
1/10

§1对策论的基本概念对策模型的三个基本要素:1 .局中人:参与对抗的各方;2 .策略集:局中人选择对付其它局中人的行动方案称为策略;某局中人的所有可能策略全体称为策略集;3 .一局势对策的益损值:局中人各自使用一个对策就形成了一个局势,一个局势决定了各局中人的对策结果(量化)称为该局势对策的益损值齐王赛马”齐王在各局势中的益损值表(单位:千金)§1对策论的基本概念其中:齐王的策略集&={1,2,3,4,5,6},田忌的策略集:S2={1,2,3,4,5,6}F面矩阵称齐王的赢得矩阵:311131A=-11111111-11-1111-11-13311-131113§1对策论的基本概念二人有限零和对策(又称矩阵对策):局中人为2;每个局中人的策略集的策略数目都是有限的;每一局势的对策均有确定的损益值,并且对同一局势的两个局中人的益损值之和为零通常将矩阵对策记为:G={Si,S2,A}Si:甲的策略集;S2:乙的策略集;A:甲的赢得矩阵齐王赛马”是一个矩阵策略4 2矩阵对策的最优纯策略在甲方的赢得矩阵中:A=[aij]mxni行代表甲方策略i=1,2,…,m;j行代表乙方策略j=1,2,…,n;aij代表甲方取策略i,乙方取策略j,这一局势下甲方的益损值。

此时乙方的益损值为-aj(零和性质)在考虑各方采用的策略时,必须注意一个前提,就是双方都是理智的,即双方都是从各自可能出现的最不利的情形选择一种最为有利的情况作为决策的依据5 2矩阵对策的最优纯策略例:甲乙乒乓球队进行团体对抗赛,每队由三名球员组成,双方都可排成三种不同的阵容,每一种阵容可以看作一种策略,双方各选一种策略参赛比赛共赛三局,规定每局胜者得1分,输者得-1分,可知三赛三胜得3分,三赛二胜得1分,三赛一胜得-1分,三赛三负得-3分甲队的策略集为Sl={1,2,3},乙队的策略集为&={1,2,3}根据以往比赛的资料,有甲队的赢得矩阵为A,如下所示,请问这次比赛各队采用哪种阵容上场最为稳妥?6 2矩阵对策的最优纯策略矩阵A中每行的最小元素分别为1,-3,-1在这些最少赢得中最好的结果是1,故甲队会采取策略1,无论对手采取何策略,甲队至少彳41分对于乙队,{1,2,3}可能带来的最少赢得,即A中每列的最大元素,分别为3,1,3乙队会采取2策略,确保甲队不会超过1分1和2分别称为局中人甲队、乙队的最优策略由于双方必然选择这一种策略,所以,这种策略又称为最优纯策略这种最优纯策略只有当赢得矩阵A=(a")中等式成立时,双方才有最优纯策略,并把(1,2)称为对策G^纯策略下的解,又称(1,2)为对策G勺鞍点。

把其值V称之为对策G={S1,S2,A}的值§2矩阵对策的最优纯策略例某单位采购员在秋天决定冬季取暖用煤的储量问题,已知在正常的冬季气温条件下要消耗15吨煤,在较暖和较冷的天气下要消耗10吨和20吨假定冬天的煤价随天气寒冷程度而有所变化,在较暖和、正常、较冷的气候条件下每吨煤价分别为10元、15元、20元又设冬季时煤炭价格为每吨10元在没有关于当年冬季准确的气象预报的条件下,秋天储煤多少吨能使得单位的支出最少?解:局中人I为采购员,局中人II为大自然,采购员有三个策略,买10吨、15吨、20吨分别记为1,2,30大自然也有三个策略:暖、正常、冷,分别记为1,2,3§2矩阵对策的最优纯策略赢得矩阵如下:在此表上计算,有得故(3,3)为对策G勺解,在=-200设矩阵对策G={S1,S2,A}当maxminaijminmaxaij时,不存在最优纯策略例:设一个赢得矩阵如下:min595A=max6策略2866imax89策略1min8当甲取策略2,乙取策略1时,甲实际赢得8比预期的多2,乙当然不满意考虑到甲可能取策略2这一点,乙采取策略20若甲也分析到乙可能采取策略2这一点,取策略1,则赢得更多为9…。

此时,对两个局中人甲、乙来说,没有一个双方均可接受的平衡局势,其主要原因是甲和乙没有执行上述原则的共同基础,即maxminaijminmax创一个自然的想法:对甲(乙)给出一个选取不同策略的概率分布,以使甲(乙)在各种情况下的平均赢得(损失)最多(最少)-----即混合策略求解混合策略的问题有图解法、迭代法、线性方程法和线性规划法等,我们这里只介绍线性规划法,其他方法略例:设甲使用策略1的概率为Xi',使用策略2的概率为X2,并设在最坏的情况下,甲赢得的平均值为V(未知)59A=STEP1861)Xi+X2=1Xi,X202)无论乙取何策略,甲的平均赢得应不少于V:对乙取1:5X1+8X2V对乙取2:9X1+6X2V注意V>0,因为A&元素为正STEP2作变换:X1=X1'/V;X2=X2'/V得到上述关系式变为:X1+X2=1/V(V愈大愈好)待定5X1+8X219X1+6X21X1,X20建立线性模型:minX1+X>s.t.5X1+8%19X1+6X21X1,X20X1=1/21X2=2/211/V=X1+X2=1/7所以,V=7返回原问题:X1=X1V=1/3X2=X2V=2/3于是甲的最优混合策略为:以1/3的概率选1,以2/3的概率选2,最优值V=7。

例:求解“齐王赛马”问题已知齐王的赢得矩阵A求得故不存在纯策略问题下的解,可求其混合策略A中有负元素,可以取k=2,在A的每个元素上加2得到A'如下:建立对G={Si,S2,A)中求甲方最佳策略的线性规划如下:Minx1+X2+X3+X4+X5+X6约束条件:5xi+3x2+3x3+X4+3x5+3x6>13x1+5x2+X3+3x4+3x5+3x6>13x1+3x2+5x3+3x4+3x5+X6>13x1+3X2+3X3+5X4+X5+3X6>1x1+3X2+3X3+3X4+5X5+3X6>13x1+X2+3X3+3X4+3X5+5X6>1xi>0,i=1,2,…,6可解得解为:X1=X4=X5=0,X2=X3=X6=0.111,V=3,X1=X4=X5=0,X2=X3=X6=1/3,即X,*=(0,1/3,1/3,0,0,1/3),所以甲的最优策略为作出策略2、3、6的概率都为0.333,..........''而作出1、4、5的概率为0)止匕时VG=V=3同样可以建立对策G={S1,S2,A}中求乙方最佳策暗的线性规划如下:Miny1+y2+y3+y4+y5+y6约束条件:5y1+3y2+3y3+3y4+y5+3y6<13y1+5y2+3y3+3y4+3y5+y6w13y1+y2+5y3+3y4+3y5+3y6w1y1+3y2+3y3+5y4+3y5+3y6<13y1+3y2+3y3+y4+5y5+3y6<13y1+3y2+y3+3y4+3y5+5y6<1yii=1,2,••,6可解得解为:yi=y4=ys=0.111,y2=y3=y6=0,v=3,y1=y4=ys=1/3,y2=y3=y6=0,即Y*=(1/3,0,0,1/3,1/3,0)T。

所以田忌的最优混合策略为作出策略1、4、5的概率都为1/3,而作出2,3,6的概率为0,止匕时VG=Vg-k=1齐王赛马问题的对策最优解可简记为X*=(0,1/3,1/3,0,0,1/3)T,Y*=(1/3,0,0,1/3,1/3,0)T,对策值Vg=1o例两个局中人进行对策,规则是两人互相独立的各自从1、2、3这三个数字中任意选写一个数字如果两人所写的数字之和为偶数,则局中人乙支付给局中人甲以数量为此和数的报酬;如果两人所写数字之和为奇数,则局中人甲付给局中人乙以数量为此和数的报酬试求出其最优策略解:首先计算局中人甲的赢得矩阵如下表:即甲的赢得矩阵为A:可知无纯策略意义的解,下面求其在混合策略下的解A的各元素都加上6,得到建立线性规划模型如下:Minx1+X2+%Maxy1+y2+y3S.T.8x1+3x2+10*A18y1+3yz+10y3V13x1+10x2+x3A13y1+10y2+y3V110x1+兑+12%>110y1+yz+12y3V1x1,x2,x3>0y1,y2,y3>0得到'X1=0.25,x2=0.50,x3=0.25;__y1=0.25,y2=0.50,y3=0.25。

即此对策的解为X*=(0.25,0.50,0.25)T,7=(0.25,0.50,0.25)1V=V-k=0例4甲乙两个企业生产同一种电子产品,甲企业可以采取的策略措施有:(1)降低产品价格;⑵提高产品质量;(3)推出新产品乙企业考虑采取的策略措施有(1)增加广告费用;(2)增设维修网点,加强售后服务;(3)改进产品性能由于甲乙两个企业财力有限,都只能采取一个措施假定这两个企业所占有的市场总份额一定,由于各自采取的措施不同,通过预测今后两个企业的市场占有份额变动情况如下表,试求出这两个企业各自的最优策略解:易知此对策无纯策略意义下的解把A的每一个元素加上12,得到A建立线性规划模型如下:Minx1+X2+X3Maxyi+yz+y3S.T.22X1+20x2)16x1+17x2+22x3>115x1+7x2+20x3>1x1,x2,x3>0得到:22y1+6y2+15y3<120y1+17y2+7y3<122y2+20y3<1y1,y2,y3>0x1=0.027,x2=0.020,x3=0.023;y1=0.0225,y2=0.0225,y3=0.025V=14.29x1=0.3858,x2=0.2858,x3=0.3286;y=0.3215,y2=0.3215,y3=0.3572即此对策的解为X*=(0.3858,0.2858,0.3286)T,Y*=(0.3215,0.3215,0.3572)NKg-k=2.29o优超原则:假设矩阵对策甲方赢得矩阵若存在两行(列),G={S1,S2,A)A=[aij]mns行(列)的各元素均优于t行(列)的元素,即asjatjj=1,2•••n(aisaiti=1,2…m)称甲方策略s优超于t(s优超于t)。

优超原则:当局中人甲方的策略t被其它策略所优超时,可在其赢得矩阵A中划去第t行(同理,当局中人乙方的策略t被其它策略所优超时,可在矩阵A中划去第t歹U),如此得到阶数较小的赢得矩阵A',其对应的矩阵对策G'={Si,S2,A'}与G={Si,S2,A}等价,即解相同例.设甲方的益损值,赢得矩阵为3250A=739被第3、4行所优超被第3行所优超46875.560883得到73959Ai=46875.5被第1列所优超被第2列所优超对A计算,用线性规划方法得到:(注意:余下的策略为3,4,。

下载提示
相似文档
正为您匹配相似的精品文档