第八章对策与决策模型

上传人:ni****g 文档编号:584700521 上传时间:2024-08-31 格式:PPT 页数:102 大小:1.68MB
返回 下载 相关 举报
第八章对策与决策模型_第1页
第1页 / 共102页
第八章对策与决策模型_第2页
第2页 / 共102页
第八章对策与决策模型_第3页
第3页 / 共102页
第八章对策与决策模型_第4页
第4页 / 共102页
第八章对策与决策模型_第5页
第5页 / 共102页
点击查看更多>>
资源描述

《第八章对策与决策模型》由会员分享,可在线阅读,更多相关《第八章对策与决策模型(102页珍藏版)》请在金锄头文库上搜索。

1、第八章第八章 对策与决策模型对策与决策模型浙江大学数学建模基地浙江大学数学建模基地第八章第八章 对策与决策模型对策与决策模型 对策与决策是人们生活和工作中经常会遇到的择优活动。对策与决策是人们生活和工作中经常会遇到的择优活动。人们在处理一个问题时,往往会面临几种情况,同时又存在人们在处理一个问题时,往往会面临几种情况,同时又存在几种可行方案可供选择,要求根据自己的行动目的选定一种几种可行方案可供选择,要求根据自己的行动目的选定一种方案,以期获得最佳的结果。方案,以期获得最佳的结果。 有时,人们面临的问题具有竞争性质,如商业上的竞争、有时,人们面临的问题具有竞争性质,如商业上的竞争、体育中的比赛

2、和军事行动、政治派别的斗争等等。这时竞争体育中的比赛和军事行动、政治派别的斗争等等。这时竞争双方或各方都要发挥自己的优势,使己方获得最好结果。因双方或各方都要发挥自己的优势,使己方获得最好结果。因而双方或各方都要根据不同情况、不同对手做出自己的决择,而双方或各方都要根据不同情况、不同对手做出自己的决择,此时的决策称为对策。在有些情况下,如果我们把可能出现此时的决策称为对策。在有些情况下,如果我们把可能出现的若干种情况也看作是竞争对手可采取的几种策略,那么也的若干种情况也看作是竞争对手可采取的几种策略,那么也可以把决策问题当作对策问题来求解。可以把决策问题当作对策问题来求解。8.1 8.1 对策

3、问题对策问题 对策问题的特征是参与者为利益相互冲突的各方,其结局对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合不取决于其中任意一方的努力而是各方所采取的策略的综合结果。结果。先考察几个实际例子。先考察几个实际例子。 例例8.1 (田忌赛马)(田忌赛马) 田忌赛马是大多数人都熟知的故事,传说战国时期齐王欲与田忌赛马是大多数人都熟知的故事,传说战国时期齐王欲与大将田忌赛马,双方约定每人挑选上、中、下三个等级的马大将田忌赛马,双方约定每人挑选上、中、下三个等级的马各一匹进行比赛,每局赌金为一千金。齐王同等级的马均比各一匹进行比赛,每局赌金为一千

4、金。齐王同等级的马均比田忌的马略胜一筹,似乎必胜无疑。田忌的朋友孙膑给他出田忌的马略胜一筹,似乎必胜无疑。田忌的朋友孙膑给他出了一个主意,让他用下等马比齐王的上等马,上等马对齐王了一个主意,让他用下等马比齐王的上等马,上等马对齐王的中等马,中等马对齐王的下等马,结果田忌二胜一败,反的中等马,中等马对齐王的下等马,结果田忌二胜一败,反而赢了一千金。而赢了一千金。 例例8.2 (石头(石头剪子剪子布)布)这是一个大多数人小是一个大多数人小时候都玩候都玩过的游的游戏。游。游戏双方只能双方只能选石石头、剪子、布中的一种,石、剪子、布中的一种,石头赢剪子,剪子剪子,剪子赢布,而布又布,而布又赢石石头,赢

5、者得一分,者得一分,输者失一分,双方相同者失一分,双方相同时不得分,不得分,见下下表。表。表表8.18.1石石头剪子剪子布布石石头011剪子剪子101布布110例例8.3 (囚犯的困惑)(囚犯的困惑)警察同警察同时逮捕了两人并分开关押,逮捕的原因是他逮捕了两人并分开关押,逮捕的原因是他们持有大持有大量量伪币,警方,警方怀疑他疑他们伪造造钱币,但没有找到充分,但没有找到充分证据,希据,希望他望他们能自己供能自己供认,这两个人都知道:如果他两个人都知道:如果他们双方都不供双方都不供认,将被以使用和持有大量,将被以使用和持有大量伪币罪被各判刑罪被各判刑1818个月;如果双个月;如果双方都供方都供认伪

6、造了造了钱币,将各被判刑,将各被判刑3 3年;如果一方供年;如果一方供认另一方另一方不供不供认,则供供认方将被从方将被从宽处理而免刑,但另一方面将被判理而免刑,但另一方面将被判刑刑7 7年。将嫌疑犯年。将嫌疑犯A A、B B被判刑的几种可能情况列表如下被判刑的几种可能情况列表如下:表表8.28.2嫌疑犯嫌疑犯B供供认不供不供认嫌疑犯嫌疑犯A供供认不供不供认(3,3)(0,7)(7,0)(1.5,1.5)表中每对数字表示嫌疑犯表中每对数字表示嫌疑犯A A、B B被判刑的年数。如果两名疑犯均担心对方被判刑的年数。如果两名疑犯均担心对方供认并希望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。供认

7、并希望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。一、对策的基本要素一、对策的基本要素(1 1)局中人局中人。参加决策的各方被称为决策问题的局中人,一。参加决策的各方被称为决策问题的局中人,一个决策总是可以包含两名局中人(如棋类比赛、人与大自然个决策总是可以包含两名局中人(如棋类比赛、人与大自然作斗争等),也可以包含多于两名局中人(如大多数商业中作斗争等),也可以包含多于两名局中人(如大多数商业中的竞争、政治派别间的斗争)。局中人必须要拥用可供其选的竞争、政治派别间的斗争)。局中人必须要拥用可供其选择并影响最终结局的策略,在例择并影响最终结局的策略,在例8.38.3中,局中人是中,局中人

8、是A A、B B两名疑两名疑犯,警方不是局中人。两名疑犯最终如何判刑取决于他们各犯,警方不是局中人。两名疑犯最终如何判刑取决于他们各自采取的态度,警方不能为他们做出选择。自采取的态度,警方不能为他们做出选择。从这些简单实例中可以看出对策现象从这些简单实例中可以看出对策现象中包含的几个基本要素。中包含的几个基本要素。(2 2)策略集合策略集合。局中人能采取的可行方案称为策略,每一。局中人能采取的可行方案称为策略,每一局中人可采取的全部策略称为此局中人的策略集合。对策问局中人可采取的全部策略称为此局中人的策略集合。对策问题中,对应于每一局中人存在着一个策略集合,而每一策略题中,对应于每一局中人存在

9、着一个策略集合,而每一策略集合中至少要有两个策略,否则该局中人可从此对策问题中集合中至少要有两个策略,否则该局中人可从此对策问题中删去,因为对他来讲,不存在选择策略的余地。应当注意的删去,因为对他来讲,不存在选择策略的余地。应当注意的是,所谓策略是指在整个竞争过程中对付他方的完整方法,是,所谓策略是指在整个竞争过程中对付他方的完整方法,并非指竞争过程中某步所采取的具体局部办法。例如下棋中并非指竞争过程中某步所采取的具体局部办法。例如下棋中的某步只能看和一个完整策略的组成部分,而不能看成一个的某步只能看和一个完整策略的组成部分,而不能看成一个完整的策略。当然,有时可将它看成一个多阶段对策中的子完

10、整的策略。当然,有时可将它看成一个多阶段对策中的子对策。策略集合可以是有限集也可以是无限集。策略集为有对策。策略集合可以是有限集也可以是无限集。策略集为有限集时称为有限对策,否则称为无限对策。限集时称为有限对策,否则称为无限对策。 记局中人记局中人i i的策略集合为的策略集合为SiSi。当对策问题各方都从各自的策略。当对策问题各方都从各自的策略集合中选定了一个策略后,各方采取的策略全体可用一矢量集合中选定了一个策略后,各方采取的策略全体可用一矢量S S表示,称之为一个纯局势(简称局势)。表示,称之为一个纯局势(简称局势)。 例如例如,若一,若一对策中包含策中包含A、B两名局中人,其策略集合分两

11、名局中人,其策略集合分别为SA = 1, m,SB = 1, n。若。若A选择策略策略 i而而B选策策略略 j,则( i, j)就构成此)就构成此对策的一个策的一个纯局局势。显然,然,SA与与SB一共可构成一共可构成mn个个纯局局势,它,它们构成表构成表8.3。对策策问题的全体的全体纯局局势构成的集合构成的集合S称称为此此对策策问题的局的局势集合。集合。 ( m, n) ( m, j) ( m, 2) ( m, 1) m( i, n) ( i, j) ( i, 2) ( i , 1) i( 2, n) ( 2, j) ( 2, 2) ( 2, 1) 2( 1, n) ( 1, j) ( 1,

12、2) ( 1, 1) 1A的的策策略略nJ21B的策略的策略(3 3)赢得函数(或称支付函数)。得函数(或称支付函数)。对策的策的结果用矢量表示,果用矢量表示,称之称之为赢得函数。得函数。赢得函数得函数F F为定定义在局在局势集合集合S S上的矢上的矢值函函数,数,对于于S S中的每一中的每一纯局局势S S,F F(S S)指出了每一局中人在此)指出了每一局中人在此对策策结果下果下应赢得(或支付)的得(或支付)的值。综上所述,一个上所述,一个对策模型策模型由局中人、策略集合和由局中人、策略集合和赢得函数三部分得函数三部分组成。成。记局中人集合局中人集合为I I = 1, = 1, ,k k ,

13、对每一每一i iI I,有一策略集合,有一策略集合S Si i,当,当I I中每一中每一局中人局中人i i选定策略后得一个局定策略后得一个局势s s;将;将s s代入代入赢得函数得函数F F,即得,即得一矢量一矢量F F( (s s) = ( ) = ( F F1 1( (s s),), ,F Fk k( (s s),其中,其中F Fi i( (s s) )为在局在局势s s下局中人下局中人i i的的赢得(或支付)。得(或支付)。本节讨论只有两名局中人的对策问题,即两人对策,其结果可本节讨论只有两名局中人的对策问题,即两人对策,其结果可以推广到一般的对策模型中去。对于只有两名局中人的对策问以推

14、广到一般的对策模型中去。对于只有两名局中人的对策问题,其局势集合和赢得函数均可用表格表示。例如,表题,其局势集合和赢得函数均可用表格表示。例如,表8.28.2就给就给出了例出了例8.38.3的局势集合和赢得函数。的局势集合和赢得函数。二、零和对策二、零和对策存在一存在一类特殊的特殊的对策策问题。在。在这类对策中,当策中,当纯局局势确定后,确定后,A A之所得恰之所得恰为B B之所失,或者之所失,或者A A之所失恰之所失恰为B B之所得,即双方所得之所得,即双方所得之和之和总为零。在零和零。在零和对策中,因策中,因F F1 1( (s s)= )= F F2 2( (s s) ),只需指出其中,

15、只需指出其中一人的一人的赢得得值即可,故即可,故赢得函数可用得函数可用赢得矩得矩阵表示。例如若表示。例如若A A有有m m种策略,种策略,B B有有n n种策略,种策略,赢得矩得矩阵 表示若表示若A A选取策略选取策略i i而而B B选取策略选取策略j j,则,则A A之所得为之所得为a aijij(当(当a aijij00时为支付)。时为支付)。在有些两人在有些两人对策的策的赢得表中,得表中,A A之所得并非明之所得并非明显为B B之所失,但之所失,但双方双方赢得数之和得数之和为一常数。例如在表一常数。例如在表8.48.4中,无中,无论A A、B B怎怎样选取策略,双方取策略,双方赢得得总和

16、均和均为1010,此,此时,若将各人,若将各人赢得数减去两得数减去两人的平均人的平均赢得数,即可将得数,即可将赢得表化得表化为零和零和赢得表。表得表。表8.48.4中的中的对策在策在转化化为零和零和对策后,具有策后,具有赢得矩得矩阵表表8.48.4局中人局中人B123局中人局中人A1(8, 2)(1, 9)(7, 3)2(4, 6)(9, 1)(3, 7) 3(2, 8)(6, 4)(8, 2)4(6, 4)(4, 6)(6, 4)给定一个两人对策只需给出局中人给定一个两人对策只需给出局中人A A、B B的策略集合的策略集合S SA A、S SB B及表示双方赢得值的赢得矩阵及表示双方赢得值的

17、赢得矩阵R R。综上所述,当遇到零和对。综上所述,当遇到零和对策或可转化为零和对策的问题时,策或可转化为零和对策的问题时,R R可用通常意义下的矩阵可用通常意义下的矩阵表示,否则表示,否则R R的元素为一两维矢量。的元素为一两维矢量。故两人对策故两人对策G G又可称为矩阵对策并可简记成又可称为矩阵对策并可简记成G G = = S SA A, , S SB B, , R R 例例8.4 给定给定G = SA, SB, R,其中其中SA = 1, 2, 3,SB = 1, 2, 3, 4 从从R R中可以看出,若中可以看出,若A A希望获得最大赢利希望获得最大赢利3030,需采取策略,需采取策略

18、1 1,但此时若,但此时若B B采采取策略取策略 4 4,A A非但得不到非但得不到3030,反而会失去,反而会失去2222。为了稳妥,双方都应考虑到。为了稳妥,双方都应考虑到对方有使自己损失最大的动机,在最坏的可能中争取最好的结果。局中人对方有使自己损失最大的动机,在最坏的可能中争取最好的结果。局中人A A采取策略采取策略 1 1、 2 2、 3 3时,最坏的赢得结果分别为时,最坏的赢得结果分别为min 12, 6, 30, 22 = 22min 14, 2, 18, 10 =2min 6, 0, 10, 16 = 10其中最好的可能为其中最好的可能为max max 22,2,22,2,10

19、=210=2。如果如果A A采取策略采取策略 2 2,无论,无论B B采采取什么策略,取什么策略,A A的赢得均不会少于的赢得均不会少于2.2.B B采取各方案的最大损失为采取各方案的最大损失为max 12,14, max 12,14, 6=146=14,max max 6,2,0=26,2,0=2,max max 30,18, 30,18, 10=3010=30和和max max 22,10,16 =1622,10,16 =16。当。当B B采取策略采取策略 2 2时,其损失时,其损失不会超过不会超过2 2。注意到在赢得矩阵中,。注意到在赢得矩阵中,2 2既是所在行中的最小元素又是所在列既是

20、所在行中的最小元素又是所在列中的最大元素。此时,只要对方不改变策略,任一局中人都不可能通过变中的最大元素。此时,只要对方不改变策略,任一局中人都不可能通过变换策略来增大赢得或减小损失,称这样的局势为对策的一个稳定点或稳定换策略来增大赢得或减小损失,称这样的局势为对策的一个稳定点或稳定解,(注:也被称为鞍点)解,(注:也被称为鞍点)定义8.1 对于两人对策对于两人对策G = SA, SB, R,若有,若有,则称,则称G具有稳定解,并称具有稳定解,并称VG为对策为对策G的值。若纯局势(的值。若纯局势( )使得)使得 ,则称(,则称( )为对策)为对策G的鞍点或稳定解,赢得矩阵中与(的鞍点或稳定解,

21、赢得矩阵中与( )相)相对应的元素对应的元素 称为赢得矩阵的鞍点,称为赢得矩阵的鞍点, 与与 分别称为局中人分别称为局中人A与与B的最的最优策略。优策略。对(8.18.1)式中的)式中的赢得矩得矩阵,容易,容易发现不存在具有上述性不存在具有上述性质的鞍点。的鞍点。给定定一个一个对策策G G,如何判断它是否具有鞍点呢?,如何判断它是否具有鞍点呢?为了回答了回答这一一问题,先引入下,先引入下面的极大极小原理。面的极大极小原理。定理定理8.18.1 设G = SA, SB, R , 记 , 则必有必有+0证明 : ,易见易见为为A的最小赢得,的最小赢得,为为B的最小赢得,的最小赢得,由于由于G是零和

22、对策,故是零和对策,故+0必成立。必成立。定理定理8.28.2 零和零和对策策G G具有具有稳定解的充要条件定解的充要条件为+= 0= 0。 证明: (充分性)(充分性) 由由和和的定的定义可知,存在一行(例如可知,存在一行(例如p p行)行)为p p行中的最小元素且存在一列(例如行中的最小元素且存在一列(例如q q列),列),为q q列中的列中的最大元素。故有最大元素。故有 a apqpq且且a apqpq又因又因+= 0= 0,所以,所以= =,从而得出,从而得出a apqpq= =,a apqpq为赢得矩得矩阵的鞍点,(的鞍点,( p p, , q q)为G G的的稳定解。定解。 (必要

23、性)(必要性)若若G G具有具有稳定解(定解( p p , , q q ),),则a apqpq为赢得矩得矩阵的鞍点。故有的鞍点。故有 从而可得从而可得+0+0,但根据定理,但根据定理8.18.1,+0+0必成立,故必有必成立,故必有+=0=0。上述定理上述定理给出了出了对策策问题有有稳定解(定解(简称称为解)的充要条件。当解)的充要条件。当对策策问题有解有解时,其解可以不唯一。例如,若,其解可以不唯一。例如,若 则易易见,(,( 2, 2),(),( 2, 4),(),( 4, 2),(),( 4, 4)均)均为此此对策策问题的解。的解。一般又可以一般又可以证明。明。定理定理8.3 8.3

24、对策策问题的解具有下列性的解具有下列性质:(1)无差)无差别性。若(性。若( , )与()与( , )同)同为对策策G的解,的解,则必有必有 。(2 2)可交)可交换性。若(性。若( , , j1j1)、()、( , , j2j2)均)均为对策策G G的解,的解, 则( , , j2j2)和()和( , , j1j1)也必)也必为G G的解。的解。 定理定理8.3的证明非常容易,作为习题的证明非常容易,作为习题留给读者自己去完成。留给读者自己去完成。具有具有稳定解的零和定解的零和对策策问题是一是一类特特别简单的的对策策问题,它所,它所对应的的赢得矩得矩阵存在鞍点,任一局中人都不可能通存在鞍点,

25、任一局中人都不可能通过自己自己单方面的努力来改方面的努力来改进结果。然而,在果。然而,在实际遇到的零和遇到的零和对策中更典型的是策中更典型的是+0的情况。由于的情况。由于赢得得矩矩阵中不存在鞍点,至少存在一名局中人,在他中不存在鞍点,至少存在一名局中人,在他单方面改方面改变策略的情况策略的情况下,有可能改善自己的收益。例如,考察(下,有可能改善自己的收益。例如,考察(8.1)中的)中的赢得矩得矩阵R。若双若双方都采取保守的方都采取保守的max min原原则, 将会出将会出现纯局局势 ( 4, 1)或)或( 4, 3)。但如果局中人)。但如果局中人A适当改适当改换策略,他可以增加收入。例如,如策

26、略,他可以增加收入。例如,如果果B采用策略采用策略 1,而,而A改改换策略策略 1,则A可收益可收益 3。但此。但此时若若B改改换策略策略 2,又会使,又会使A输掉掉4,。此。此时,在只使用,在只使用纯策略的范策略的范围内,内,对策策问题无解。无解。这类决策如果只决策如果只进行一次,局中人除了碰运气以外行一次,局中人除了碰运气以外别无无办法。但法。但如果如果这类决策要反复决策要反复进行多次,行多次,则局中人固定采用一种策略局中人固定采用一种策略显然是不明然是不明智的,因智的,因为一旦一旦对手看出你会采用什么策略,他将会手看出你会采用什么策略,他将会选用用对自己最自己最为有有利的策略。利的策略。

27、这时,局中人均,局中人均应根据某种概率来根据某种概率来选用各种策略,即采用混用各种策略,即采用混合策略的合策略的办法,使自己的期望收益尽可能大。法,使自己的期望收益尽可能大。 设A方用概率方用概率xi选用策略用策略 i,B方用概率方用概率yj选用策略用策略 j, ,且双方每次且双方每次选用什么策略是随机的,不能用什么策略是随机的,不能让对方看出方看出规律,律,记X = (x1, ,xm)T,Y = (y1, ,yn)T,则A的期望的期望赢得得为E ( X,Y) = XTRY其中,其中,R为为A方的赢得矩阵方的赢得矩阵。记记 SA:策策略略1, mSB:策策略略1, n概概率率x1,xm概概率率

28、y1,yn分分别称称SA与与SB为A方和方和B方的混合策略。方的混合策略。对于需要使用混合策略的于需要使用混合策略的对策策问题,也有具有,也有具有稳定解的定解的对策策问题的的类似似结果。果。定定义8.2 若存在若存在m维概率向量和概率向量和n维概率向量,使得概率向量,使得对一切一切m维概率向量概率向量X和和n维概率向量概率向量y有有 则称(称( , )为混合策略混合策略对策策问题的鞍点。的鞍点。定理定理8.4 (Von Neumann)任意混合策略)任意混合策略对策策问题必存在鞍点,即必存在概率向必存在鞍点,即必存在概率向量和,使得:量和,使得: (证明从略)。明从略)。使用使用纯策略的策略的

29、对策策问题(具有(具有稳定解的定解的对策策问题)可以看成使用混合策略的)可以看成使用混合策略的对策策问题的特殊情况,相当于以概率的特殊情况,相当于以概率1选取其中某一策略,以概率取其中某一策略,以概率0选取其余策略。取其余策略。对于双方均只有两种策略的于双方均只有两种策略的对策策问题(即(即22对策),可按几何方法求解。策),可按几何方法求解。例例8.58.5 A A、B B为作战双方,为作战双方,A A方拟派两架轰炸机方拟派两架轰炸机I I和和IIII去轰炸去轰炸B B方的指挥部,方的指挥部,轰炸机轰炸机I I在前面飞行,在前面飞行,IIII随后。两架轰炸机中只有一架带有炸弹,而另随后。两架

30、轰炸机中只有一架带有炸弹,而另一架仅为护航。轰炸机飞至一架仅为护航。轰炸机飞至B B方上空,受到方上空,受到B B方战斗机的阻击。若战斗机方战斗机的阻击。若战斗机阻击后面的轰炸机阻击后面的轰炸机IIII,它仅受,它仅受IIII的射击,被击中的概率为的射击,被击中的概率为0.30.3(I I来不及来不及返回击它)。若战斗机阻击返回击它)。若战斗机阻击I I,它将同时受到两架轰炸机的射击,被击,它将同时受到两架轰炸机的射击,被击中的概率为中的概率为0.70.7。一旦战斗机未被击落,它将以。一旦战斗机未被击落,它将以0.60.6的概率击毁其选中的的概率击毁其选中的轰炸机。请为轰炸机。请为A A、B

31、B双方各选择一个最优策略,即:对于双方各选择一个最优策略,即:对于A A方应选择哪一方应选择哪一架轰炸机装载炸弹?对于架轰炸机装载炸弹?对于B B方战斗机应阻击哪一架轰炸机?方战斗机应阻击哪一架轰炸机? 解:解:双方可双方可选择的策略集分的策略集分别为SA = 1, 2, 1:轰炸机炸机 I 装炸装炸弹, II 护航航 2:轰炸机炸机 II 装炸装炸弹,I 护航航SA = 1, 2, 1:阻:阻击轰炸机炸机 I 2:阻:阻击轰炸机炸机 II赢得矩得矩阵R=(aij)22,aij为A方采取策略方采取策略 i而而B方采取策略方采取策略 j 时,轰炸炸机机轰炸炸B方指方指挥部的概率,由部的概率,由题

32、意可意可计算出:算出:a11= 0.7 + 0.3 (10.6) = 0.82a12= 1, a21= 1a22= 0.3 + 0.7 (10.6) = 0.58即即易求得易求得 , 。由于由于+0,矩矩阵R不存在鞍点,不存在鞍点,应当求最佳混合策略。当求最佳混合策略。现设A以概率以概率x1取策略取策略 1、概率、概率x2取策略取策略 2; B以概率以概率y1取策略取策略 1、概率、概率y2取策略取策略 2。先从先从B方来考方来考虑问题。B采用采用 1时,A方方轰炸机攻炸机攻击指指挥部的概率的期部的概率的期望望值为E( 1)=0。82x1+x2,而,而B采用采用 2时,A方方轰炸机攻炸机攻击指

33、指挥部的部的概率的期望概率的期望值为E( 2)=x1+0.58x2。若。若E( 1)E( 2),不妨),不妨设E( 1)2且且n2时,采用几何方法求解就,采用几何方法求解就变得相当麻得相当麻烦,此此时通常采用通常采用线性性规划方法求解。划方法求解。现设A以概率以概率x2采取策略采取策略 2,若,若B采取策略采取策略 2,则A的期望的期望赢得得为a11(1x2)+a21x2。对应x2的不同取的不同取值(0x21),),a11(1x2)+a12x2恰好构成恰好构成连接两个接两个B1的直的直线段。段。类似地,似地,连接两个接两个B2的直的直线段恰好段恰好对应当当B取取 2而而A以概率以概率x2取取2

34、时的的赢得得a12(1x2)+a22x2。设两直两直线段相交于段相交于N,并并设N对应于于 。若。若A以小于以小于 的的x2取策略取策略 2,则B可以采取可以采取 1使使A的期望的期望赢得减小;反之,若得减小;反之,若x2 ,则B又可采取又可采取 2而使而使A的的赢得减小。故得减小。故A的的最佳混合策略最佳混合策略为以以 =1 概率取概率取 1,以概率取,以概率取 2(注:(注:B的最佳混的最佳混合策略可合策略可类似用几何方法求得)。似用几何方法求得)。A方方选择混合策略混合策略 的目的是使得的目的是使得其中其中ej为只有第只有第j个分量个分量为1而其余分量均而其余分量均为零的向量,零的向量,

35、Ej = XTRej。记 ,由于,由于 , 在在yk=1,yj=0(jk)时达到最大达到最大值u, 故故 应为线性性规划划问题 min u , j=1, 2, , n (即即EjEk)xi0, i =1,2,mS.t的解。的解。同理,同理, 应为线性性规划划max , i=1, 2, , myj0, i =1,2,nS.t的解。的解。由由线性性规划知划知识,(,(8.2)与()与(8.3)互)互为对偶偶线性性规划,它划,它们具有相同的最具有相同的最优目目标函数函数值。关于。关于线性性规划划对偶理偶理论,有,有兴趣的趣的读者可以参者可以参阅有关有关书籍,例如籍,例如鲁恩恩伯杰的伯杰的“线性与非性

36、与非线性性规划引划引论”。 为了了寻找例找例8.5中中A方的最方的最优混合策略,求解混合策略,求解线性性规划划min uS.t 0.82x1 + x2 u x1 + 0.58x2 u x1 + x2 = 1 x1 , x2 0可得最可得最优混合策略混合策略x1 =0.7, x2 =0.3。类似求解似求解线性性规划划max S.t 0.82y1 +y2 y1 +0.58y2 y1 +y2 =1 y1 , y2 0可得可得B方最方最优混合策略:混合策略:y1 =0.7, y2 =0.3。三、非零和三、非零和对策策除了零和除了零和对策外,策外,还存在着另一存在着另一类对策策问题,局中人,局中人获利之

37、和并非常数。利之和并非常数。例例8.48.4 现有一有一对策策问题,双方,双方获利情况利情况见表表8.58.5。表表8.58.5B方方A方方1231234(8,2)(3,4)(1,6)(4,2)(0,9)(9,0)(6,2)(4,6)(7,3)(2,7)(8,1)(5,1)假如假如A、B双方仍采取双方仍采取稳妥的妥的办法,法,A发现如采取策略如采取策略4,则至少可至少可获利利4,而,而B发现如采取策略如采取策略1,则至少可至少可获利利2。因而,。因而,这种求种求稳妥的想法妥的想法将将导至出至出现局局势(4,2)。)。容易看出,从整体上看,容易看出,从整体上看,结果并不是最好的,因果并不是最好的

38、,因为双方的双方的总获利有可能利有可能达到达到10。不。不难看出,依靠看出,依靠单方面的努力不一定能收到良好的效果。看来,方面的努力不一定能收到良好的效果。看来,对这一一对策策问题,双方最好,双方最好还是握手言和,相互配合,先取得是握手言和,相互配合,先取得总体上的体上的最大最大获利,然后再按某一双方均利,然后再按某一双方均认为较为合理的方式来分享合理的方式来分享这一已一已经获得的最大得的最大获利。利。例例8.4说明,明,总获利数并非常数的利数并非常数的对策策问题(即不能(即不能转化化为零和零和对策的策的问题),是一,是一类存在着合作基存在着合作基础的的对策策问题。当然,。当然,这里里还存在着

39、一个留待解决存在着一个留待解决而又十分关而又十分关键的的问题:如何分享:如何分享总获利,如果不能达到一个双方(或各方)利,如果不能达到一个双方(或各方)都能接受的都能接受的“公平公平”的分配原的分配原则,则合作仍然不能合作仍然不能实现。怎。怎样建立一个建立一个“公公平平”的分配原的分配原则是一个是一个较为困困难的的问题,将在第九章中介,将在第九章中介绍。 最后,我们来考察几个对策问题最后,我们来考察几个对策问题的实例。的实例。例例8.68.6(战例分析)例分析)1944年年8月,美月,美军第一第一军和英和英军占占领法国法国诺曼第不久,曼第不久,立即从海防前立即从海防前线穿穿过海峡,向海峡,向A

40、vranches进军。美。美军第一第一军和英和英军的行的行动直接威直接威胁到德到德军第九第九军。美。美军第三第三军也开到了也开到了Avranches的南部,双方的南部,双方军队所所处的地理位置如的地理位置如图8.2所示。所示。美美军方面的指方面的指挥官是官是Bradley将将军,德,德军指指挥官是官是Von Kluge将将军。Von Kluge将将军面面临的的问题是或者向西是或者向西进攻,加攻,加强强他的西部防他的西部防线,切断美,切断美军援助;或者撤退到援助;或者撤退到东部,占据塞那河部,占据塞那河流域的有利地形,并能得到德流域的有利地形,并能得到德军第十第十五五军的援助。的援助。Bradl

41、ey将将军的的问题是如何是如何调动他的后他的后备军,后,后备军驻扎在海峡南部。扎在海峡南部。Bradley将将军有三种可供有三种可供选择的策略:的策略:他可以命令后他可以命令后备军原地待命,当海峡原地待命,当海峡形形势危急危急时支援第一支援第一军或出或出击东部部敌人,以减人,以减轻第一第一军的的压力。力。双方双方应如何决策,使自己能有如何决策,使自己能有较大的机会大的机会赢得得战争的争的胜利呢?利呢? 我我们将用建立矩将用建立矩阵对策模型的方法,来策模型的方法,来试图求得双方的最求得双方的最优策略。模型假策略。模型假设: 1、Bradley将将军和和Von Kluge将将军分分别为对策策问题的

42、局中人的局中人A和和B。2、局中人、局中人A的策略集合的策略集合为SA = 1, 2, 3,其中:其中: 1为后后备军增援保增援保卫海峡;海峡; 2为后后备军东征,切断德征,切断德军后路;后路; 3为后后备军待命待命 3、局中人、局中人B的策略集合的策略集合为SB = 1, 2,其中:其中: 1为德国向西德国向西进攻海峡,攻海峡,切断美切断美军援助;援助; 2为德德军撤退到撤退到东部,占部,占领塞塞纳河流域有利地形。河流域有利地形。4、SA、SB构成六种构成六种纯局局势,综合双方合双方实力,各种局力,各种局势估估计结果如下。若果如下。若B采取采取策略策略 1,即德,即德军采取攻采取攻势,则有有

43、(1)()( 1, 1),估),估计美美军击败德德军并占并占领海峡的可能性(即概率)海峡的可能性(即概率)为(2)()( 2, 1),估),估计美美军取取胜的可能的可能为 。德。德军很可能打破美很可能打破美军第一第一军的防的防线,并切断美,并切断美军的退路。的退路。(3)()( 3, 1),估),估计美美军可以根据需要增援。如不需增援,后可以根据需要增援。如不需增援,后备军可可东进绕行到德行到德军后方。后方。这样,美,美军将占将占领海峡并海峡并彻底底歼灭德德军第九第九军。情况(情况(1 1)、()、(2 2)、()、(3 3)如)如图8.38.3(1 1)、()、(2 2)、()、(3 3)所

44、示。)所示。若若B采取策略采取策略 2,即德,即德军第九第九军东撤,占据塞撤,占据塞纳河流域有利地形,河流域有利地形,则有有 (4)()( 1, 2),美方),美方扩大了大了战线,德,德军虽占据了有利地形,美占据了有利地形,美军仍有仍有击败 德德军的可能性。的可能性。(5)()( 2, 2),美后),美后备军东进给德德军东撤造成撤造成压力并挫力并挫伤德德军,使美,使美军击败德德军的可能性增大到的可能性增大到 。(6)()( 3, 2),美后),美后备军待命。在待命。在发现德德军撤退后,奉命向撤退后,奉命向东扰乱乱敌方撤退,方撤退,为以后以后歼灭德第九德第九军创造条件,估造条件,估计是美是美军击

45、败德德军的可能性的可能性 。情况(情况(4)、()、(5)、()、(6)见图8.3(4)、()、(5)()(6)所示。)所示。上述分析估上述分析估计是由是由Bradley将将军作出的,据此构造出作出的,据此构造出A方方赢得矩得矩阵这是一个是一个32对策矩策矩阵。可以求得。可以求得 , , ,不存在,不存在稳定解,定解,需要考需要考虑其他解法。其他解法。定定义8.3 对于于赢得矩得矩阵R,如果如果对所有所有j,aijakj均成立,且至少存在一个均成立,且至少存在一个 使使得得 则称称i行行优于于k行(策略行(策略ai优于于ak)。)。同同样,如,如对一切一切i有有aijakl,且至少有一个且至少

46、有一个i0使得使得 ,则称称j列列优于于l例(局中人例(局中人B的策略的策略 j优于于 l)。)。易易见,若一个,若一个对策矩策矩阵的第的第i行行优于第于第k行,行,则无无论局中人局中人B选择哪种策略,局中哪种策略,局中人人A采取策略采取策略 i的的获利利总优于(至少不次于)采取策略于(至少不次于)采取策略 k的的获利。利。定理定理8.5 对于矩于矩阵对策策G= SA, SB, R,若矩若矩阵R的某行的某行优于第于第i1,ik行,行,则局中人局中人A在在选取最取最优策略策略时,必取,必取 。令令 ,R为从从R中划去第中划去第i1行,行,ik行后剩下的矩行后剩下的矩阵,则 的最的最优策略即原策略

47、即原对策策G的最的最优策略,策略,对于于R中中列的最列的最优关系也有关系也有类似的似的结果。果。利用利用这一定理,有一定理,有时对策策问题可先可先进行化行化简,降低矩,降低矩阵的的阶数。数。现在回在回过来来讨论美、德美、德军队对策策问题。在。在Bradleg构造的矩构造的矩阵中容易中容易发现a1ja3j, j=1,2故故 3优于于 1。根据上面的定理根据上面的定理8.5,可划去,可划去该矩矩阵的第一行,得到的第一行,得到22赢得矩得矩阵这仍然是一个无鞍点的仍然是一个无鞍点的对策矩策矩阵。设Bradley以概率以概率p1取策略取策略 2而以概而以概率率p2取略取略 3,则应有有解得解得类似地,似

48、地,设Von Kluge 以概率以概率q1取策略取策略 1而以概率而以概率q2取策略取策略 2,则应有有解得解得 。由于两由于两军作作战并非可以反复并非可以反复进行的行的对策策问题,看来最大的可能是美,看来最大的可能是美军采采取策略取策略 3而德而德军采取策略采取策略 2,即美方后,即美方后备军待命而德待命而德军第九第九军东撤。撤。事事实上,当上,当时双方指双方指挥官正是官正是这样决策的,如果真能决策的,如果真能实行,双方行,双方胜负还难以料定。但正当德以料定。但正当德军第九第九军刚开始开始东撤撤时,突然接到了希特勒的命令,突然接到了希特勒的命令要他要他们向西向西进攻,从而失去了他攻,从而失去

49、了他们有可能取得的最佳有可能取得的最佳结局,走上必然局,走上必然灭亡的道路。亡的道路。Von Kluge将将军指指挥的德的德军向西向西进攻,开始攻,开始时德德军占占领了海了海峡,但随之即被美峡,但随之即被美军包包围遭到了全遭到了全军复复灭,Von Kluge本人在失本人在失败后自后自杀。 例例8.7 (防坦克地雷(防坦克地雷场的布的布设) 实战中,攻方中,攻方为了增了增强强攻攻击力,大量力,大量使用攻使用攻击力力强强、防御、防御坚固的坦克;守方固的坦克;守方为了抵御了抵御对方攻方攻击,需要大量,需要大量杀伤敌方的有生力量,有效方的有生力量,有效对策之一是布策之一是布设防坦克地雷防坦克地雷场。1

50、、分析、分析评价防坦克地雷价防坦克地雷场的重要指的重要指标是是战斗效力,而布雷密度是基本因素之一。斗效力,而布雷密度是基本因素之一。只要有足只要有足够多的地雷,用多的地雷,用较高密度的地雷高密度的地雷场对付付敌方方进攻攻总是行之有效是行之有效的。但在的。但在实际战斗中,地雷不太可能是足斗中,地雷不太可能是足够多的。假多的。假设:(1)防坦克地雷数量有限;)防坦克地雷数量有限;(2)通)通过侦察、分析,已知察、分析,已知敌方可能采用方可能采用 1、 2、 n种种进攻策略之一;攻策略之一;(3)通)通过敌情分析,确定了防御正面的情分析,确定了防御正面的宽度,并根据我方地雷数量,度,并根据我方地雷数

51、量,设计 了了 1, 2, m这m种布雷方案。种布雷方案。问采取哪一方案或什么采取哪一方案或什么样的混合策略能有效的混合策略能有效击毁毁敌方的坦克?方的坦克?本例在本例在过去一般是凭指去一般是凭指挥员的作的作战经验定性决策的,定性决策的,现用矩用矩阵对策方法策方法进行定量行定量择优。 由于每两由于每两辆坦克之坦克之间一般要保持一般要保持50米的米的间距,因而距,因而进攻正面拉得很攻正面拉得很宽,如一个梯如一个梯队20辆坦克,坦克,进攻正面攻正面约为一公里一公里宽。因。因为只有有限个防御只有有限个防御正面,用有限个正面,用有限个进攻策略来描述攻策略来描述敌方的方的进攻状攻状态是非常接近是非常接近

52、实际情况情况的。的。对守方来守方来讲,布雷密度通常可分成,布雷密度通常可分成0.5,1,1.5,2等有限个等等有限个等级。按常。按常规做法,在防御正面上一般采用同一种技做法,在防御正面上一般采用同一种技术密度。密度。为了提高了提高杀伤率,率,现将一个防御正面划分成几段,各段允将一个防御正面划分成几段,各段允许采用不同密度。采用不同密度。2、对策决策策决策要用矩要用矩阵对策决策,关策决策,关键问题是如何列出守方的是如何列出守方的赢得矩得矩阵。由效率。由效率评定定试验可得出在各种布雷密度下的可得出在各种布雷密度下的杀伤率表,如表率表,如表8.6所示。所示。表表8.6布雷密度布雷密度0.511.52

53、杀伤率率0.640.870.950.98根据上表,在确定方案后即可根据各段不同密度根据上表,在确定方案后即可根据各段不同密度针对攻方的攻方的进攻策略攻策略计算算出坦克的出坦克的杀伤率。率。为便于理解,作便于理解,作为实例分析下面两种情况:例分析下面两种情况:情况情况1 设守方只有守方只有1500个防坦克地雷,欲布个防坦克地雷,欲布设在攻方必在攻方必经的的2公里攻公里攻击正面上。攻方一个坦克梯正面上。攻方一个坦克梯队的的20辆坦克展开成坦克展开成1公里公里宽的的阵面,但既可面,但既可能从左能从左侧进攻(策略攻(策略 1)也可能从右)也可能从右侧进攻(策略攻(策略 2)。守方)。守方设计了了三种布

54、雷方案三种布雷方案 1, 2, 3,(图8.4),),试求守方的求守方的赢得矩得矩阵和最和最优策略。策略。图图8.4情况情况1求解:容易求得守方的求解:容易求得守方的赢得矩得矩阵这是一个有鞍点的矩是一个有鞍点的矩阵,鞍点,鞍点为a22。守方只要按。守方只要按 2方案布雷,方案布雷,则不管不管攻方从哪一攻方从哪一侧进攻,攻,总可可毁毁伤对方方47.5%的坦克。的坦克。情况情况2 攻方一梯攻方一梯队20辆坦克可从左坦克可从左侧( 1)、中路()、中路( 2)或右翼()或右翼( 3)进攻,展开成攻,展开成1公里布公里布阵。守方只有。守方只有2000个防坦克地雷,初步提出三种布个防坦克地雷,初步提出三

55、种布雷方案,如雷方案,如图8.5所示,所示,试求守方采用何种布雷方案求守方采用何种布雷方案较好。好。图图8.5对情况情况2,可求得守方的,可求得守方的赢得矩得矩阵为此此时,矩,矩阵A中不存在鞍点,中不存在鞍点,对策无策无稳定解,定解,应采用混合策略。可以求采用混合策略。可以求得,此得,此时守方如按照守方如按照0.166:0.456:0.378的比例采取策略的比例采取策略 1, 2, 3布雷,布雷,平均可平均可毁毁伤对方方83.5%的坦克。的坦克。由本例可以看出,在决策由本例可以看出,在决策问题中,策略的中,策略的设计至关重要,它直接影响到至关重要,它直接影响到赢得矩得矩阵。策略的。策略的设计并

56、没有包含在决策并没有包含在决策问题的求解中,事的求解中,事实上,上,仅当当策略策略设计完成后,即策略集合完成后,即策略集合给定后,决策定后,决策问题才被才被给定,从而才能被定,从而才能被求解,因而,在用求解,因而,在用对策策论方法研究方法研究实际课题时,应当特当特别注意策略的注意策略的设计。这一部分工作既具有一定的一部分工作既具有一定的创造性又在很大程度上影响到造性又在很大程度上影响到结果,果,对它研究也是十分有趣的。它研究也是十分有趣的。8.2 决策问题决策问题人人们在在处理理问题时,常常会面,常常会面临几种可能出几种可能出现的自然情况,同的自然情况,同时又存又存在着几种可供在着几种可供选择

57、的行的行动方案。此方案。此时,需要决策者根据已知信息作决,需要决策者根据已知信息作决策,即策,即选择出最佳的行出最佳的行动方案,方案,这样的的问题称称为决策决策问题。面。面临的几的几种自然情况叫做自然状种自然情况叫做自然状态或或简称状称状态。状。状态是客是客观存在的,是不可控存在的,是不可控因素。可供因素。可供选择的行的行动方案叫做策略,方案叫做策略,这是可控因素,是可控因素,选择哪一方案哪一方案由决策者决定。由决策者决定。 例例8.8 在开采石油在开采石油时,会遇到是否在某,会遇到是否在某处钻井的井的问题。尽管勘探。尽管勘探队已作已作了大量了大量调研分析,但由于地下研分析,但由于地下结构极构

58、极为复复杂,仍无法准确,仍无法准确预测开采的开采的结果,决策者可以决定果,决策者可以决定钻井,也可以决定不井,也可以决定不钻井。井。设根据根据经验和勘探和勘探资料,料,决策者已掌握一定的信息并列出表决策者已掌握一定的信息并列出表8.7。表表8.7000不不钻井(井( 2) 402030钻井(井( 1) P( 3) = 0.3 P( 2) = 0.5 P( 1) = 0.2 (亿元)元)高高产油井(油井( 3) 一般(一般( 2) 无油(无油( 1) 自然状自然状态概率概率 收益收益 方案方案 问:决策者:决策者应如何作出决策?如何作出决策?解:由解:由题意可以看出,决策意可以看出,决策问题应包

59、含三方面信息:状包含三方面信息:状态集合集合Q= 1, n、策略集合、策略集合A = 1, m及收益及收益R = aij,其中,其中aij表示表示如果决策者如果决策者选取策略取策略i而出而出现的状的状态为j,则决策者的收益决策者的收益值为aij(当(当aij为负值时表示表示损失失值)。)。决策决策问题按自然状按自然状态的不同情况,常被分的不同情况,常被分为三种三种类型:确定型、型:确定型、风险型型(或随机型)和不确定型。(或随机型)和不确定型。确定型决策是只存在一种可能自然状确定型决策是只存在一种可能自然状态的决策的决策问题。这种决策种决策问题的的结构构较为简单,决策者只需比,决策者只需比较各

60、种方案,确定哪一方案最各种方案,确定哪一方案最优即可。即可。值得得一提的是策略集也可以是无限集,例如,一提的是策略集也可以是无限集,例如,线性性规划就可行看成一个策略划就可行看成一个策略集是限集的确定型决策,集是限集的确定型决策,问题要求决策者从可行解集合(策略集)中挑要求决策者从可行解集合(策略集)中挑选出最出最优解。确定型决策的求解并非全是解。确定型决策的求解并非全是简单的,但由于的,但由于这些些问题一般一般均有其自己的均有其自己的专门算法,本算法,本节不准不准备再作介再作介绍。在本。在本节中,我中,我们主要主要讨论风险型与不确定型决策,并介型与不确定型决策,并介绍它它们的求解方法。的求解

61、方法。一、一、风险型决策型决策问题 在在风险型决策型决策问题中存在着两种以上可能出中存在着两种以上可能出现的自然状的自然状态。决策者不知。决策者不知道究竟会出道究竟会出现哪一种状哪一种状态,但知道各种状,但知道各种状态出出现的概率有多大。例如,例的概率有多大。例如,例8.8就是一个就是一个风险型决策型决策问题。对于于风险型决策型决策问题,最常用的决策方法是期望,最常用的决策方法是期望值法,即根据各方案的期法,即根据各方案的期望收益或期望望收益或期望损失来失来评估各方案的估各方案的优劣并据此作出决策。如劣并据此作出决策。如对例例1,分,分别求出方案求出方案 1(钻井)和井)和 2(不(不钻井)的

62、期望收益井)的期望收益值:E( 1)=0.2(30)+0.520 + 0.340 = 16(万元)万元)E( 2)=0由于由于E( 1)E( 2),),选取取 1作作为最佳策略。最佳策略。风险型决策也可采用期望后悔型决策也可采用期望后悔值法求解。首先,求出采取方案法求解。首先,求出采取方案 i而而出出现状状态 j时的后悔的后悔值 。例如,如果不例如,如果不钻井,但事井,但事实上上该处可开出一口高可开出一口高产井,井,则后悔后悔值为40。因因为钻井可收益井可收益40万元,但决策者作了不万元,但决策者作了不钻井的决策,未井的决策,未获得本来可以得本来可以获得的得的40万元收益。然后,比万元收益。然

63、后,比较各方案的期望后悔各方案的期望后悔值,选取期望后悔最取期望后悔最小的方案作小的方案作为最佳策略。在例最佳策略。在例8.8中,如采用期望后悔中,如采用期望后悔值法,法,则E( 1)=6,E( 2)=22,取,取 1为最佳策略。最佳策略。在在选取策略取策略 i而出而出现状状态 j时后悔后悔值为 的理由是在的理由是在出出现状状态 j情况下的最大可能收益情况下的最大可能收益为 。定理定理8.6 最大期望收益法与最小期望后悔最大期望收益法与最小期望后悔值法等价,即两者法等价,即两者选出的最佳出的最佳 策略相同。策略相同。证明:由证明:由 得得故故 等式(等式(8.4)的右端)的右端项为一常数,其左

64、端一常数,其左端项为采取策略采取策略 i时期后悔期后悔值与与期望收益期望收益值之和,从而,若某策略使期望收益最大,之和,从而,若某策略使期望收益最大,则该策略必使期望策略必使期望后悔后悔值最小,定理得最小,定理得证。对于于较为复复杂的决策的决策问题,尤其是需要作多,尤其是需要作多阶段决策的段决策的问题,常采用,常采用较直直观的决策的决策树方法,但从本方法,但从本质上上讲,决策,决策树方法仍然是一种期望方法仍然是一种期望值法。法。 例例8.9 某工程按正常速度施工某工程按正常速度施工时,若无坏天气影响可确保在,若无坏天气影响可确保在30天内按期天内按期完工。但根据天气完工。但根据天气预报,15天

65、后天气肯定天后天气肯定变坏。有坏。有40%的可能会出的可能会出现阴阴雨天气而不影响工期,在雨天气而不影响工期,在50%的可能会遇到小的可能会遇到小风暴而使工期推暴而使工期推迟15天,天,另有另有10%的可能会遇到大的可能会遇到大风暴而使工期推暴而使工期推迟20天。天。对于可能出于可能出现的情况,的情况,考考虑两种方案:两种方案:(1)提前)提前紧急加班,在急加班,在15天内完成工程,天内完成工程,实施此方案需增加开支施此方案需增加开支18000元。元。 (2)先按正常速度施工,)先按正常速度施工,15天后根据天后根据实际出出现的天气状况再作决策。的天气状况再作决策。如遇到阴雨天气,如遇到阴雨天

66、气,则维持正常速度,不必支付持正常速度,不必支付额外外费用。用。如遇到小如遇到小风暴,有两个暴,有两个备选方案:(方案:(i)维持正常速度施工,支付工程延持正常速度施工,支付工程延期期损失失费20000元。(元。(ii)采取)采取应急措施。急措施。实施此施此应急措施有三种可能急措施有三种可能结果:有果:有50%可能减少可能减少误工期工期1天,支付天,支付应急急费用和延期用和延期损失失费共共24000元;元;有有30%可能减少可能减少误工期工期2天,支付天,支付应急急费用和延期用和延期损失失费共共18000元;有元;有20%可能减少可能减少误工期工期3天,支付天,支付应急急费用和延期用和延期损失

67、失费共共12000元。元。如遇大如遇大风暴,也有两个方案可供暴,也有两个方案可供选择:(:(i)维持正常速度施工,支付工持正常速度施工,支付工程延期程延期损失失费50000元。(元。(ii)采取)采取应急措施。急措施。实施此施此应急措施也有三种急措施也有三种可能可能结果:有果:有70%可能减少可能减少误工期工期2天,支付天,支付应急急费及及误工工费共共54000元;元;有有20%可能减少可能减少误工期工期3天,支付天,支付应急急费及及误工工费共共46000元;有元;有10%可可能减少能减少误工期工期4天,支付天,支付应急急费和和误工工费共共38000元。元。根据上述情况,根据上述情况,试作出最

68、佳决策使支付的作出最佳决策使支付的额外外费用最少。用最少。解:由于未来的天气状解:由于未来的天气状态未知,但各种天气状况出未知,但各种天气状况出现的概率已知,本例的概率已知,本例是一个是一个风险型决策型决策问题,所,所谓的的额外外费用用应理解理解为期望期望值。 本例要求作多次决策,工程初期本例要求作多次决策,工程初期应决定是按正常速度施工决定是按正常速度施工还是提前是提前紧急加急加班。如按正常速度施工,班。如按正常速度施工,则15天后天后还需根据天气状况再作一次决策,以决需根据天气状况再作一次决策,以决定是否采取定是否采取应急措施,故本例急措施,故本例为多多阶段(两段(两阶段)决策段)决策问题

69、。为便于分析便于分析和决策,采用决策和决策,采用决策树方法。方法。根据根据题意,作决策意,作决策树如如图8.6图8.6中,中,表示决策点,从它分出的分枝称表示决策点,从它分出的分枝称为方案分枝,分枝的数目就是方案分枝,分枝的数目就是方案的个数。方案的个数。表示机会表示机会节点,从它分出的分枝称点,从它分出的分枝称为概率分枝,一条概率概率分枝,一条概率分枝分枝对应一条自然状一条自然状态并并标有相有相应的的发生概率。生概率。称称为未梢未梢节点,右点,右边的的数字表示相数字表示相应的收益的收益值或或损失失值。在决策在决策树上由右向左上由右向左计算各机会算各机会节点点处的期望的期望值,并将,并将结果果

70、标在在节点旁。点旁。遇到决策点遇到决策点则比比较各方案分枝的效益期望各方案分枝的效益期望值以决定方案的以决定方案的优劣,并且用双劣,并且用双线划去淘汰掉的方案分枝,在决策点旁划去淘汰掉的方案分枝,在决策点旁标上最佳方案的效益期望上最佳方案的效益期望值,计算算步步骤如下:如下:(1)在机会)在机会节点点E、F处计算它算它们的效益期望的效益期望值E(E) = 0.5(24000)0.3(18000)0.2(12000)=19800E(F) = 0.7(54000)0.2(46000)0.1(38000)=50800(2)在第一)在第一级决策点决策点C、D处进行比行比较,在,在C点点处划去正常速度分

71、枝,在划去正常速度分枝,在D处划去划去应急分枝。急分枝。 (3)计算第二算第二级机会机会节点点B处的效益期望的效益期望值E(B) = 0.400.5(19800)0.1(50000)=14900并将并将14900标在标在B点旁。点旁。(4)在第二)在第二级决策点决策点A处进行方案比行方案比较,划去提前,划去提前紧急加班,将急加班,将14900标在在A点旁。点旁。 结论 最佳决策最佳决策为前前15天按正常速度施工,天按正常速度施工,15天后按天后按实际出出现的天气状的天气状况再作决定。如出况再作决定。如出现阴雨天气,仍阴雨天气,仍维持正常速度施工;如出持正常速度施工;如出现小小风暴,暴,则采取采

72、取应急措施;如出急措施;如出现大大风暴,也按正常速度施工,整个方案暴,也按正常速度施工,整个方案总损失失的期望的期望值为14900元。元。 根据期望根据期望值大小决策是随机型决策大小决策是随机型决策问题最常用的最常用的办法之一。法之一。实际应用用时应根据具体情况作出分析,根据具体情况作出分析,选取期望收益最大或期望取期望收益最大或期望损失最小的方案。失最小的方案。二、不确定型决策二、不确定型决策问题只知道有几种可能自然状只知道有几种可能自然状态发生,但各种自然状生,但各种自然状态发生的概率未知的决生的概率未知的决策策问题称称为不确定型决策不确定型决策问题,由于概率未知,期望,由于概率未知,期望

73、值方法不能用于方法不能用于这类决策决策问题。下面。下面结合一个例子,介合一个例子,介绍几种几种处理理这类问题的方法。的方法。例例8.10 设存在五种可能的自然状存在五种可能的自然状态,其,其发生的概率未知。有四种可供生的概率未知。有四种可供选择的行的行动方案,相方案,相应的收益的收益值见表表8.7表表8.8666534159643875432665441 5 4 3 2 1自然状自然状态方案方案(1)乐观法(法(max max原原则) 采用采用乐观法法时,决策者意在追求最大可能收益。他先,决策者意在追求最大可能收益。他先计算每一方案的算每一方案的最大收益最大收益值,再比,再比较找出其中的最大者

74、,并采取找出其中的最大者,并采取这一使最大收益最大的一使最大收益最大的方案,在例方案,在例8.10中,中,max a1j = 6,max a2j = 8,max a3j = 9,max a4j = 6,而,而max 6,8,9,6=9, 采取方案采取方案 3。(2)悲)悲观法(法(max min原原则) 采用悲采用悲观法法时,决策者意在安全保,决策者意在安全保险。他先求每一方案的最小收益。他先求每一方案的最小收益,再再比比较找出其中的最大者,并采取找出其中的最大者,并采取这一使最小收益一使最小收益值最大化的方案。最大化的方案。对于于例例8.10,min a1j = 4,min a2j = 3,

75、min a3j = 1,min a4j = 3。 因因为max 4, 3,1,3 = 4, 采取方案采取方案 1。(3)乐观系数法(系数法(Hurwicz决策准决策准则)乐观系数法采用折中的办法,引入一个参数乐观系数法采用折中的办法,引入一个参数t,0t1,称,称t为乐观系数。为乐观系数。作决策作决策时,决策者先适当,决策者先适当选取一个取一个t的的值;再;再对各方案各方案 1求出求出 ;最后再作比最后再作比较,找出使,找出使最大的方案。在例最大的方案。在例8.10中,若取中,若取t=0.5,采用采用乐观系数法决策,将系数法决策,将选取取方案方案 2。易。易见,t=1对应乐观法,而法,而t=0

76、则对应于悲于悲观法。法。(4)等可能法()等可能法(Laplace 准准则)由于不能估由于不能估计各状各状态出出现的概率,决策者的概率,决策者认为它它们相差不会相差不会过大。此大。此时,决策者采用将各状决策者采用将各状态的概率取成相同的概率取成相同值的的办法把法把问题转化化为风险型,并借型,并借用用风险型型问题的期望的期望值法来决策。法来决策。对于例于例8.10,如取各状,如取各状态出出现的概率均的概率均为0.2,用期望,用期望值法决策,将法决策,将选取策略取策略 2。不不难看出,看出,对于不确定型决策于不确定型决策问题,不,不论采用什么方法决策,最采用什么方法决策,最终采用采用的策略都不能称

77、的策略都不能称为最佳策略。事最佳策略。事实上,采取什么方法决策与决策者的心上,采取什么方法决策与决策者的心理状理状态有关。而且,即使有关。而且,即使对同一决策者,在同一决策者,在处理不同决策理不同决策问题时也可能也可能采取不同的方法。例如,在决定采取不同的方法。例如,在决定购买几元几元钱一一张的的对奖券券时,决策者也,决策者也许会采用会采用乐观法。因法。因为几元几元钱的的损失失对他来他来讲是无所是无所谓的事,小的事,小额奖金金他也他也许看不上眼,要中就来个大看不上眼,要中就来个大奖。但是,在决策。但是,在决策购买何种股票何种股票时,因,因为关系重大,也关系重大,也许他他为了保了保险又会采取悲又

78、会采取悲观法。同而,不确定型法。同而,不确定型问题的的决策充其量只能算是在决策者某种心理状决策充其量只能算是在决策者某种心理状态下的下的选优。要作出。要作出较符合符合实际情况的决策,情况的决策,还需决策者多作些需决策者多作些调查研究,以便研究,以便对未来自然状未来自然状态的出的出现作出作出较符合客符合客观实际的的预测,才能收到,才能收到较好的效果。好的效果。例例8.11(离散(离散报童模型)童模型)设某商品的需求量某商品的需求量为离散离散变量,其取量,其取值范范围为Q = 1, n, 取取值 i的概率的概率为P( i ),=1。记该商品的商品的进货量量为 (决策(决策变量),若量),若 ,进货

79、过量,每量,每单位位进货过剩将造成剩将造成k0元元过量量损失;反之,若失;反之,若 ,进货不足,每不足,每单位位进货不足将造成不足将造成ku元的元的不足不足损失。失。试确定确定该商品的最佳商品的最佳进货量。量。解:当解:当 时,将有过量损失时,将有过量损失k0( ););当当 0,(ii) (i, j = 1,2,n),), 则称之称之为正互反矩正互反矩阵(易(易见aii =1, i = 1, , n)。)。关于如何确定关于如何确定aij的的值,Saaty等建等建议引用数字引用数字19及其倒数作及其倒数作为标度。他度。他们认为,人,人们在成在成对比比较差差别时,用,用5种判断种判断级较为合适。

80、即使用相等、合适。即使用相等、较强强、强强、很、很强强、绝对地地强强表示差表示差别程度,程度,aij相相应地取地取1,3,5,7和和9。在成。在成对事物的差事物的差别介于两者之介于两者之间难以定以定夺时,aij可分可分别取取值2、4、6、8。从心理学从心理学观点来看,分点来看,分级太多会超越人太多会超越人们的判断能力,既增加了作判断的判断能力,既增加了作判断的的难度,又容易因此而提供虚假数据。度,又容易因此而提供虚假数据。Saaty等人等人还用用实验方法比方法比较了在了在各种不同各种不同标度下人度下人们判断判断结果的正确性,果的正确性,实验结果也表明,采用果也表明,采用19标度度最最为合适。合

81、适。如果在构造成如果在构造成对比比较判断矩判断矩阵时,确,确实感到感到仅用用19及其倒数及其倒数还不不够理想理想时,可以根据情况再采用因子分解聚,可以根据情况再采用因子分解聚类的方法,先比的方法,先比较类,再比,再比较每一每一类中的元素。中的元素。步步3 层次次单排序及一致性排序及一致性检验上述构造成上述构造成对比比较判断矩判断矩阵的的办法法虽能减少其他因素的干能减少其他因素的干扰影响,影响,较客客观地反映出一地反映出一对因子影响力的差因子影响力的差别。但。但综合全部比合全部比较结果果时,其中,其中难免免包含一定程度的非一致性。如果比包含一定程度的非一致性。如果比较结果是前后完全一致的,果是前

82、后完全一致的,则矩矩阵A的元素的元素还应当当满足:足: i、j、k = 1,2,n 定定义8.5 满足(足(8.5)关系式的正互反矩)关系式的正互反矩阵称称为一致矩一致矩阵。如前所述,如果判断者前后完全一致,如前所述,如果判断者前后完全一致,则构造出的成构造出的成对比比较判断矩判断矩阵应当是一个一致矩当是一个一致矩阵。但构造成。但构造成对比比较判断矩判断矩阵A共共计要作要作次比次比较(设有有n个因素要两两比个因素要两两比较),保),保证A是正互反矩是正互反矩阵是是较容易容易办到到的,但要求所有比的,但要求所有比较结果果严格格满足一致性,在足一致性,在n较大大时几乎可以几乎可以说是无法是无法办到

83、的,其中多少到的,其中多少带有一定程度的非一致性。更何况比有一定程度的非一致性。更何况比较时采用了采用了19标度,已度,已经接受了一定程度的接受了一定程度的误差,就不差,就不应再要求最再要求最终判断矩判断矩阵的的严格一格一致性。如何致性。如何检验构造出来的(正互反)判断矩构造出来的(正互反)判断矩阵A是否是否严重地非一致,重地非一致,以便确定是否接受以便确定是否接受A,并用它作,并用它作为进一步分析研究的工具?一步分析研究的工具?Saaty等人在等人在研究正互反矩研究正互反矩阵和一致矩和一致矩阵性性质的基的基础上,找到了解决上,找到了解决这一困一困难的的办法,法,给出了确定矩出了确定矩阵A中的

84、非一致性是否可以允忍的中的非一致性是否可以允忍的检验方法。方法。定理定理8.7 正互反矩正互反矩阵A的最大特征根的最大特征根max必必为正正实数,其数,其对应特征向量的所特征向量的所有分量均有分量均为正正实数。数。A的其余特征根的模均的其余特征根的模均严格小于格小于max。(。(证明从略)明从略)现在来考察一致矩在来考察一致矩阵A的性的性质,回复到将,回复到将单位重量的大石位重量的大石块剖分成重量剖分成重量为 1, n的的n块小石小石块的例子,如果判断者的判断的例子,如果判断者的判断结果完全一致,果完全一致,则构构造出来的一致矩造出来的一致矩阵为容易看出,一致矩容易看出,一致矩阵A具有以下性具

85、有以下性质:定理定理8.88.8 若若A A为一致矩一致矩阵,则(1)A必必为正互反矩正互反矩阵。(2)A的的转置矩置矩阵AT也是一致矩也是一致矩阵。(3)A的任意两行成比例,比例因子(即的任意两行成比例,比例因子(即wi /wj)大于零,从)大于零,从而而rank(A)=1(同(同样,A的任意两列也成比例)。的任意两列也成比例)。(4)A的最大特征根的最大特征根max=n,其中,其中n为矩矩阵A的的阶。A的其余特征的其余特征根均根均为零。零。(5)若)若A的最大特征根的最大特征根max对应的特征向量的特征向量为W=(w1, wn)I,则aij=wi /wj, i,j = 1,2,n。(注:(

86、注:(1 1)、()、(2 2)可由一致矩阵定义得出,()可由一致矩阵定义得出,(3 3)(5 5)均容易由)均容易由线性代数知识得到,证明从略)。线性代数知识得到,证明从略)。定理定理8.9 n阶正互反矩正互反矩阵A为一致矩一致矩阵当且当且仅当其最大特征根当其最大特征根 max=n,且当正互反矩,且当正互反矩阵A非一致非一致时,必有,必有maxn。证明:明:设正互反矩正互反矩阵A的最大特征根的最大特征根为max, 对应的特征向量的特征向量为W=(w1, wn)T。 由定理,由定理,max0且且wi 0,i=1,n。又由特征根和特征向量。又由特征根和特征向量的性的性质知,知,AW=max W,

87、 故故 , i = 1,n (8.7)(8.7)式两)式两边同除同除wi且关于且关于i从从1到到n相加,得到相加,得到即即(8.8)式的括号内共有)式的括号内共有 项。 (8.8) 现证明必要性,由一致矩明必要性,由一致矩阵性性质(5),有),有 ,故由(故由(8.8)式,得)式,得max=n。再再证明充分性。由于明充分性。由于(8.9) 当且当且仅当当 =1(即(即 )时(8.9)式中的等号成立,)式中的等号成立,故由(故由(8.8)式)式max=n。因而当。因而当max=n时必有必有 =1,于是于是aijajk=aik i,j,k = 1,2,n成立,成立,A为一致矩一致矩阵。当当A非一致

88、矩非一致矩阵时,(,(8.9)式中的等号不能)式中的等号不能对一切一切i,j成立,从而必有成立,从而必有maxn。 根据定理根据定理8.9,我,我们可以由可以由max是否等于是否等于n来来检验判断矩判断矩阵A是否是否为一致一致矩矩阵。由于特征根。由于特征根连续地依地依赖于于aij,故,故max比比n大得越多,大得越多,A的非一致的非一致性程度也就越性程度也就越为严重,重,max对应的的标准化特征向量也就越不能真准化特征向量也就越不能真实地反地反映出映出X=x1,xn在在对因素因素Z的影响中所占的比重。因此,的影响中所占的比重。因此,对决策者提决策者提供的判断矩供的判断矩阵有必要作一次一致性有必

89、要作一次一致性检验,以决定是否能接受它。,以决定是否能接受它。 为确定多大程度的非一致性是可以允忍的,确定多大程度的非一致性是可以允忍的,Saaty等人采用了如下等人采用了如下办法:法:(1)求出)求出 ,称,称CI为A的一致性指的一致性指标。容易看出,当且容易看出,当且仅当当A为一致矩一致矩阵时,CI = 0。CI的的值越大,越大,A的非一的非一致性越致性越严重。利用重。利用线性代数知性代数知识可以可以证明,明,A的的n个特征根之和等于其个特征根之和等于其对角角线元素之和(即元素之和(即n)故)故CI事事实上是上是A的除的除max以外其余以外其余n1个特征个特征根的平均根的平均值的的绝对值。

90、若。若A是一致矩是一致矩阵,其余,其余n1个特征根均个特征根均为零,故零,故CI=0;否;否则,CI0,其,其值随随A非一致性程度的加重而非一致性程度的加重而连续地增大。当地增大。当CI略大于零略大于零时(对应地,地,max稍大于稍大于n),),A具有具有较为满意的一致性;否意的一致性;否则,A的一致性就的一致性就较差。差。(2)上面定)上面定义的的CI值虽然能反映出非一致性的然能反映出非一致性的严重程度,但仍未能指明重程度,但仍未能指明该非一致性是否非一致性是否应当被当被认为是可以允是可以允许的。事的。事实上,我上,我们还需要一个度量需要一个度量标准。准。为此,此,Saaty等人又研究了他等

91、人又研究了他们认为最不一致的矩最不一致的矩阵用从用从19及及其倒数中随机抽取的数字构造的正互反矩其倒数中随机抽取的数字构造的正互反矩阵,取充分大的子,取充分大的子样,求得最大,求得最大特征根的平均特征根的平均值 , 并定并定义称称RI为平均随机一致性指平均随机一致性指标。对n =1,11,,Saaty给出了出了RI的的值,如表,如表8.10所示。所示。表表8.10N1234567891011RI000.580.901.121.241.321.411.451.491.51(3)将)将CI与与RI作比作比较,定,定义称称CR随机一致性比率。随机一致性比率。经大量大量实例比例比较,Saaty认为,在

92、,在CR0.10时可以可以认为判断矩判断矩阵具有具有较为满意的一致性,否意的一致性,否则就就应当重新当重新调整判断矩整判断矩阵,直至具有直至具有满意的一致性意的一致性为止。止。综上所述,在步上所述,在步3中中应先求出先求出A的最大特征的最大特征根根max及及max对应的特征向量的特征向量W=(w1, wn)T,进行行标准化,准化,使得使得 。再再对A作一致性作一致性检验:计算算 ,查表得到表得到对应于于n的的RI值,求,求 ,若若CR0.1,则一致性一致性较为满意,以意,以 i作作为因子因子xi在上在上层因子因子Z中所具有中所具有的的权值。否。否则必需重新作比必需重新作比较,修正,修正A中的元

93、素。只有在一致性中的元素。只有在一致性较为满意意时,W的分量才可用作的分量才可用作层次次单排序的排序的权重。重。现对本本节例例8.13(即合理利用利(即合理利用利润问题的例子)的例子)进行行层次次单排序。排序。为求出求出C1、C2、C3在目在目标层A中所占的中所占的权值,构造,构造OC层的成的成对比比较矩矩阵,设构造出的成构造出的成对比比较判断知判断知阵A=311153C1C2C3C1 C2 C30于是于是经计算,算,A的最大特征根的最大特征根max=3.038,CI=0.019,查表得表得RI = 0.58,故,故CR = 0.033。因。因CR0.1,接受矩,接受矩阵A,求出,求出A对应于

94、于max的的标准化准化特征向量特征向量W= ( 0.105, 0.637, 0.258)T,以,以W的分量作的分量作为C1、C2、C3在在目目标O中所占的中所占的权重。重。类似求措施似求措施层中的中的P1、P2在在C1中的中的权值,P2、P3在在 C2中的中的权值及及P1、P2在在C1中的中的权值: 1P231P1P2P1C113max=2,CI = CR = 0W = (0.75, 0.25)T15P31P2P3P2C215max=2,CI = CR = 0W = (0.167, 0.833)T1P221P1P2P1C312max=2,CI = CR = 0W = (0.66, 0.333)

95、T经层次单排序,得到图经层次单排序,得到图8.8。合理利用企业利润合理利用企业利润调动职工积调动职工积极性极性C1提高企业技提高企业技术水平术水平C2改善职工工改善职工工作生活条件作生活条件C3发奖金发奖金P1扩建福利扩建福利事业事业P2引进新设备引进新设备P3目标层目标层O准则层准则层C措施层措施层P0.1050.6370.2580.750.250.1670.8330.6670.3332设上一上一层次(次(A层)包含)包含A1,Am共共m个因素,它个因素,它们的的层次次总排序排序权值分分别为a1,am。又。又设其后的下一其后的下一层次(次(B层)包含)包含n个因素个因素B1,Bn,它,它们关

96、于关于Aj的的层次次单排序排序权值分分别为b1j,bnj(当(当Bi与与Aj无关无关联系系时,bij = 0)。)。现求求B层中各因素关于中各因素关于总目目标的的权值,即求,即求B层各因素的各因素的层次次总排排序序权值b1,bn,计算按表算按表8.11所示方式所示方式进行行,即即 ,i =1,n。表表8.11bn mbn2bn1BnB2 mb22b21B2B1mb12b11B1B层总排序排序权值AmA m A2a 2A1a1层A层B步步4 层次总排序及一致性检验层次总排序及一致性检验最后,在步骤(最后,在步骤(4)中将由最高层到最低层,逐层计算各层次中的诸因)中将由最高层到最低层,逐层计算各层

97、次中的诸因素关于总目标(最高层)的相对重要性权值。素关于总目标(最高层)的相对重要性权值。例如,例如,对于前面考察的工厂合理利用留成利于前面考察的工厂合理利用留成利润的例子,措施的例子,措施层层次次单排排序序权值的的计算如表算如表8.12所示。所示。 层C层PC1C2C3层P的的总排序排序权值0.1050.6370.258P10.7500.6670.251P20.250.1670.3330.218P300.83300.531对层次次总排序也需作一致性排序也需作一致性检验,检验仍象仍象层次次总排序那排序那样由高由高层到低到低层逐逐层进行。行。这是因是因为虽然各然各层次均已次均已经过层次次单排序的

98、一致性排序的一致性检验,各成各成对比比较判断矩判断矩阵都已具有都已具有较为满意的一致性。但当意的一致性。但当综合考察合考察时,各,各层次的非一致性仍有可能次的非一致性仍有可能积累起来,引起最累起来,引起最终分析分析结果果较严重的非一致重的非一致性。性。设B层中与中与Aj相关的因素的成相关的因素的成对比比较判断矩判断矩阵在在单排序中排序中经一致性一致性检验,求得求得单排序一致性指排序一致性指标为CI(j),(j =1,m),相,相应的平均随机一致性指的平均随机一致性指标为RI(j) (CI(j)、RI(j)已在已在层次次单排序排序时求得求得),则B层总排序随机一致性比排序随机一致性比率率为CR

99、= 当当CR0,k=0。(步(步2)迭代计算)迭代计算 ,k = 0,1,。若若 ,i = 1,n,则取则取W= 为为A的对应于的对应于max的特征向量的近似,的特征向量的近似,否则转步否则转步2。(步(步3) 将将 标准化,即求标准化,即求 其中其中 为为 的第的第i个分量。个分量。(步(步4)求)求max的近似的近似值对前面例子中的对前面例子中的OC判断矩阵,判断矩阵,若取若取 , =0.001,利用幂法求近似特征向量如下:,利用幂法求近似特征向量如下:(第一次迭代)(第一次迭代) (0) = (0.511,3,1.444)T, = 4.955,求得,求得W(1) = (0.103,0.6

100、05,2.91)T(第二次迭代)(第二次迭代) (2) = (0.321,1.993,0.802)T, = 3.116,求得,求得W(2) = (0.103,0.639,0.257)T(第三次迭代)(第三次迭代) (3) = (0.316,1.925,0.779)T, = 3.02,求得,求得W(3) = (0.105,0.637,0.258)T(第四次迭代)(第四次迭代) (4) = (0.318,1.936,0.785)T, = 3.04,求得,求得W(4) = (0.105,0.637,0.258)T因因 ,取,取W = W(4)。进而,可求得。进而,可求得 。3、和积法、和积法(步(步

101、1)将判断矩阵)将判断矩阵A的每一列标准化,即令的每一列标准化,即令 , i, j =1, ,n令令 。(步(步2)将)将 中元素按行相加得到向量中元素按行相加得到向量 ,其分量,其分量 ,i = 1, , n。(步(步3)将)将 标准化,得到准化,得到W,即,即 ,i = 1, , nW即为即为A的(对应于的(对应于max的)近似特征向量。的)近似特征向量。(步(步4)求最大特征根近似值)求最大特征根近似值 。仍以前面例子中的仍以前面例子中的OC判断矩阵为例:判断矩阵为例:按列标准化按列标准化 标准化标准化,以上近似方法计算都很简单,计算结果与实际值相差很小,且以上近似方法计算都很简单,计算

102、结果与实际值相差很小,且A的非一的非一致性越弱相差越小,而当致性越弱相差越小,而当A为一致矩阵时两者完全相同。为一致矩阵时两者完全相同。按行相加按行相加三、层次分析法应用举例三、层次分析法应用举例在应用层次分析法研究问题时,遇到的主要困难有两个:(在应用层次分析法研究问题时,遇到的主要困难有两个:(1)如何)如何根据实际情况抽象出较为贴切的层次结构;(根据实际情况抽象出较为贴切的层次结构;(2)如何将某些定性的量)如何将某些定性的量作比较接近实际的定量化处理。层次分析法对人们的思维过程进行了作比较接近实际的定量化处理。层次分析法对人们的思维过程进行了加工整理,提出了一套系统分析问题的方法,为科

103、学管理和决策提供加工整理,提出了一套系统分析问题的方法,为科学管理和决策提供了较有说服力的依据。但层次分析法也有其局限性,主要表现在:了较有说服力的依据。但层次分析法也有其局限性,主要表现在:(1)它在很大程度上依赖于人们的经验,主观因素的影响很大,它至)它在很大程度上依赖于人们的经验,主观因素的影响很大,它至多只能排除思维过程中的严重非一致性(即矛盾性),却无法排除决多只能排除思维过程中的严重非一致性(即矛盾性),却无法排除决策者个人可能存在的严重片面性。(策者个人可能存在的严重片面性。(2)比较、判断过程较为粗糙,不)比较、判断过程较为粗糙,不能用于精度要求较高的决策问题。能用于精度要求较

104、高的决策问题。AHP至多只能算是一种半定量(或至多只能算是一种半定量(或定性与定量结合)的方法,如何用更科学、更精确的方法来研究问题定性与定量结合)的方法,如何用更科学、更精确的方法来研究问题并作出决策,还有待于进一步的探讨研究。并作出决策,还有待于进一步的探讨研究。在应用层次分析法时,建立层次结构模型是十分关键的一步。现再在应用层次分析法时,建立层次结构模型是十分关键的一步。现再分析若干实例,以便说明如何从实际问题中抽象出相应的层次结构。分析若干实例,以便说明如何从实际问题中抽象出相应的层次结构。例例8.14 招聘工作人员招聘工作人员某单位拟从应试者中挑选外销工作人员若干名,根据工作需要,单

105、位领某单位拟从应试者中挑选外销工作人员若干名,根据工作需要,单位领导认为招聘来的人员应具备某些必要的素质,由此建立层次结构如图导认为招聘来的人员应具备某些必要的素质,由此建立层次结构如图8.9所示。所示。招聘人员综合情况招聘人员综合情况知识知识能力能力外表外表经经济济知知识识外外语语知知识识法法律律知知识识组组织织能能力力公公关关能能力力计计算算机机操操作作气气质质身身高高体体形形C层层B层层A层层0.250.50.25B1B2B30.1860.7370.0770.3330.3330.3330.7380.1680.094C1C2C3C4C5C6C7C8C9该单位领导认为,作为外销工作人员,知识

106、面与外观形象同样重要,而该单位领导认为,作为外销工作人员,知识面与外观形象同样重要,而在能力方面则应有稍强一些的要求。根据以上看法,建立在能力方面则应有稍强一些的要求。根据以上看法,建立AB层成对层成对比较判断矩阵比较判断矩阵 求得求得max =3,CR = 0。1211121B1B2B3B3B2B1A类似建立似建立BC层之之间的三个成的三个成对比比较矩矩阵: 注:注:权系数是根据后面的系数是根据后面的计算添加上去的算添加上去的 1C3815C231C1C3C2C1B1111C6111C5111C4C6C5C4B21C921C8751C7C9C8C7B3W = (0.186,0.737,0.0

107、77)T = 3.047, = 3.047, CRCR = 0.08 = 0.08W = ( , , )TW = (0.738,0.168,0.094)T = 3.017, = 3.017, CRCR = 0.08 = 0.08经层次次总排序,可求得排序,可求得C层中各因子中各因子Ci在在总目目标中的中的权重分重分别为:0.047,0.184,0.019,0.167,0.167,0.167,0.184,0.042,0.024 招聘工作可如下进行,根据应试者的履历、笔试与面试情况,对他们的招聘工作可如下进行,根据应试者的履历、笔试与面试情况,对他们的九项指标作九项指标作19级评分。设其得分为级评

108、分。设其得分为X= (x1,x9)T,用公式,用公式y = 0.047x1 + 0.184x2 +0.019x3 +0.167 (x4 + x5 + x6 )+ 0.184x7 + 0.042x8 + 0.024x9 计算总得分,以计算总得分,以y作为应试者的综合指标,按高到低顺序录用。作为应试者的综合指标,按高到低顺序录用。例例8.15 (挑选合适的工作)经双方恳谈,已有三个单位表示愿意录用某(挑选合适的工作)经双方恳谈,已有三个单位表示愿意录用某毕业生。该生根据已有信息建立了一个层次结构模型,如图毕业生。该生根据已有信息建立了一个层次结构模型,如图8.10所示所示。工作满意程度工作满意程度

109、研究研究课题课题发展发展前途前途待待遇遇同事同事情况情况地理地理位置位置单位单位名气名气工作工作1工作工作2工作工作3目标层目标层A准则层准则层B方案层方案层CB1B2B3B4B5B6C1C2C3该生经冷静思考、反复比较,建立了各层次的成对比较矩阵:该生经冷静思考、反复比较,建立了各层次的成对比较矩阵:133222B611311B51B43511B314211B214111B1B6B5B4B3B2B1A由于比较因素较多,此成对比较矩阵甚至不是正互反矩阵。由于比较因素较多,此成对比较矩阵甚至不是正互反矩阵。(方案(方案层) 12C3314C21C1C3C2C1B1125C314C21C1C3C2

110、C1B211C311C231C1C3C2C1B3(层次次总排序排序)如表如表8.13所示。所示。 表表8.13准则研究课题发展前途待遇同事情况地理位置单位名气总排序权值准则层权值0.160.190.190.050.120.30方案层工作10.140.100.320.280.470.770.40单排序工作20.620.330.220.650.470.170.34权值工作30.240.570.460.070.070.060.26根据层次总排序权值,该生最满意的工作为工作根据层次总排序权值,该生最满意的工作为工作1。(由于篇幅限。(由于篇幅限止,本例省略了一致性检验)止,本例省略了一致性检验)例例8

111、.16 作品作品评比。比。 电影或文学作品评奖时,根据有关部门规定,评判标准有教育性、艺术电影或文学作品评奖时,根据有关部门规定,评判标准有教育性、艺术性和娱乐性,设其间建立的成对比较矩阵为性和娱乐性,设其间建立的成对比较矩阵为由此可求得由此可求得W = (0.158,0.187,0.656)T,CR = 0.048 ( 0.1)本例的本例的层次次结构模型如构模型如图8.11所示所示 电影或文学作品评比教育性艺术性娱乐性作品1作品n0.1580.1870.656在具体评比时,可请专家对作品的教育性、艺术性和娱乐性分别打分。在具体评比时,可请专家对作品的教育性、艺术性和娱乐性分别打分。根据作品的

112、得分数根据作品的得分数X = (x1, x2, x3)T,利用公式,利用公式y = 0.158x1 + 0.187x2 +0.656x3 计算出作品的总得分,据此排出的获奖顺序。计算出作品的总得分,据此排出的获奖顺序。读者不难看出,读者不难看出,A矩阵的建立对评比结果的影响极大。事实上,整个评矩阵的建立对评比结果的影响极大。事实上,整个评比过程是在组织者事先划定的框架下进行的,评比结果是按组织者的比过程是在组织者事先划定的框架下进行的,评比结果是按组织者的满意程度来排序的。这也说明,为了使评比结果较为理想,满意程度来排序的。这也说明,为了使评比结果较为理想,A矩阵的建矩阵的建立应尽可能合理。立

113、应尽可能合理。例例8.17 教师工作情况考评。教师工作情况考评。某高校为了做好教师工作的综合评估,使晋级、奖励等尽可能科学合理,某高校为了做好教师工作的综合评估,使晋级、奖励等尽可能科学合理,构造了图构造了图8.12所示的层次结构模型。所示的层次结构模型。教育工作评估教育工作评估教教学学工工作作量量指指导导研研究究生生数数教教学学内内容容教教学学效效果果主主要要刊刊物物发发表表论论文文数数一一般般论论文文数数国国家家级级获获奖奖项项目目省省部部级级获获奖奖项项目目出出版版著著作作字字数数翻翻译译著著作作字字数数数量数量质量质量论文论文项目项目著作著作教学教学科研科研OA1A2B1B2B3B4B

114、5C1C2C3C4C5C6C7C8C9C10图8.12在在C层中共列出了十项指标,有些可用数量表示,有些只能定性表示(如层中共列出了十项指标,有些可用数量表示,有些只能定性表示(如教学效果只能分为若干等级)。即使对于可以定量表示的指标,由于各指教学效果只能分为若干等级)。即使对于可以定量表示的指标,由于各指标具有不同的量纲,例如一篇论文并不等同于一个获奖项目,互相之间不标具有不同的量纲,例如一篇论文并不等同于一个获奖项目,互相之间不能直接进行比较。为此,在层次单排序与总排序时应先统一化成无量纲量。能直接进行比较。为此,在层次单排序与总排序时应先统一化成无量纲量。如可将每一指标分为若干等级并对每

115、一等级规定一个合适的得分数。然后如可将每一指标分为若干等级并对每一等级规定一个合适的得分数。然后再根据各因子的重要程度利用成对比较及层次排序来确定各因子的权。再根据各因子的重要程度利用成对比较及层次排序来确定各因子的权。在评估某教师时,只要根据该教师的各项指标,利用由层次分析得到的在评估某教师时,只要根据该教师的各项指标,利用由层次分析得到的评估公式计算其最终得分即可。评估公式计算其最终得分即可。上述诸例有一个共同的特征,模型涉及的因素间存在着较为明确的因果上述诸例有一个共同的特征,模型涉及的因素间存在着较为明确的因果关系,这些因果关系又可以分成若干个层次。同一层次中的各因素间相关系,这些因果

116、关系又可以分成若干个层次。同一层次中的各因素间相互影响很小基本上可略去不计,上层因素对下层的某些因素存在着逐层互影响很小基本上可略去不计,上层因素对下层的某些因素存在着逐层传递的支配关系,但不考虑相反的逆关系。传递的支配关系,但不考虑相反的逆关系。更复杂的层次结构可以考虑同一层次内各因素间的相互影响,也可以考更复杂的层次结构可以考虑同一层次内各因素间的相互影响,也可以考虑下层因素对上层因素的反馈作用,因研究这类层次结构需要用到更多虑下层因素对上层因素的反馈作用,因研究这类层次结构需要用到更多的数学知识,本处不准备再作进一步的介绍,有兴趣的读者可以查阅有的数学知识,本处不准备再作进一步的介绍,有兴趣的读者可以查阅有关的书籍和文献。关的书籍和文献。

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 办公文档 > 工作计划

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号