5决策分析6学时

上传人:鲁** 文档编号:591398966 上传时间:2024-09-17 格式:PPT 页数:123 大小:1.37MB
返回 下载 相关 举报
5决策分析6学时_第1页
第1页 / 共123页
5决策分析6学时_第2页
第2页 / 共123页
5决策分析6学时_第3页
第3页 / 共123页
5决策分析6学时_第4页
第4页 / 共123页
5决策分析6学时_第5页
第5页 / 共123页
点击查看更多>>
资源描述

《5决策分析6学时》由会员分享,可在线阅读,更多相关《5决策分析6学时(123页珍藏版)》请在金锄头文库上搜索。

1、第五讲第五讲 决策分析决策分析李刚李刚西安交通大学管理学院西安交通大学管理学院主要内容主要内容n1管理决策管理决策n2 不确定性问题的决策不确定性问题的决策n3风险型决策分析风险型决策分析n4 博弈与决策博弈与决策n5 冲突分析冲突分析1 管理决策n一、基本概念n决策是管理的重要职能,它是决策者对系统方案所做决定的过程和结果,决策是决策者的行为和职责。 n按照H.A.西蒙(H.A.Simon)的观点,“管理就是决策”。n因此,决策分析的一般过程也即管理系统分析的过程。n决策是一种过程n情报活动、设计活动、抉择活动、实施活动1 管理决策n决策问题的基本模式决策问题的基本模式n(, j j )n:

2、决策者的第种策略或者方案策略或者方案,使决策变量,决策者可以控制nj j :决策者和决策问题所出的第种环境环境条件,是状态变量条件,是状态变量,决策者不可控;n:决策者在第中状态下选择第种方案的结果,是决策问题的价值函数值,决策问题的价值函数值,一般叫做损益值、效用值一般叫做损益值、效用值决策问题的要素决策问题的类型 完全把握 确定性决策 不完全把握 风险性决策 完全不把握 对自然不确定 不确定性决策 对人的不确定 对抗性决策(对策) A A 政治、经济、军事、能源、人口、教育等决策 战略、战术等决策 W W 定性、定量、模糊决策 单目标、多目标决策 隐式、显式决策 决策者决策者 个人、群体决

3、策1 管理决策n决策问题分类决策问题分类n例子:某部门要进行工程项目建设,经过估算可知:如果下月开工建设,天气好,则可以按时完工,企业能获得收益元;n如果开工后天气不好,则不能正常施工,企业损失元;n不论天气好坏,均不开工,企业损失元;n请作出是否开工决策?1 管理决策n1)确定型决策)确定型决策n知道决策人知道可靠的天气预报信息,则可以做出确定型决策.比如,直到下个月是好天气,则决策为:天气好开工不开工1 管理决策n确定型决策必须具备的条件n存在着决策人希望达到的一个目标(比如 利润最大)n只存在一个确定的自然状态(比如天气好)n存在着可供决策人选择的两个或者两个以上的行动方案(策略)n不同

4、行动方案存在确定的自然状态下的损益值,通过计算,可以定量表示1 管理决策n2)风险型决策)风险型决策n又叫做统计型决策或者随机型决策n在上例中,如果决策人能够获知下月天气好坏的概率信息,则其决策问题就是风险型决策天气好天气不好概率(0.2)概率(0.8)开工50000-10000不开工-5000-5000开工:.().不开工:.2+(-5000) .=-5000决策:开工决策:开工1 管理决策n风险型决策存在的条件风险型决策存在的条件n存在着决策人希望达到的一个目标存在着决策人希望达到的一个目标n存在着两个或者两个以上不以决策人主观意志为转存在着两个或者两个以上不以决策人主观意志为转移的自然状

5、态移的自然状态n存在着两个或者两个以上可供决策人选择的行动方存在着两个或者两个以上可供决策人选择的行动方案案n不同方案在不同自然状态下的损益值,可以定量表不同方案在不同自然状态下的损益值,可以定量表示示n在几种状态中,未来究竟出现哪一种的可能性,可在几种状态中,未来究竟出现哪一种的可能性,可以预先估算出来;以预先估算出来;1 管理决策n3)不确定性决策)不确定性决策n不知道各类自然状态今后发生的概率信息n例子:某企业要生产新产品,有三种方案,建立新的自动化生产线(方案A1),改建原有的生产线(方案A2),在原来的生产线继续生产(方案A3)n对该产品的市场销量的估计为:需要量很大,一般,较低,很

6、低等四种情况。经过估算,在不同的生产线方案下,不同销售状态下的损益值如下表:1 管理决策较高一般较低很低P1P2P3P4新建自动生产线A1850420-150-400改建生产线A2600400-100-350原有车间生产A340025090-50缺少关于各种自然状态(销售好坏)出现的概率信息,所以是不确定性决策不确定性决策1 管理决策n4.对抗型决策对抗型决策Wij=f(Ai,Bj)i=1,m,j=1,n其中:A决策者的策略集;B竞争对手的策略集可采用对策论及其冲突分析等方法来分析解决。这类决策分析问题是当前管理、经济界比较关注的问题。n5.多目标决策多目标决策决策分析过程n1 信息活动n为决

7、策收集足够的、准确的信息n2 设计活动n选择决策目标,即确定决策的依据和准则。n3 抉择活动n根据已确定的准则,对各种方案进行分析、计算和评价,用以选出一个最优方案的活动过程n4 实施活动n对决策的方案进行实施、跟踪和学习。风险性决策分析过程风险性决策分析过程n确定决策模型结构:构建决策树确定决策模型结构:构建决策树n估算各行动方案下的损益值:估计备选方案在估算各行动方案下的损益值:估计备选方案在不同环境状态下所付出的代价和取得的收益不同环境状态下所付出的代价和取得的收益n确定主观概率:估计未来环境中各种状态出现确定主观概率:估计未来环境中各种状态出现的概率的概率n评价方案:按估计的后果和概率

8、计算备选方案评价方案:按估计的后果和概率计算备选方案的效益(效用)指标,按照效益(效用)最大的效益(效用)指标,按照效益(效用)最大者为最优方案者为最优方案风险性决策分析过程风险性决策分析过程n灵敏度分析:由于后果值和概率的主观灵敏度分析:由于后果值和概率的主观性和不确定性,确定决策模型中参数的性和不确定性,确定决策模型中参数的变化范围变化范围n收集信息:对灵敏度高的参数需收集更收集信息:对灵敏度高的参数需收集更多信息进行研究,但考虑信息价值问题多信息进行研究,但考虑信息价值问题n选择方案选择方案主要内容主要内容n1管理决策管理决策n2 不确定性问题的决策不确定性问题的决策n3风险型决策分析风

9、险型决策分析n4 冲突分析冲突分析2 不确定型问题的决策不确定型问题的决策n决策者根据自己的主观倾向进行决策,决策者根据自己的主观倾向进行决策,根据决策者主观态度不同有以下五种常根据决策者主观态度不同有以下五种常用的决策准则和方法:用的决策准则和方法: 悲观主义准则悲观主义准则 乐观主义准则乐观主义准则 乐观系数准则乐观系数准则 最小机会损失准则最小机会损失准则 等可能性准则等可能性准则悲观主义准则悲观主义准则n从各方案的从各方案的最小益损值最小益损值中选择中选择最大的最大的,也称也称“小中取大小中取大”法,是一种万无一失法,是一种万无一失的保守型决策者的选择准则。的保守型决策者的选择准则。较

10、高一般较低很低P1P2P3P4新建自动生产线A1850420-150-400改建生产线A2600400-100-350原有车间生产A340025090-50悲观主义准则悲观主义准则n把每个方案在不同自然状态下的最小损益值找出来n则MinA1850,420,-150,-400=-400nMinA2600,400,-100,-350=-350nMinA3400,250,90,-50=-50n然后从各方案的最小损益值中找到一个最大的nMax-400,-350,-50=-50n与最大值相对应的方案是A3,则选择A3方案乐观主义准则乐观主义准则n决策者对客观情况总是抱乐观态度,从各方案决策者对客观情况总

11、是抱乐观态度,从各方案最大益损值中选择最大的,也称最大益损值中选择最大的,也称“大中取大大中取大”。是一种偏于冒进的决策准则。是一种偏于冒进的决策准则。n把每个方案在不同自然状态下的最大损益值找出来n则MinA1850,420,-150,-400=850nMinA2600,400,-100,-350=600nMinA3400,250,90,-50=400n然后从各方案的最大损益值中找到一个最大的nMax850,600,400=850n与最大值相对应的方案是A1,则选择A1方案乐观系数准则乐观系数准则n一种折衷准则,决策者对客观条件的估计既不一种折衷准则,决策者对客观条件的估计既不乐观也不悲观,

12、主张一种平衡,用一个乐观系乐观也不悲观,主张一种平衡,用一个乐观系数数 (01) (01) ,计算各方案的折衷益损值,计算各方案的折衷益损值,从中选取最大的。从中选取最大的。n计算方法计算方法n求取各方案的最大损益值求取各方案的最大损益值ximaxximaxn求取各方案的最小损益值求取各方案的最小损益值ximinximinn各方案的折衷损益值为各方案的折衷损益值为Xi=Xi=XimaxXimax + +(1- 1- )XiminXiminnXiXi最大者为最优方案最大者为最优方案乐观系数准则乐观系数准则S1 S2 S3 S4=0.7 A1 20012545-25132.5A2 300200-5

13、0-175157.5A3 425210-75-200237.5后悔值准则后悔值准则n决策者一般易于接受某状态下收益最大的方案,决策者一般易于接受某状态下收益最大的方案,但由于无法预知那一状态一定出现,当决策者但由于无法预知那一状态一定出现,当决策者没有采纳收益最大的方案,就会感到后悔。没有采纳收益最大的方案,就会感到后悔。n求取每个状态下,最大收益值与其他收益值之求取每个状态下,最大收益值与其他收益值之差作为后悔值或机会损失值,然后从各方案的差作为后悔值或机会损失值,然后从各方案的最大后悔值中选取最小值,与之对应的方案就最大后悔值中选取最小值,与之对应的方案就是最优方案是最优方案后悔值准则后悔

14、值准则较高较高一般一般较低较低很低很低P1P2P3P4新新建建自自动动生生产产线线A1850*420*-150-400改建生产线改建生产线A2600400-100-350原有车间生产原有车间生产A340025090*-50*1)先找出对应各种自然状态下自然状态下每个行动方案的最大损益值,用*标注后悔值准则后悔值准则n求出各方案在不同自然状态下的后悔值较高较高一般一般较低较低很低很低P1P2P3P4新建自动生产线新建自动生产线A1850*-850=0420*-420=090*-(-150)=240-50*-(-400)=350改建生产线改建生产线A2850*-600=250420*-400=-2

15、090*-(-100)=190-50*-(-350)=300原有车间生产原有车间生产A3850*-400=450420*-250=17090*-90*=0-50*-50=0后悔值准则后悔值准则n从各方案的最大后悔值中,找出最小后悔值nMin350,300,450=300n与之对应的行动方案是A2等可能性准则等可能性准则n决策者不能肯定那种状态会出现,采取一视同决策者不能肯定那种状态会出现,采取一视同仁的态度,认为出现的可能性相等,有仁的态度,认为出现的可能性相等,有n n个状个状态,其出现的概率均为态,其出现的概率均为1/1/n n,计算各方案的期计算各方案的期望最大收益值,从中选取最大的。望

16、最大收益值,从中选取最大的。n例如:例如:S1 S2 S3 S4ER A1 20012545-2586.25A2 300200-50-17568.75A3 425210-75-20090主要内容主要内容n1管理决策管理决策n2 不确定性问题的决策不确定性问题的决策n3风险型决策分析风险型决策分析n4 冲突分析冲突分析3风险型决策分析风险型决策分析n风险型决策也称随机型决策或统计型决风险型决策也称随机型决策或统计型决策策n最大可能性法最大可能性法n最大期望收益准则(最大期望收益准则(Expected Monetary Expected Monetary Value, EMVValue, EMV)

17、n最小机会损失准则(最小机会损失准则(Expected Expected Opportunity Loss, EOLOpportunity Loss, EOL)n决策树法决策树法最大可能性法最大可能性法n从可能出现的状态中,选择一个概率最大的状态进行从可能出现的状态中,选择一个概率最大的状态进行决策,而不考虑其他状态,问题转化为确定型决策决策,而不考虑其他状态,问题转化为确定型决策n应用条件:在收益矩阵中的元素差别不大,而各状态应用条件:在收益矩阵中的元素差别不大,而各状态中某一状态的概率明显地大的多;中某一状态的概率明显地大的多;n如果各状态概率很接近,而益损值相差较大时,不宜如果各状态概率

18、很接近,而益损值相差较大时,不宜采用。采用。S1 (0.1)S2 (0.8)S3 (0.1)甲406015乙504030丙604010丁50305EMVEMV和和EOLEOLn决策目标考虑的是收益值,计算各方案决策目标考虑的是收益值,计算各方案的期望收益值,从中选择期望收益最大的期望收益值,从中选择期望收益最大的。的。n决策目标考虑的是损失值,计算各方案决策目标考虑的是损失值,计算各方案的期望损失值,从中选取期望损失最小的期望损失值,从中选取期望损失最小的。的。决策树法决策树法n描述多级决策(序列决策)的工具描述多级决策(序列决策)的工具n所谓决策树法就是利用树形图模型来描述决策所谓决策树法就

19、是利用树形图模型来描述决策分析问题,并直接在决策树图上进行决策分析。分析问题,并直接在决策树图上进行决策分析。 n“ ”表示决策节点,从它引出的分枝为方案枝,表示决策节点,从它引出的分枝为方案枝,分枝数量与方案数量相同,分枝上要注明方案分枝数量与方案数量相同,分枝上要注明方案名称。名称。n“O”表示状态节点,从它引出的分枝为状态分表示状态节点,从它引出的分枝为状态分枝或概率分枝,分枝数量与可能出现的自然状枝或概率分枝,分枝数量与可能出现的自然状态数量相同,分枝上要注明状态出现的概率。态数量相同,分枝上要注明状态出现的概率。“ ”表示结果节点,不同方案在各种状态下所表示结果节点,不同方案在各种状

20、态下所取得的结果(益损值),标注在结果节点的右取得的结果(益损值),标注在结果节点的右端。端。决策决策树树1级级决策决策2级级决策决策A1A2A3S1S2S3决策树举例决策树举例n有一钻探队做石油钻探,可以先做地震试验,费用为有一钻探队做石油钻探,可以先做地震试验,费用为0.30.3万元万元/ /次,然后决定钻井与否,钻井费用为次,然后决定钻井与否,钻井费用为1 1万元,万元,出油收入为出油收入为4 4万元。万元。n根据历史资料,试验结果好的概率为根据历史资料,试验结果好的概率为0.60.6,不好的概率,不好的概率为为0.40.4;n结果好钻井出油的概率为结果好钻井出油的概率为0.850.85

21、,不出油的概率为,不出油的概率为0.150.15;n结果不好钻井出油的概率为结果不好钻井出油的概率为0.10.1,不出油的概率为,不出油的概率为0.90.9。n也可不做试验而直接凭经验决定是否钻井,这时出油也可不做试验而直接凭经验决定是否钻井,这时出油的概率为的概率为0.550.55,不出油的概率为,不出油的概率为0.450.45,试用决策树进,试用决策树进行决策。行决策。决策树计算决策树计算试验-0.3不试验好0.6不好0.4钻井不-10.850.154004004003.42.40.402.21.21.441.20.10.90.550.45不出油结论:不试验直接钻井,期望收入为结论:不试验

22、直接钻井,期望收入为1.21.2万元。万元。钻井不钻井钻井不钻井多级决策树n某化妆品公司生产BF型号护肤化妆品。由于现有生产工艺比较落后,产品质量不易保证且成本较高,销路受到影响。n在产品价格保持现有水平时无利可图,当产品价格下降时还要亏本,只是在产品价格上涨时才稍有盈利。n为此公司决定要对该产品生产工艺进行改进,提出两种方案以供选择:n一是从国外引进一条自动化程度较高的生产线;n另一是自行设计一条有一定水平的生产线。多级决策树n根据公司以往引进和自行设计的工作经验显示,引进生产线投资较大,但产品质量好且成本较低,年产量大,引进技术的成功率为80%。n而自行设计生产线,投资相对较小,产品质量也

23、有保证,成本也较低,年产量也大,但自行设计的成功率只有60%。n进一步考虑到无论是引进或自行设计生产线,产量都能增加。多级决策树n因此,公司生产部门又制定了两个生产方案:一是产量与过去相同(保持不变),一是产量增加,为此又需要进行决策。n最后,若引进或自行设计均不成功,公司只得仍采用原有生产工艺继续生产,产量自然保持不变。n公司打算该护肤化妆品生产5年。n根据以往价格统计资料和市场预测信息,该类产品在今后5年内价格下跌的概率为0.1;n保持原价的概率为0.5,而涨价的概率为0.4。跌价原价涨价0.10.50.4 按原有工艺生产-1000125引进生产线A1(成功率0.8)产量不变B1-2508

24、0200产量增加B2-400100300自行设计生产线A2(成功率0.6)产量不变B1-2500250产量增加B2-350-250650状态概率损益值方案产量不变B1跌价(0.1)原价(0.5)上涨(0.4)-100012540跌价(0.1)原价(0.5)上涨(0.4)-2508020095跌价(0.1)原价(0.5)上涨(0.4)-100012540跌价(0.1)原价(0.5)上涨(0.4)-250025075跌价(0.1)原价(0.5)上涨(0.4)-350-250650100跌价(0.1)原价(0.5)上涨(0.4)-400100300130产量不变B1自行设计生产线A2引进生产线A1产

25、量增加B2产量增加B213076100112112失败(0.2)成功(0.8)成功(0.6)失败(0.4)信息价值分析信息价值分析n在灵敏度分析后,有些关键状态的概率有时灵在灵敏度分析后,有些关键状态的概率有时灵敏度很高,需要进一步收集信息,提高先验概敏度很高,需要进一步收集信息,提高先验概率的精度,来更准确可靠地评定这些参数。率的精度,来更准确可靠地评定这些参数。n进一步收集信息需要进行进一步收集信息需要进行“调查研究调查研究”,通过,通过收集样本、统计分析取得更可靠的信息。收集样本、统计分析取得更可靠的信息。n“调查研究调查研究”所得到的咨询信息一般都有误差,所得到的咨询信息一般都有误差,

26、调研结果要考虑其失误的可能性调研结果要考虑其失误的可能性n“调查研究调查研究”需要费用,不管咨询结果是否有需要费用,不管咨询结果是否有用,都得付费,因此在调研前要考虑所得到的用,都得付费,因此在调研前要考虑所得到的信息用途多大,即信息的价值分析。信息用途多大,即信息的价值分析。n为了衡量调研人员提供信息的用途大小,一般为了衡量调研人员提供信息的用途大小,一般根据历史资料,用该人员(单位)过去提供正根据历史资料,用该人员(单位)过去提供正确或不正确信息的概率来表示。确或不正确信息的概率来表示。信息价值分析信息价值分析n决策所需的信息一般可以分为两类。n一类是完全信息,即据此可以得到完全肯定的自然

27、状态信息,这样就有助于正确的决策,从而使决策结果能获得较大的收益,但为获得完全信息的代价也相当可观,而且在现实中和在多数情况下,要获得这种完全信息也较为困难或根本不可能做到;n另一类是抽样信息,这是一类不完全可靠的信息。通过抽样所获得的信息,用统计方法来推断自然状态出现的概率,据此来选择行动方案。抽样信息虽不十分可靠,但为获得此类信息的代价也较小,且在实际中和在多数情况下,也只可能获得这类信息以供决策之需。 完全信息价值完全信息价值 n某化工厂生产一种化工产品,据对统计资料的分析表明,该产品的次品率可以分成五个等级(即五种状态),每种等级(状态)的概率如表73所示。n进一步的分析可知,产品次品

28、率的高低与该产品所用主要原粒的纯度有关。今已知,化工原料纯度高,次品率低(如S10.02),反之则次品率高(S50.20)。而化工原料的纯度高低,又与运输、保存日期等因素有关。完全信息价值完全信息价值纯度状态(次品率)S1(0.02)S2(0.05)S3(0.10)S4(0.15)S5(0.20)概率0.200.200.100.200.30完全信息价值完全信息价值n为此,工厂主管生产的部门建议在生产该产品前,先对该化工原料增加一道“提纯”工序,通过提纯工序,能使全部原料都处于S1状态,从而降低了次品率。n但增加提纯工序就增加了工序费用,经过核算可知,每批原料的提纯费用为3400元。经估算,在不

29、同纯度状态下其益损值如表74所示。n如果在生产前,先将化工原料检验一下,通过检验可以完全掌握每批化工原料处于何种纯度状态,这样可以对不同纯度的原料采用不同策略,即提纯或不提纯,从而使益损期望值为最大。完全信息价值完全信息价值S1S2S3S4S50.200.200.100.200.30提纯(A1) 10001000100010001000不提纯(A2)440032002000800-400状态概率损益值方案完全信息价值完全信息价值n由图76可知,通过检验,当某批原料纯度处于S1、S2或S3状态时,采用A2(不提纯)方案,其益损值大于A1方案。n反之若处于S4或S5状态时,则采用A1(提纯)方案,

30、这时其益损值大于A2方案。n据此可计算益损期望值为2220元。与没有经过检验工序相比,由于通过检验完全知道原料纯度的状态信息,因此可得完全信息的价值为2220-1760=460元。n通过该例可知,为获得完全信息所要付出的代价,不应大于完全信息所能得到的收益期望,本例中即不应大于460元n本例如图76中提纯方案分枝菱形内的数字为50,即增加检验工序只花费50元,而能多获460元的收益。因此,增加检验工序是可取的。 抽样信息价值抽样信息价值 n某家电公司由于原产品结构已陈旧落后,产品质量差而销路不广。为满足广大消费者日益增长的需要,公司拟对产品结构进行改革,制定了两种设计方案。n全新设计方案(A1

31、),即产品结构全部重新设计;n改型设计方案(A2),即在原有产品结构基础上加以改进。 抽样信息价值抽样信息价值n如采用全新设计方案,由于结构全部重新设计。原有许多工艺装备都不能继续利用,需重新添置,故投资费用较大。n但由于结构新型且工艺先进,故可提高产品质量和生产率,如产品销路好,则工厂可获较大收益。反之,如销路差,则因开工不足,投资未能及早回收,公司亏损也大。n又如采用改型设计方案,则原有工艺装备基本上都可利用,故投资费用少,因此无论销路好或销路坏,都能获得一定收益而不致亏损。公司根据以往统计资料可得销路好的概率为0.35,销路差的概率为0.65,计划将该产品生产5年,其益损值可以估算如表7

32、5所示。 抽样信息价值抽样信息价值销路好(1) 销路差(2)0.350.65全新设计A145 -22.5改型设计A2 184.5益 损状态方案概率P(G/fb)=0.13311.50511.505P(G/fg)=0.589P(B/fg)=0.41145-22.517.2605890411184.512.56全新设计改型设计17.26预测P(fb)=0.525P(B/fb)=0.86745-22.5-13.500.1330.867184.56.306.30全新设计改型设计9.225全新设计P(G)=0.35P(B)=0.6545-22.51.125P(G)=0.35P(B)=0.65184.59

33、.225改型设计不预测-0.5P(fg)=0.475四、效用值理论四、效用值理论n决策准则决策准则可传递性可传递性独立性独立性n期望收益值的缺陷期望收益值的缺陷后果多样性:是多次试验的平均值后果多样性:是多次试验的平均值决策者的价值观决策者的价值观需要一种能表达人们主观价值的衡量指标,并需要一种能表达人们主观价值的衡量指标,并能综合衡量各种定量和定性的后果能综合衡量各种定量和定性的后果这样的指标没有统一的客观尺度,因人而异,这样的指标没有统一的客观尺度,因人而异,视个人的经济、社会和心理条件而视个人的经济、社会和心理条件而定定伯努利期望效用值理论伯努利期望效用值理论n效用值:人们在拥有财富多少

34、不一的条效用值:人们在拥有财富多少不一的条件下,增加同样的财富所感受到的效用件下,增加同样的财富所感受到的效用值是不同的,随财富的增加效用值总是值是不同的,随财富的增加效用值总是在增加,但增长率是递减的在增加,但增长率是递减的n买彩券:买彩券:5 5(500500)元一张,)元一张,0.50.5概率中奖概率中奖得得1010(10001000)元,期望收益值为零;)元,期望收益值为零;n问题:如何遵循理性原则求得效用值?问题:如何遵循理性原则求得效用值?冯诺曼冯诺曼- -摩根斯坦期望效用值理论摩根斯坦期望效用值理论n定义了计量效用值,使效用值的计算成定义了计量效用值,使效用值的计算成为现实为现实

35、n在在“伯伯”的基础上提出,针对风险状况的基础上提出,针对风险状况下财富的价值,而下财富的价值,而“伯伯”的是针对确定的是针对确定状况下财富的价值而提出的状况下财富的价值而提出的效用曲线性质分析效用曲线性质分析稳重型效用曲线稳重型效用曲线n稳重型效用曲线:非负,U(0)=0 ,曲线形状随财富X的增加而趋于扁平,即随着财富的增多,附加财富带来的满足程度逐渐下降,效用曲线性质分析效用曲线性质分析冒险型效用曲线冒险型效用曲线n冒险型效用曲线:曲线为凸(呈碗状)n一些小企业主,创业时(或处于较穷困情况)愿意冒风险,而具有一定规模后又变的稳妥,这种情况下效用曲线为组合曲线效用曲线混合型效用曲线博弈与决策

36、李刚西安交通大学管理学院引子博弈的不确定性n在一次具体的战斗中,一方是否发起进攻,是一个决策。n如果发起进攻,对方肯定有所反应,客观上讲,必然会有一个确定的结果存在,这是确定性的表现。n但是最后的结果如何,取决于对方如何应对, 所以在发起进攻时,并不能知道结局是怎样的,这就是不确定性的表现。n如果一方发起进攻后,另一方马上投降,则战斗结束;n如果对方进行反攻,从理论上来讲,结果取决于双方实力以及双方收益的大小。n由此可以看出博弈的广泛存在, 在现实生活中做出任何决策时,实际上都受到其他主体决策的影响并对我们做决策产生一定影响,决策的结果除了由我们自己决定外还要受到其他决策主体的影响,这实际上就

37、是一个博弈过程。 二、参与者(二、参与者(PLAYERPLAYER)n参与博弈的利益主体叫做参与者。参与博弈的利益主体叫做参与者。英文原意为玩主,英文原意为玩主,也有译成局中人的。在二人博弈中,有两个参与者;也有译成局中人的。在二人博弈中,有两个参与者;在三人博弈中,有三个参与者;在多人博弈中,有多在三人博弈中,有三个参与者;在多人博弈中,有多个参与者。个参与者。 三、策略和策略空间n1策略n 在给定条件博弈中,参与者完整的一套行动计划叫做策略。例如我国古代著名的谋略故事“田忌赛马”中,国王的赛马计划是:先出上等马,再出中等马,最后出下等马;田忌的赛马计划是:先出下等马,再出上等马,最后出中等

38、马。这里的赛马计划就是一套完整的行动计划,也就是一个策略。 2策略空间n参与者可以选择的策略的全体就组成了策略空间。例如在“田忌赛马”中,共有六种行动方案可供选择:上中下(先出上等马,再出中等马,最后出下等马)、上下中、中上下、中下上、下上中、下中上。决策时田忌可以选择其中任何一个策略,在故事中,因为国王固定选择了上中下,所以田忌选择了下上中,从而赢得了比赛。任何一人策略的改变都将使结果也随之改变,比如国王选择了中下上,而田忌选择了下上中,则国王将赢得比赛。 四、报酬函数与报酬矩阵n1报酬函数n 每一个参与博弈的参与者,他的收益依附于各个参与者所出的策略,这种收益与策略的依附关系就构成了报酬函

39、数。也就是说,第i个参与者的收益取决于所有参与者的策略,而不仅仅是自己的策略,表示成数学式子就是:Ri=Ri(S1,S2,Sn)。其中Ri表示第i个参与者的收益,Si (i=1,n) 表示第i个参与者所出的策略。 2报酬矩阵n参与博弈的多个参与者的报酬可以用一个矩阵或框图表示,这样的矩阵或框图就叫做报酬矩阵。例如有甲乙两个供货商组成一个价格卡特尔,双方都有选择遵守约定价格或者违反约定价格的权利。报酬矩阵如下图所示:乙守约违约 甲守约 8,8 6,10 违约 10,6 7,7 n 矩阵中每组数字中的前一个数字表示甲的收益,后一个数字表示乙的收益。当甲守约时,乙如果守约,收益为8,乙如果违约,收益

40、为10;当甲违约时,乙如果守约,收益为6,乙如果违约,收益为7。所以,当甲守约时,乙会选择违约(108);当甲违约时,乙也会选择违约(76)。反之不管乙如何选择,甲都会选择违约,最终的结果是双方都选择违约。报酬矩阵改变,就会影响到双方的决策。例如双方的报酬矩阵变成下图所示:乙守约违约 甲守约 12,12 2,10 违约 10,2 -4,-4n 此时双方可能都选择守约,因为当甲守约时,乙此时双方可能都选择守约,因为当甲守约时,乙会选择守约(会选择守约(12101210);当甲违约时,乙也会选择守约);当甲违约时,乙也会选择守约(2-42-4)。反之不管乙如何选择,甲都会选择守约,)。反之不管乙如

41、何选择,甲都会选择守约,最终的结果是双方都选择守约。最终的结果是双方都选择守约。 n 博弈过程参与者的决策行为要受到博弈规则的影响,即博弈规则的变化会改变报酬矩阵中的报酬值。比如在图 8-1中,由于卡特尔中的每一个供货商都追求自身利益的最大化,并且没有措施来保证遵守价格约定,表面上可能都信誓旦旦的承诺守约,但是实际中双方会违约。 n 如果卡特尔追求整体利益的最大化,并且由于历史、政治、制度、惩罚等措施来保证遵守价格约定,双方就可能和平共处,遵守价格约定。在历次中东战争中,由于民族宗教原因,OPEC石油的产量和价格都得到了严格的执行。 五、均衡及博弈的解n当博弈的所有参与者都不想改换策略时所达到

42、的稳定状态叫做均衡,均衡的结果叫做博弈的解。n 比如图8-1中甲乙两个供货商组成的卡特尔。不管甲如何选择,乙必然选择违约,同样不论乙如何选择,甲必然选择违约。最终双方都选择了违约,并且只要给定的条件不变,双方就都不会改变策略,结果非常稳定,达成均衡。 n 在这个均衡中,不管甲如何选择,乙都不会改变策略,同样无论乙如何选择,甲也不会改变策略,这种均衡就叫做占优均衡。这种无论对方如何决策,自己总是会选择的策略叫做占优策略,由双方的占优策略所达成的均衡叫做占优均衡。n 再比如,在学校中,学生平时学习可能是非常努力也可能是非常懒散;老师可能把考试题出的很难,也可能出的很容易。从博弈论的角度,这里的老师

43、和学生就构成了一个博弈,双方的报酬矩阵如下: 老师出考题难 易学生 学习 努力 90,85 100,90 懒散 50,60 90,70 n 由于老师出难题比出容易题要花费更多的时间和精力,所以收益较低,从而无论学生平时努力程度如何,老师一定选择出容易的题;由于学生只要努力学习就会取得更好的成绩,所以无论老师所出考题难度如何,学生一定会选择努力学习,这同样构成一个占优均衡。n 经常遇到的还有一种均衡,是有条件的均衡,叫做纳什均衡。简单的说就是敌变我变、敌不变我亦不变。在后面第二节中将详细介绍纳什均衡。 六、囚犯两难困境n 囚犯两难困境是博弈论中一个著名的例子,讲的是甲乙两名嫌疑犯作案后被警察抓住

44、,分别被关在不同的屋子里受审,双方不能互通消息,每名嫌疑犯都面临坦白和不坦白两种选择。警察告诉他们:在两人都坦白的情况下,各判刑10年;在两人都不坦白的情况下,各判刑3年;在一人坦白另一人不坦白的情况下,坦白的一方会被从轻处罚,只被判刑1年,不坦白的一方则被重判15年。可以根据坦白后是否会受到制裁两种情况来讨论最终的均衡结果。 1 1、坦白后不会受到制裁时的情况、坦白后不会受到制裁时的情况 此时,双方收益矩阵如下:此时,双方收益矩阵如下: 乙不坦白坦白甲不坦白 -3,-3 -15,-1 坦白 -1,-15 -10,-10 图8-4n 如图,在乙不坦白的情况下,如果甲坦白,甲会被从轻处罚,只被判

45、刑1年,乙被重判15年;如果甲也不坦白,由于证据不足,甲乙都只会被判刑3年。 n 在乙坦白的情况下,如果甲也坦白,甲乙会被判刑10年;如果甲不坦白,乙会被从轻处罚,只被判刑1年,甲则被重判15年。n 可见,在乙不坦白的情况下,甲最好是坦白,从而可以被从轻处罚;在乙坦白的情况下,因为被判刑10年总比15年要好,甲最好也是坦白,所以甲会选择坦白。 n 同理,无论甲如何选择,乙的最好选择也是坦白。结果双方都选择坦白,都被判刑10年。可见,我国公安机关”坦白从宽,抗拒从严“的心理攻势在大多数情况下都是可以奏效的。囚犯两难困境说明个人的理性可能导致集体结果的不妙。在现实社会中,人人都追求完美反而可能会导

46、致社会变得很糟糕。n 2.坦白后会受到制裁时的情况n 博弈论的一个重要思想就是规则改变报酬矩阵,改变了报酬矩阵就会影响到行为方式。如果犯罪组织有着严格的惩罚制度,任何一个罪犯坦白后,不论坦白的事情严重与否,犯罪组织一定会杀人灭口,并且总是能迅速做到。这个规则将改变报酬矩阵,新的报酬矩阵如下图所示: 乙不坦白坦白甲不坦白 -3,-3 -15,- 坦白 -,-15 -, - n 由由于于坦坦白白后后将将被被灭灭口口,所所以以收收益益将将是是- - 。在在乙乙不不坦坦白白的的情情况况下下,甲甲最最好好是是不不坦坦白白;在在乙乙坦坦白白的的情情况况下下,因因为为被被判判刑刑1515年年总总比比死死去去

47、要要好好,甲甲最最好好也也是是不不坦坦白白,所所以以甲甲会会选选择择不不坦坦白白。同同理理,无无论论甲甲如如何何选选择择,乙乙的的最最好好选选择择也也是是不不坦坦白白。结结果果双双方方都都选选择择不不坦坦白白,各自被判刑各自被判刑3 3年。年。智猪博弈有一头大猪和一头小猪住在同一个猪圈里,猪有一头大猪和一头小猪住在同一个猪圈里,猪圈的一侧放者猪食槽,另一侧安装着一个控制圈的一侧放者猪食槽,另一侧安装着一个控制食物供应的按钮。按一次按钮,有食物供应的按钮。按一次按钮,有8个单位的个单位的食物进槽,但需承担食物进槽,但需承担2个单位的成本。偌大猪个单位的成本。偌大猪小猪同时到达猪食槽,大猪吃到小猪

48、同时到达猪食槽,大猪吃到5个单位的食个单位的食物,小猪吃到物,小猪吃到3个单位的食物;若大猪先到,个单位的食物;若大猪先到,大猪吃大猪吃7个单位的食物,小猪只能吃到个单位的食物,小猪只能吃到1个单个单位;若小猪先到,小猪吃到位;若小猪先到,小猪吃到4个单位食物,大个单位食物,大猪也吃到猪也吃到4个单位食物。个单位食物。智猪博弈(智猪博弈(boxedpigsgame)小猪小猪去按去按等待等待去按去按3,12,4大猪大猪等待等待7,-10,0大猪的收益外部化,小猪不劳而获,免费搭了大猪的收益外部化,小猪不劳而获,免费搭了大猪的便车。大猪的便车。众里寻他千百度n约会游戏:假定你是位女性,决定要结婚,

49、你身边交际圈里有100位合适的单身男子都有意追求你,你的任务是,从他们中挑选一位作为结婚对象。你会怎样做呢?n严格要求:每个人你只能约会一次,而且只能当场决定选择还是放弃,不能把他们“冷冻”起来作为后备,一旦你选择了其中一个,你就没有机会再约会别人了。n如果你的动机是找到最好的那个人,现实是没有一个策略可以保证实现这个目标。n一个办法是:将第一组人(比如先取10名)作为试验品,就像在糖果店试吃品一样,之后如果遇到比这组更好的对象,就可以考虑嫁给他。n损失惨重的两种情形:前10名刚好是全部里面最糟的,碰巧下一个又是倒数11名;最好的选择恰好已经在前10名当中,导致你设了一个永远无法达到的标准,最

50、后只好在所有机会都出现后选择第100个。两难选择n抽样从10改为30或40如何?n如果你抽去的样本太少,你得出的结论可能并不准确;可是如果你取样太多,结论倒是准确了,可是又很可能错失最佳选择(他正好在取样里,被牺牲掉了)。n有没有最佳样本数的存在?n苏格拉底的答案:1/3分出大中小三类,1/3验证是否正确,1/3选择属于大类中的一个。小鸡博弈(小鸡博弈(thegameofchicken)设想汤姆和吉米是两个顽皮的小孩,他们在小设想汤姆和吉米是两个顽皮的小孩,他们在小伙伴的鼓动下要进行一场关于勇气的比赛:两伙伴的鼓动下要进行一场关于勇气的比赛:两人分别从一条独木桥的两端冲向对方,谁退却人分别从一

51、条独木桥的两端冲向对方,谁退却谁就是谁就是“小鸡小鸡”。显然,如果两个人都向前冲,。显然,如果两个人都向前冲,则两败俱伤,设支付水平为则两败俱伤,设支付水平为-2;如果一个勇进;如果一个勇进而另一个退却,则勇进者受到小伙伴的欢呼,而另一个退却,则勇进者受到小伙伴的欢呼,退却者受到嘲讽,设支付分别为退却者受到嘲讽,设支付分别为4和和-1;若两人;若两人同时退却,则一起受到小伙伴的嘲笑,设支付同时退却,则一起受到小伙伴的嘲笑,设支付为为0,因为两人一起受到嘲笑比起一人单独受到,因为两人一起受到嘲笑比起一人单独受到嘲笑要好受些。嘲笑要好受些。吉米吉米退却退却勇进勇进退却退却汤姆汤姆勇进勇进0,0-1

52、,44,-1-2,-2有两个均衡。实际会怎样?有两个均衡。实际会怎样?可能之一:两兵相遇,勇者胜可能之一:两兵相遇,勇者胜未来影响现在n地摊、车站、旅游点人群流动性大,不但商品和服务质量差,而且假货横行,因为商家和顾客之间“没有明天”。n在公共汽车上,两个陌生人可能为一个座位吵架,可如果他们认识就会相互谦让。道德、法律、权力利益的划分,都与“还要见面”有关。n扩大未来的影响。使得未来相对于现在更重要些:使相互作用更持久、更频繁(分解:商人们喜欢一个大订单分别按每次发货时间付款,而不愿等到最后付总帐)改变对策的四个可能的收益支付值;教给对策者促进合作的准则、实施和技能;出租比出售好n1937-1

53、987,曼哈顿人口增长了300万,但出租车只多了100辆。短缺迹象:合法经营一辆出租车的权利(“大奖章”)在市场公开标价12.5万美元;同时,出租车按每天两班、每班12小时出租,每班价格约为60美元(每年约4.5万美元)。n假如市政府拍卖100个新的大奖章,就能轻松赚到1250万美元。问题是,所有的获得者担心,市政府明年还会拍卖100个新的大奖章。如果市政府不能承诺限制大奖章数量,结果是没有人愿意为大奖章出高价。n纽约市政府应采取什么办法,能同时增加出租车的数目和库房收入?n出租大奖章而不是出售。没有人要为以后的价值付钱。n一步一步作出承诺:人们愿意在一周或一年内相信政府,新的规定的通过需要一

54、段时间;与其将今年的大奖章、明年的大奖章以及未来的大奖章合并为一枚永久性的大奖章,然后再出售,还不如一次只出售一枚大奖章,从而恢复自己的可信度。公平还是不公平n如果给你两个师的兵力,你来当司令,任务是攻克“敌人”占据的一座城市,“敌人”的守备是三个师;规定双方的兵力只可整师调动,通往城市的道路有甲、乙两条,当你发起攻击时,若你的兵力超过敌人你就获胜;若你的兵力比“敌人”守备部队兵力少或者相等,你就失败。你如何制定攻城方案?斜坡上的均衡n拿出1元钞票,请大家给这张钞票开价;每次叫价以5分为单位;出价最高者得到这张1元钞票,但出价最高者和次高者都要向拍卖人支付相当于出价数目的费用。n骑虎难下,及早

55、退出乃是明智之举。僵化的理性与逻辑nBF实验(Bee and fly):把几只蜜蜂和几只苍蝇撞在一个玻璃瓶中,然后将瓶子平放,让瓶底朝向窗口,结果会怎么样?蜜蜂会不停地在瓶子底部寻找出口,直到累死;而苍蝇在不到两分钟内全部逃出。n蜜蜂喜欢光亮而且有智力,坚定地认为出后在光线最亮的地方(实验人员的臆测);苍蝇则对事物的逻辑不在意,到处乱飞。别人的钱包更诱人n一位教授和两个学生(A和B)共进午餐,教授提议完一个游戏:把二人的钱包交给教授,教授数了一下发现其中一个钱包的金额是另一个的两倍(但他没有告诉谁多谁少),然后问他们是否愿意互换钱包?藏羚羊n珍稀动物的保护问题面临着一个难解的矛盾;藏羚羊“戒指

56、披肩”,生存岌岌可危,政府严禁猎杀,抬高了藏羚羊毛的价格(大腕名言:“能出2000美金的主儿,就不在乎出4000美金”。而且,4000美金反而更能显示其身价),使盗猎成了“高风险、高收益”的生意,于是更多的亡命之徒加入盗猎者的行列。n怎么办?允许随便捕杀肯定不是办法:没等价格下降,藏羚羊就会被猎杀光了。人工饲养理论上似乎可以,但是技术上未必可行,而且,一旦允许藏羚羊交易,野生、饲养又很难分辨,可怜的野生藏羚羊还是要被捕杀。这真是一个难解决的问题。毒品n毒品之害,人所公认,可是在荷兰等国家,买卖轻度麻醉品确实合法的。很多学者,包括两位诺贝尔经济学奖获得者弗里德曼和贝克尔,也都公开支持麻醉品合法化

57、。他们的理由如下:1.我们缺乏道德上的理由去惩罚那些自杀的人。我们可以用言语来劝说,但我们没有权利组织和惩罚他们;2.麻醉品合法化后“自愿”食用麻醉品的人数可能会上升,也可能会下降,但“被迫”食用麻醉品的人数肯定会下降;3.由于麻醉品只能在地下买卖,所以品质的不到保证,瘾君子的身体会受到更严重的损害;4.管制之下,麻醉品的价格极高,这会诱使瘾君子从事其他犯罪活动;一旦放开管制,价格暴跌,原来靠麻醉品牟取暴利的犯罪分子会失去赖以生存的温床,瘾君子从事其他犯罪活动的机会也会减少。三个快枪手n在一个西部小镇上,三个枪手正在进行生死决斗,枪手甲枪法精准,十发八中;枪手乙枪法不错,十发六中;枪手丙枪法拙

58、劣,十发四中。假如三人同时开枪,谁活下来的机率大一些?n才华出众者创造历史,碌碌无为者繁衍子孙。投票制度的利弊n选举结果取决于选举规则。nA/B/C三人竞选公职,9位选民偏好如下:n2位公民:A B Cn4位公民:C A Bn3为公民:B A Cn不同规则下的结果n简单多数且第一选择有效:C胜出;多数人并不喜欢C,但却拥有忠贞选民;n加权计票(2/1/0):A胜出;n偏好投票(绝对多数第一名获胜;剔出第一名票数最少者,依原序重新分配):B胜出。n谁才是“民众真正的期待”?“英雄”为何成了失败者nA/B/C三候选人,17人投票n第一选择:A/6人,B/6人,C/5人n在首选B和C的选民中分别有2

59、人和3人把A作为第二选择n复选制n每位选民只投一票,当无人得票过半时,在最高票的两人中进行复选n A (比B多1票)n假设第一次选举前,A展示了一件英雄行为(如救了一位落水儿童),使B的部分支持者(即对A也有好感的那2个人)在最后一分钟决定改投给A。结果是A的8票没有过半,B少了2票遭到淘汰;n在复选中,A仍维持8票,C则因获得了B选民的4票后来居上,赢得了最后胜利。一个悖论n解决公地悲剧的一个方法(通过私有化人们从保护中获得利益)却是更大的公地悲剧的根源(个人和国家追逐利益,破坏地球环境)。这其实也并不奇怪,“人类社会学三定律”其中有这样一条:一个系统内的解决之道,将成为更大系统的难题。参考

60、读物n白波/著,博弈游戏,哈尔滨出版社,2004年5月nAvinash K. Dixit and Barry J. Nalebuff著,王尔山译,策略思维 商界、政界及日常生活中的竞争策略,中国人民大学出版社,2002第三节: 冲突分析一、对策论与冲突分析一、对策论与冲突分析 冲冲突突分分析析( (Conflict Conflict Analysis)Analysis)是是国国外外近近年年来来在在经经典典对对策策论论( (Game Game Theory)Theory)和和偏偏对对策策理理论论( (MetagameMetagame Theory)Theory)基基础础上上发发展展起起来来的的一

61、一种种对对冲冲突突行行为为进进行行正正规规分分析析( (Formal Formal Analysis)Analysis)的的决策分析方法,决策分析方法, 其其主主要要特特点点是是能能最最大大限限度度地地利利用用信信息息,通通过过对对许许多多难难以以定定量量描描述述的的现现实实问问题题的的逻逻辑辑分分析析,进进行行冲冲突突事事态态的的结结果果预预测测和和过过程程分分析析( (预预测测和评估、事前分析和事后分析和评估、事前分析和事后分析) ),帮助决策者科学周密地思考问题。,帮助决策者科学周密地思考问题。它它是是分分析析多多人人决决策策和和解解决决多多人人竞竞争争问问题题的的有有效效工工具具之之一

62、一。国国外外已已在在社社会会、政政治治、军军事事、经经济济等等不不同同领领域域的的纠纠纷纷谈谈判判、水水力力资资源源管管理理、环环境境工工程程、运运输输工工程程等等方方面面得得到到了了应应用用,我我国国也也已已在在社社会会经经济济、企业经营和组织管理等领域开始应用。企业经营和组织管理等领域开始应用。对对策策( (Game)Game)是是决决策策者者在在某某种种竞竞争争场场合合下下作作出出的的决决策策,是是一一种种人人为为的的不不确确定定型型决决策策( (竞竞争争或或对对抗抗型型决决策策) )。作作为为一一类类特特殊殊的的决决策策问问题题,对策的基本模式对策的基本模式( (概念模型概念模型) )

63、如图如图7 71010所示。所示。一般决策:Vij=f(Aj,j)Aj:决策者第I中选择,I=I,m(行动方案、可控因素、决策变量)j:决策对象所处的第j种环境条件,j=I,n(自然状态、不可控因素、状态变量)Vij:决策系统状态的价值函数(益损函数)人为不确定性决策:Vij(A)=f(Aj,Bj)Aj:决策者第I中选择,Bj:竞争对手第j种选择Vij(A):决策者的益损(赢得、支付)函数对策:G=N,A,VG-GAME,N-局中人集合A-局中人策略集合V-赢得、支付或益损值图710 对抗型决策的概念模型对对策策论论起起源源于于2020世世纪纪2020年年代代初初,4040年年代代中中和和60

64、60年年代代中中均均得得到到了了很很大大发发展展,7070年年代代以以来来在在许许多多方方面面又取得了丰硕成果。又取得了丰硕成果。 7070年年代代初初,N.Howard(N.Howard(英英) )提提出出了了一一种种以以现现实实生生活活中中最最容容易易出出现现 的的情情况况为为基基础础的的对对策策理理论论MetagameMetagame Theory(Theory(偏偏对对策策理理论论) )。其其基基本本思思想想是是认认为为在在选选择择策策略略时时要要考考虑虑其其他他局局中中人人可可能能的的反反应应,即即将将各各局局中中人人的的策策略略作作为为一一种种函函数数,使使其其构构成成更更高高一一

65、级级的的对对策策,即即偏偏对对策策。另另外外,在在该该理理论论描描述述中中,主主张张用用结结局局的的优优先先序序代代替替其其赢赢得得值值,从从而而使使得对策模型的可实现性大大增强。得对策模型的可实现性大大增强。到到了了8080年年代代,M.FraserM.Fraser和和W.W.HipelHipel( (加加拿拿大大) )在在偏偏对对策策的的基基础础上上,提提出出了了一一种种研研究究冲冲突突事事态态的的方方法法冲冲突突分分析析方方法法,从从而而使使得得对对策策理理论论更更加加实实用用化化。该该方方法法的的提提出出也也迎迎合合了了近近一一、二二十十年年来来对对策策化化( (gaming)gami

66、ng)或或通通过过模模拟拟手手段段来来研研究究对对策策问问题题的的趋趋势。势。冲突分析方法的主要特色是:冲突分析方法的主要特色是: (1)(1) 能能最最大大限限度度地地利利用用信信息息,尤尤其其对对许许多多难难以以定定量量分分析析的的问问题题,用用冲冲突突分分析析解解决决起起来来更更显显得得得得心心应应手手,因因而而较较适适于于解解决决工工程程系系统统中中考考虑虑社社会会因因素素影影响响时时的的决决策策问问题题和和社社会会系系统统中中的的多多人人决决策策问问题。题。 (2)(2) 具具有有严严谨谨的的数数学学( (集集合合论论) )和和逻逻辑辑学学基基础础,是是在在一一般般对对策策论论基基础

67、础上上发发展展起起来来的的偏偏对对策策理理论论的的实际应用。实际应用。(3)(3)冲冲突突分分析析既既能能进进行行冲冲突突事事态态的的结结果果预预测测( (事事前前分分析析) ),又又能能进进行行事事态态的的过过程程描描述述和和评评估估( (事事后后分分析析) ),从从而而可可为为决决策策者者提提供供多多方方面面有有价价值值的的决决策策信息,并可进行政策和决策行为的分析。信息,并可进行政策和决策行为的分析。 (4)(4)分分析析方方法法在在使使用用中中几几乎乎不不需需任任何何的的数数学学理理论论和和复复杂杂的的数数学学方方法法,很很容容易易被被理理解解和和掌掌握握。主主要要分分析析过过程程还还

68、可可用用计计算算机机、通通过过人人机机对对话话解解决决,因因而而具具有有很很强强的的实实用用性性。目目前前,使使用用较较多多的的冲冲突突分分析析软软件件是是CAP(Conflict CAP(Conflict Analysis Analysis Program)Program)或或DM(Decision Maker)DM(Decision Maker)。 (5)(5)冲冲突突分分析析用用结结局局的的优优先先序序代代替替了了效效用用值值,并并认认为为对对结结局局比比较较判判断断时时可可无无传传递递性性,从从而而在在实实际际应应用用中中避避开开了了经经典典对对策策论论关关于于效效用用值值和和传传递递

69、性性假假设等障碍。设等障碍。 二、冲突分析的程序及要素二、冲突分析的程序及要素 1 1、冲突分析的一般过程、冲突分析的一般过程 冲突分析的一般过程或程序如图冲突分析的一般过程或程序如图7 71111所示。所示。 冲突问题对冲突事件背景的认识与描述建模稳定性分析决策结 果分 析与 评价YN图711 冲突分析过程示意图 (1)(1)对对冲冲突突事事件件背背景景的的认认识识与与描描述述HT5SSHT5SS以以对对事事件件有有关关背背景景材材料料的的收收集集和和整整理理为为基基本本内内容容。整整理理和和恰恰当当的的描描述述是是分分析析人人员员的的主主要要工工作作。主主要要包包括:括: 冲突发生的原因冲

70、突发生的原因( (起因起因) )及事件的主要发展过程;及事件的主要发展过程; 争论的问题及其焦点;争论的问题及其焦点; 可可能能的的利利益益和和行行为为主主体体及及其其在在事事件件中中的的地地位位及及相互关系;相互关系; 有有关关各各方方参参与与冲冲突突的的动动机机、目目的的和和基基本本的的价价值值判断;判断; 各方在冲突事态中可能独立采取的行动。各方在冲突事态中可能独立采取的行动。 对对背背景景的的深深刻刻了了解解和和恰恰当当描描述述,是是对对复复杂杂的的冲冲突突问题进行正规分析的基础。问题进行正规分析的基础。 (2)(2)冲冲突突分分析析模模型型( (建建模模) )是是在在初初步步信信息息

71、处处理理之之后后,对对冲冲突突事事态态进进行行稳稳定定性性分分析析用用的的冲冲突突事事件件或或冲冲突突分分析析要要素素间间相相互互关关系系及及其其变变化化情情况况的的模模拟拟模模型型,一般用表格形式比较方便。一般用表格形式比较方便。 (3)(3)稳稳定定性性分分析析是是使使冲冲突突问问题题得得以以“圆圆满满”解解决决的的关关键键,其其目目的的是是求求得得冲冲突突事事态态的的平平稳稳结结局局( (局局势势) )。所所谓谓平平稳稳局局势势,是是指指对对所所有有局局中中人人都都可可接接受受的的局局势势( (结结果果) ),也也即即对对任任一一局局中中人人i i,更更换换其其策策略略后后得得到到新新局

72、局势势,而而新新局局势势的的效效用用值值( (赢赢得得) )或或偏偏好好度度都都较较原原局局势势为为小小,则则称称原原来来的的局局势势为为平平稳稳局局势势。因因在在平平稳稳状状态态下下,没没有有一一个个局局中中人人愿愿意意离离开开他他已已经经选选定定的的策策略略。故故平平稳稳结结局局亦亦为为最最优优结结局局( (最最优优解解) )。稳稳定定性性分分析析必必须须考考虑虑有有关关各各方方的的优优先先选择和相互制约。选择和相互制约。(4)(4)结结果果分分析析与与评评价价 主主要要是是对对稳稳定定性性分分析析的的结结果果( (即即各各平平稳稳局局势势) )做做进进一一步步的的逻逻辑辑分分析析和和系系

73、统统评评价价,以便向决策者提供有实用价值的决策参考信息。以便向决策者提供有实用价值的决策参考信息。 2 2、冲突分析的基本要素、冲突分析的基本要素 冲冲突突分分析析的的要要素素( (也也叫叫冲冲突突事事件件的的要要素素) )是是使使现现实实冲冲突突问问题题模模型型化化、分分析析正正规规化化所所需需的的基基本本信信息息,也是对冲突事件原始资料处理的结果。主要有:也是对冲突事件原始资料处理的结果。主要有:(1)(1)时时间间点点:是是说说明明“冲冲突突”开开始始发发生生时时刻刻的的标标志志;对对于于建建模模而而言言,则则是是能能够够得得到到有有用用信信息息的的终终点点。因因为为冲冲突突总总是是一一

74、个个动动态态的的过过程程,各各种种要要素素都都在在变变化化,这这样样很很容容易易使使人人认认识识不不清清,所所以以需需要要确确定定一一个个瞬瞬间间时时刻刻,使使问问题题明明朗朗化化。但但时时间间点点不不直直接进入分析模型。接进入分析模型。 (2)(2)局局中中人人( (Players)Players):是是指指参参与与冲冲突突的的集集团团或或个个人人( (利利益益主主体体) ),他他们们必必须须有有部部分分或或完完全全的的独独立立决决策策权权( (行行为为主主体体) )。冲冲突突分分析析要要求求局局中中人人至至少少有有两两个或两个以上。局中人集合记作个或两个以上。局中人集合记作N N,N|=n

75、2N|=n2。 (3)(3)选选择择或或行行动动( (Options)Options):是是各各局局中中人人在在冲冲突突事事态态中中可可能能采采取取的的行行为为动动作作。冲冲突突局局势势正正是是由由各各方方局中人各自采取某些行动而形成的。局中人各自采取某些行动而形成的。 每每个个局局中中人人一一组组行行动动的的某某种种组组合合称称为为该该局局中中人人的的一个策略一个策略( (Strategy)Strategy)。 第第i i个局中人的行动集合记作个局中人的行动集合记作OiOi ,| ,|OiOi|=|=kiki。 (4)(4)结结局局( (Outcomes)Outcomes)。各各局局中中人人

76、冲冲突突策策略略的的组组合合共共同同形形成成冲冲突突事事态态的的结结局局。全全体体策策略略的的组组合合( (笛笛卡卡尔尔乘乘积积或或直直积积) )为为基基本本结结局局集集合合,记记作作T T,|T|=|T|=2 2。结局是冲突分析问题的解。结局是冲突分析问题的解。( (5)5)优优先先序序或或优优先先向向量量( (Preference Preference Vector)Vector)。各各局局中中人人按按照照自自己己的的目目标标要要求求及及好好恶恶标标准准,对对可可能能出出现现的的结结局局( (可可行行结结局局) )排排出出优优劣劣次次序序,形形成成各各自自的优先序的优先序( (向量向量)

77、)。 三、冲突分析基本方法举例(三、冲突分析基本方法举例(见图见图7-127-12)冲突分析古巴危机n时间点n1962年10月,冲突局势基本明朗n局中人n美国、前苏联n选择行动n美国:设立封锁圈、空袭n前苏联:撤除导弹、使事态升级n结局n美国2个选择,苏联两个选择n总共组合起来共有2(2+2)=16种结局n可以用二进制数表示,其中1215结局不可能,删除掉n优先序的确定n美国: 4 6 5 7 2 1 3 0 11 9 10 8n前苏联:0 4 6 2 5 1 7 3 11 9 10 8冲突分析古巴危机n稳定性分析n确定单方面改进n某一个局中人不改变其策略局中人不改变其策略,而另一个局中人单方

78、面改进其策略(从qq)而是的自己的处境更好,则形成单方面改进,则称对于A,q存在单方面改进q。冲突分析古巴危机n确定基本的个体稳定状态n合理性稳定n对局中人A而言,考虑结局q,如果不存在单方面改进UI,则称对于A,q是合理稳定结局,记为rn连续处罚性稳定n对于局中人A,考虑结局q,如果存在UI结局q,而q对于B,也存在UI结局q,但是q对于局中人A不比q更优,则结局q的UI结局q存在一个连续处罚性.n对于局中人A的结局q的全部UI结局都存在连续性处罚,则称对于局中人A,结局q为连续处罚性稳定结局,记为sn非稳定结局n对于局中人A,考虑结局q,如果存在UI,但又不是连续处罚性稳定s,则称对于A,

79、q是非稳定结局,记为u.冲突分析古巴危机n分析同时处罚性稳定n对于局中人A,考虑非稳定结局q,如果另一个局中人B,对于结局q也是非稳定的,那么结局q的UI结局ai(对于A),bi(对于B)同时合成的结局pk中,存在一个p0,对于局中人A而言,不比q更优,则称对于局中人A,结局q的UI结局a0存在一个同时性处罚,n如果对于A,结局q的全部UI结局都存在同时性处罚,则对于A,结局q为同时性处罚结局,记为un两个局中人A和B同时UI产生的结局p的计算方法为n首先求出A和B的U结局的交集q,之后根据:nP=(a+b)-q冲突分析古巴危机n确定全局平稳结局n如果结局q对于每个局中人都属于r,s,un则结局q为全局平稳结局,记为E

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 建筑/环境 > 施工组织

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号