1,第八章 决策论,李勇建 博士,2,不确定环境中进行决策,实际问题,制造商向市场推出新产品 潜在顾客将会做出什么反应? 制造商应当生产多少产品? 是否需要在一个小区域中进行试销? 为了成功推出产品,需要打多少广告? 政府工程承包商投标一个新的合同 工程的实际成本是多少? 哪些公司会投标? 他们可能的投标价是多少?,3,决策分析介绍,确定性决策(Decisions Under Certainty) 自然状态确定(State of nature) 选择产生最大收益的决策 例子: 生产组合(Product Mix) 分销配送(Distribution) 人员排程(Scheduling),4,不确定下的决策(风险决策) 自然状态不确定 (有多个可能状态) 例子: 石油勘探 新产品开发 拍电影,决策分析介绍,5,石油勘探问题,一个石油勘探公司要对是否对新疆某地进行石油勘探,如果勘探则发生$200,000的勘探成本,如果发现石油,值$800,000. 如果没有发现石油则价值为0,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,收益表,实际举例,不勘探,勘 探,有油,没油,0,0,600000,-200000,决策问题的特征:,一系列可供选择的决策; 具有一系列的未来可能出现的自然状态; 每个自然状态下,每个选择都对应一个支付数; 对未来事件发生的可能性进行估计; 决策的评估标准。
6,7,决策分析术语,决策者(Decision Maker) 是对一个决策(或一系列决策)负责的人或团体 备择方案(Alternatives) 是决策者将作出的决策的选项 自然状态(State of nature) 决策结果受到决策者无法控制的随机因素影响 收益(Payoff) 每一种决策的备选方案及自然状态的组合都会导致某种 结果, 是衡量决策结果对决策者的价值的量化指标,8,【例1】(投资问题)请问如何决策? S1:经济形势上升 S2:经济形势稳定 S3:经济形势下滑,表1:证券投资收益表(单位:元),,9,不确定性决策准则,悲观准则(Maximin准则) 乐观准则(Maximax准则) 折衷准则(Hurwicz准则) 等可能准则(Laplace准则) 遗憾准则(Minimax regret准则),10,【例1】(投资问题)请问如何决策? 悲观准则 乐观准则 折衷准则 等可能准则,其中0.6,表1:证券投资收益表(单位:元),11,(5)遗憾准则,遗憾准则的后悔矩阵,12,最终结果为,不同准则下的决策结果,13,,14,总结,悲观准则(Maximin准则):对未来持悲观态度从每个方案可能出现的最差结果出发,从最不利的结果中选取最有利的结果。
乐观准则(Maximax准则):对未来持乐观态度,总是假设会出现对自己最有利的状态 折衷准则(Hurwicz准则):介于悲观准则和乐观准则之间采用一个乐观系数来反映决策者对状态估计的乐观态度 等可能准则(Laplace准则):将各种可能出现的状态“一视同仁”,认为各状态出现的可能性是相等的选择具有最大平均收益的方案为最优方案 遗憾准则(Minimax regret准则):基本思想是尽量减少决策后的遗憾,使决策者不后悔或者少后悔15,举例,某书店希望订购新出版的一部书籍据以往经验,新书的销售量可能为50本,100本,150本,或200本已知每本新书订购价为4元,零售价为6元,剩书的处理价为1元试分别用乐观难则、悲观准则、折衷准则(乐观系数=0.8)和遗憾准则确定该书的订购量乐观准则 100 200 300 400,悲观准则 100 -50 -200 -350,,,折衷准则 100 150 200 250,,,,,16,,,,,,,后悔矩阵 s1 s2 s3 s4 0 100 200 300 150 0 100 200 300 150 0 100 450 300 150 0,,,最大后悔 300 200 300 450,,,,,,所以,所作决策分别为 乐观准则:采购200本; 悲观准则;采购50本; 折衷准则:采购200本; 遗憾准则:采购100本,17,2 风险决策,【例2】继续考虑例1。
根据经验估计,经济形势S1,S2,S3三种情形发生的先验概率分别为0.1,0.5,0.4此时投资者应该选择哪种方案,使的收益最大? 再者先验概率对自然状态的估计可能不准确,那么花费一些钱以获得更好的估计(后验概率)是否值得呢?若此概率信息需要花费15万元才能购买得到,则投资者是否值得去购买这些信息?,,0.1 0.5 0.4,,表1:证券投资收益表(单位:元),18,先验决策概率最大原则,概率最大的那一个状态在一次决策中最可能出现,因此应该在具有最大发生概率的状态下选择行动方案具体方法: 发现概率最大的自然状态 选择在这种自然状态下收益最大的备择方案 如上例,应该在状态S2前提下选择方案A2 存在的问题 如果这些其他收益中有一些是致命的怎么办? 如果其他这些收益远比所选择的方案的收益丰厚怎么办? 如果最可能的自然状态下收益的差异远小于另一个具有一定可能性的自然状态下的收益,那么决策者会更加关注后者 如果有很多种自然状态且它们的可能性几乎相同,最可能自然状态变为现实的概率就会相当低,19,先验决策最大期望收益 (Bayes)准则,适用于一次决策多次重复进行生产的情况具体方法: 每一种备择方案,将每一个收益乘以相应自然状态的先验概率,乘积相加就得到收益的加权平均 选择具有最大期望收益的备择方案 在例2中,根据Bayes准则决策结果是选择方案A2,可得收益565元.,,0.1 0.5 0.4,加权平均 475 565 400,表1:证券投资收益表(单位:元),20,先验决策最大期望收益 (Bayes)准则,先验决策问题在WinQSB中的实现方法完全同于不定决策问题的实现,只是在输入数据时,需要确定各状态的概率而已. 存在的问题 在确定先验概率时,仍然有相当大的不确定性 先验概率在相当大的程度上是主观的,然而安全的决策应当是基于客观数据和程序的 对于平均结果,期望(货币上的)收益忽视了可能的结果对决策者的影响,21,2.2 信息价值,通常一个初步的研究会对自然状态的概率有一个更好的近似. 例如: 市场调研(Market surveys) 市场测试(Test-marketing) 地震测试(Seismic testing for oil) 问 题: 我们得为得到这些信息付多少价值呢?,22,全信息价值,EP(无更多信息)= 以原始的先验概率用贝叶斯决 策规则得到的期望收益 EP(拥有全信息)= 如果知道真实的自然状态进行 决策得到的期望收益 EVPI = 全信息价值 = EP(拥有全信息) - EP(无更多信息) C = 获取更多信息的花费 如果EVPI C,不值得获取更多的信息 如果EVPI C, 值得获取更多的信息,,,,,,,,,23,【例3】继续考虑例2. 投资者是否需要花费100元购买此完全信息? 分析 完全信息价值,为 因此不值得购买该信息。
24,2.3后验决策 先验概率:由过去经验或专家估计的将发生事件的概率,P(Si); 后验概率:利用样本情报对先验概率修正后得到的概率,P(Ii|Sj); 【例4】在例2的基础之上,经济形势与经济形势预测结果的关系如表4所示. 现问如何决策?,,25,全概率公式 其中B1,B2,,Bn构成一个完全的概率空间,即一个概率空间分成n个相互独立的子空间 乘法法则: 全概率公式 代入 贝叶斯公式,26,先验概率,即自然状态概率 P(S1)=0.1;P(S2)=0.5;P(S3)=0.4 后验概率(用全概率公式计算) P(I1)=P(I1|S1)*P(S1)+P(I1|S2)*P(S2)+P(I1|S3)*P(S3) =0.75*0.1+0.20*0.5+0.05*0.4=0.1950 P(I2)=P(I2|S1)*P(S1)+P(I2|S2)*P(S2)+P(I2|S3)*P(S3) =0.20*0.1+0.70*0.5+0.15*0.4=0.4300 P(I3)=P(I3|S1)*P(S1)+P(I3|S2)*P(S2)+P(I3|S3)*P(S3) =0.05*0.1+0.10*0.5+0.80*0.4=0.3750,,27,因此,在信息更新后,决策期望收益最大值是572.25,对应方案是A2。
0.195 0.43 0.375,,505.0000 572.2500 460.7500,加权平均,表1:证券投资收益表(单位:元),28,,软件实现在WinQSB中,实现后验决策计算的 仍是decision analysis模块“Payoff Table Analysis.,29,类似完全信息的信息价值分析,也可以类似分析经济形势预测的信息价值 如本题,后验决策时的期望收益572.2530,现已得到补充情报:经济形势 预测结果为好,则如何决策? 计算条件概率(用贝叶斯公式计算) P(S1|I1)= P(I1|S1)*P(S1)/P(I1)=0.75*0.1/0.1950=0.3846 P(S2|I1)= P(I1|S2)*P(S2)/P(I1)=0.20*0.5/0.1950=0.5128 P(S3|I1)= P(I1|S3)*P(S3)/P(I1)=0.05*0.4/0.1950=0.1026 根据后验概率调整决策(按最大期望收益决策准则) E(A1)=800*0.3846+550*0.5128+300*0.1026=620.50 E(A2)=650*0.3846+600*0.5128+500*0.1026=608.97 E(A3)=1000*0.3846+400*0.5128+250*0.1026=615.37 因此最优方案为A1。
31,3 序列决策决策树,某些决策问题,在进行决策后会产生一些新情况,此时需要进行新的决策;接着又会出现新情况,又进行新决策这样,决策、情况、决策构成一个序列,即序列决策描述序列决策的工具是决策树 利用决策树对多阶段风险决策问题进行分析是以期望值准则为决策准则 我们前面的风险决策问题可以应用决策树的方法来描述32,例4:某公司需要对某新产品生产批量作出决策,各种批量在不同的自然状态下的收益情况如下表(收益矩阵)N1发生的概率是0.333,决策树,,,,,,,,,,,,,,,,,,,,,,,,,,决策,S1,S2,S3,大批量生产,中批量生产,小批量生产,N1( 需求量大 );P(N1) = 0.3,N1( 需求量大 );P(N1) = 0.3,N1( 需求量大 );P(N1) = 0.3,N2( 需求量小 );P(N2) = 0.7,N2( 需求量小 );P(N2) = 0.7,N2( 需求量小 );P(N2) = 0.7,30,-6,20,10,-2,5,4.8,4.6,6.5,6.5,,,34,决策树法的计算过程,(1) 绘制决策树; (2) 自右到左计算各方案的收益期望值,将结果标在方案节点处; (3) 选收益期望值最大(损失期望值最小)的方案为最优方案。
主要符号 决策点 方案节点 结果节点,,,,35,例5:投标决策,华光公司考虑为一项建设工程进行投标投标准备费为1万元中标的可能性为40若中标后能按期保。