第32次课教案--第11章 决策分析(下)

上传人:桔**** 文档编号:542949123 上传时间:2022-07-18 格式:DOC 页数:10 大小:438.01KB
返回 下载 相关 举报
第32次课教案--第11章 决策分析(下)_第1页
第1页 / 共10页
第32次课教案--第11章 决策分析(下)_第2页
第2页 / 共10页
第32次课教案--第11章 决策分析(下)_第3页
第3页 / 共10页
第32次课教案--第11章 决策分析(下)_第4页
第4页 / 共10页
第32次课教案--第11章 决策分析(下)_第5页
第5页 / 共10页
点击查看更多>>
资源描述

《第32次课教案--第11章 决策分析(下)》由会员分享,可在线阅读,更多相关《第32次课教案--第11章 决策分析(下)(10页珍藏版)》请在金锄头文库上搜索。

1、山 东 理 工 大 学 教 案 第 31 次课教学课型:理论课 实验课 习题课 实践课 技能课 其它主要教学内容(注明:* 重点 # 难点 ):第11章:决策分析11.6 情报的价值与贝叶斯决策11.7 效用理论及应用 * 重点:贝叶斯决策、效用理论与应用系统决策的方法# 难点:贝叶斯决策、效用的概念及其应用 教学目的要求:根据实际问题,分析贝叶斯决策的应用教学方法和教学手段:讲解、案例教学、ppt课件讨论、思考题、作业:参考资料: 注:教师讲稿附后11.6 情报的价值由前面的分析可知,正确的决策来源于可靠的情报或信息,情报资料越可靠,对状态发生的概率估计就越准确,据此作出的决策也就越合理。但

2、是,获取情报或信息,需要进行必要的调查、试验、统计等工作,或从别人手中购买,不管怎样,都要花费一定的代价。如果决策者支付的费用过低,则难以得到要求的情报资料;如果支付的费用过高,则可能不合算,那么支付多少费用对决策者才算合算呢?由此就出现了如何评价情报的价值这个问题。决策所需的情报资料一般分为两类,一类是完全情报,即完全可以肯定某一状态发生的情报,一类是非完全情报或抽样情报,即不能完全肯定某一状态发生的情报。下面分别讨论这两类情报的价值问题。11.6.1 完全情报的价值 有了完全情报,决策者就可以准确地预料到即将出现什么状态,从而可以把风险型决策问题变为确定型决策问题。但是,在得到完全情报之前

3、,并不知道哪个状态发生,因而就无法准确算出这一情报会给决策者带来多大的收益。因此,为了在得到情报之前决定是否值得去采集这项情报,就必须先估计出该情报的价值。基本思路是设法计算出由于获得这项情报而使决策者的期望收益提高的数额。如果该数额大于采集情报所花费的费用,则收集这一情报是有利的,否则就不值得为收集这一情报花那么大的代价。 下面通过一个例子加以说明。 假定在上例11-3中,可以得到关于产品销路好坏的完全情报,问花费60万元购买这一情报是否合算? 假定完全情报指出销路好,就采取建大厂这一策略,每年可获100万元收益,如果完全情报指出销路差,就采用建小厂这一策略,每年可获利10万元。由于在决定是

4、否购买这一情报时还不知道完全情报的内容,故在决策时,无法算出确切的收益,只能算出在完全情报下的期望收益,即 0.7(100万元10-300万元)+0.3(10万元10-140万元)=478 万元原期望收益(采用建大厂方案)为340万元,可知由于得到了完全情报而使期望收益增加了478万元-340万元=138 万元。 这个值就是完全情报的期望值,通常称为完全情报的价值,由于138万元大于采集完全情报的费用60万元,故值得购买这一情报。需要指出的是完全情报在一般情况下是很难得到的,因此算出的完全情报的期望值常常只能作为支付情报费用的一个上限。11.6.2 非完全情报和贝叶斯决策 在决策分析过程中,如

5、果得不到完全情报,或者采集完全情报所花代价太大,这时为得到更好的决策结果,可以采用非完全情报作为补充信息对原来的状态概率进行修正。把原有的状态概率称为先验概率,而修正后的状态概率称为后验概率。由于取得了新的情报,从而提高了决策的效果。为了估计由于获取情报而改善的决策效果即情报的价值,常采用贝叶斯(Bayes)公式来分析,这样的决策称为贝叶斯决策。 1贝叶斯公式 在概率论中,若事件B能且只能与两两互不相容事件之一同时发生,由条件概率的定义有 (11-3)又由全概率公式有 (11-4)因此得 (11-5)这个公式就称为贝叶斯(Bayes)公式。 2贝叶斯决策 它是利用贝叶斯公式进行决策的一种决策方

6、法。这时,贝叶斯公式中的称为状态的先验概率,称为状态的后验概率。称为状态发生的条件下事件发生的条件概率,称为联合概率。称为边际概率。下面通过一个例子说明贝叶斯决策的步骤。 假如在例11-3中,若某咨询机构可以对10年内产品销路好坏提供进一步的情报,所提供情报的准确度为80%。也就是说,如果产品销路好,而咨询机构预报销路好(记为)的条件概率为0.8,预报销路差(记为)的条件概率为0.2;如果产品销路差,而咨询机构预报销路差的条件概率为0.8,预报销路好的条件概率为0.2。 由此可以写出下列条件概率 又知先验概率为,故联合概率为边际概率为后验概率为 在计算出边际概率和后验概率之后,按决策树法画出图

7、11-4所示的贝叶斯决策树。 预报产品销路好时,两方案的期望益损值为 因,故方案a1较优。也就是说,如果预报产品销路好时,则应采取建大厂小大小大70.52-57.92230.96583.8470.52P(B1)=0.38P(B1)=0.62388.78P(q2/B1)=0.0968P(q1/B1)=0.9032P(q2/B1)=0.0968P(q1/B2)=0.3684P(q2/B2)=0.6316P(q1/B2)=0.3684P(q2/B2)=0.6316P(q1/B1)=0.90321245367D 100D -20D 40D 10D 100D -20D 40D 10方案。图11-4 决策

8、树 预报产品销路差时,两方案的期望益损值为 因,则较优。也就是说,如果预报产品销路差时,则应采用建小厂方案。 3非完全情报的价值 在获得新的情报之前,并不知道咨询机构的预报结果是产品销路好还是销路差。为了估算非完全情报的价值,可先计算出在非完全情报条件下的期望益损值,即 583.84万元0.62+70.52万元0.38=388.78万元然后再从中减去在没有非完全情报条件下的期望值340万元,即 388.78万元-340万元=48.78万元则这个差值就是非完全情报的价值。如果该咨询机构要求的情报费用小于48.78万元,则购买这样的非完全情报是有利的。否则,就没有必要购买这样的情报,而应该采用在没

9、有得到任何新的情报条件下所确定的建大厂方案。11.7 效用理论及其在系统效能决策中的应用18世纪克拉默(Gabriel Gramer)和伯努利(Danial Bernoulli)两位学者提出了效用值的概念,所谓效用是反映决策者价值观念的准则。按照效用理论,他们认为人们财产的效用值将随财富的增加而增加,但增加的幅度递减。目前效用理论已成为决策理论和决策分析的基础。在11.3节中分析了以货币为单位的期望益损值作决策准则的决策方法,但此方法在实际决策过程中可能会出现一定的弊病。例如,某人买5元的彩券,有0.5的概率中奖,除本外还可赢得5元,有0.5的概率不能中奖,连本也失去。按照期望值准则,期望益损

10、值为零,就是说,可买可不买,两者都一样。这时购买者也可能抱着无所谓的心理买一张试试。另一种情况如果购买彩券需花500元,盈亏机会仍相等,且收益和亏损都是500元,其期望益损值仍为零,但这时购买者就不是无所谓的态度,因为有0.5 的概率亏500元,而不敢轻易取买。因为按照一般人的价值观,损失500元的效用值要比赢500元的效用值大。11.7.1 效用值函数先研究以货币为单位的财富的效用值。假定为决策者的财富,为效用值函数。按照上述效用值的改变,不难理解效用值函数应具备的两个基本性质:1为负值的效用值不成立。这就是说,一个人的财富不能是负的。当然,个人或组织可能负债,但要在偿还能力之内,正常的社会

11、不容许人们去冒超出其偿还能力的风险。2是非递减函数。效用函数用来表达决策者对所拥有财富的满意程度,如果效用值函数不是非递减函数,意味着决策者在已达到一定数量的财富后希望放弃一些财富。很少有人会这么做。实际上,不难推测出效用函数的一些特征:非负;起点;曲线形状随着财富值增加而趋于扁平,就是说,随着财富增加,附加财富带来的满足程度逐渐下降,曲线形式如图115,此曲线是凹的(即从上面看曲线存不住水,反之则为凸,呈碗状)。图115 效用曲线现进一步分析此效用曲线的性质。设甲和乙有同样的效用曲线,甲具有财富,乙具有财富(),两人接受同样的附加收益。甲所增加效用为,而乙为,显然,因为附加收益对财富较少的人

12、来说,其效用较高(见图115)。进一步看,如果甲要参与某项打赌(或做出某项决策方案),其输、赢额为的概率各为和,如采纳此决策则需要满足 (116)求解(116),则可得的最小容许值为(图116) (117)式(117)中,为通过点和弦相交而形成的线段。对于式(117)表示的曲线,此线段在点的右边,因此,总是大于1/2。这就是说,对于一种盈亏额相等的决策方案,只要赢的概率大于1/2,甲才肯采纳。像甲这样一定要才能采纳此决策方案的人,称作稳重者。设乙系同样的效用曲线,也同样属于稳重者,但其现有财富较多,处于曲率较小部分,其值较甲要小,说明乙并不要像甲那样大的概率就同意接受此决策方案。若处于效用曲线

13、尾部的直线部分,则就可以接受。可以说,对待同样的决策方案,财富越多的人,稳重的程度就不那么严格。另一类是凸的曲线,属于冒进型,如图117,线段处于点的左边,最小可接受的概率。持这样态度的人,能够接受的赢、亏额相等的决策方案。这种情况并不少见,当一个人处于较为窘迫的情况时,总是想摆脱其相对贫困的境况,不惜冒较大风险。当然,这些人一旦机遇好,获得成功,会逐渐转向保守态度。像有些小企业主,创业阶段愿意冒风险,而具有一定规模后有变得反风险,这种人的效用曲线可概括成图118所示的曲线。 图116 稳重型效用曲线 图117 冒进型效用曲线图118 混合型效用曲线11.7.2 效用值函数在某防空系统(简称A

14、系统)效能决策中的应用系统的使用,能使防空作战能力大幅度提高,由于系统使一个庞大复杂的系统,包含多种技术因素和不确定性,这给系统作战效能的评价带来巨大困难,而通过效用值函数能够对该系统进行较为客观、可信的描述与决策。1系统效能评估指标的选取影响系统效能的因素多达上百个,将各种因素全部选作评估指标进行效能评价,显然不合适且造成评估结果的不可靠。通过使用主因素分析法对各种可能的影响因素进行分析,并结合有关专家的经验,选取的系统效能评估指标如表118所示。2指标对效能的影响分析在A系统设计过程中,必须要考虑费用,而费用又会直接影响性能指标的确定,若一味地追求高性能指标,必然会导致费用的大幅度增加:在系统装备决策时,性能好、费用低的系统必然会作为首选系统。因此,在进行系统效能评估决策时,必须考虑费用因此,据此将表118中的指标分为3类:正影响指标、负影响指标和正负影响指标。正影响指标是指系统的效能随指标数值的增大而增高的指标,如雷达工作可靠性、网络通信可靠性、

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 生活休闲 > 科普知识

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号