运筹学课件第三节不确定型决策方法培训资料

上传人:yuzo****123 文档编号:143773228 上传时间:2020-09-02 格式:PPT 页数:62 大小:1.58MB
返回 下载 相关 举报
运筹学课件第三节不确定型决策方法培训资料_第1页
第1页 / 共62页
运筹学课件第三节不确定型决策方法培训资料_第2页
第2页 / 共62页
运筹学课件第三节不确定型决策方法培训资料_第3页
第3页 / 共62页
运筹学课件第三节不确定型决策方法培训资料_第4页
第4页 / 共62页
运筹学课件第三节不确定型决策方法培训资料_第5页
第5页 / 共62页
点击查看更多>>
资源描述

《运筹学课件第三节不确定型决策方法培训资料》由会员分享,可在线阅读,更多相关《运筹学课件第三节不确定型决策方法培训资料(62页珍藏版)》请在金锄头文库上搜索。

1、第三节 不确定型决策方法,不确定型决策问题须具备以下几个条件: 有一个决策希望达到的目标(如收益最大或损失较小)。 存在两个或两个以上的行动方案。 存在两个或两个以上的自然状态,但是既不能确定未来和 中自然状态必然发生,又无法得到各种自然状态在未来发身个 概率。 每个行动方案在不同自然状态下的益损值可以计算出来。,对于不确定型决策问题,由一些常用的决策方法,或称为不 确定型决策准则。对于具有不同心理状态、冒险精神的人,,一、悲观准则(max-min 准则),悲观准则又称华尔德准则或保守准则,按悲观准则决策时, 决策者是非常谨慎保守的,为了“保险”,从每个方案中选择 最坏的结果,在从各个方案的最

2、坏结果中选择一个最好的结 果,该结果所在的方案就是最优决策方案。,例5 设某决策问题的决策收益表为,所以 为最优方案。,因,二、乐观准则(max-max 准则),当决策者对客观状态的估计持乐观态度时,可采用这种方 法。此时决策者的指导思想是不放过任何一个可能获得的最 好结果的机会,因此这是一个充满冒险精神的决策者。,一般的,悲观准则可用下式表示,试按悲观准则确定其决策方案。,所以 为最优方案。,因,三、折衷准则,折衷准则又称乐观系数准则或赫威斯准则,是介于悲观准则与 乐观准则之间的一个准则。若决策者对客观情况的评价既不乐 观也不悲观,主张将乐观与悲观之间作个折衷,具体做法是取 一个乐观系数(0

3、 1)来反映决策者对状态估计的乐观程度,计算公式如下,例5 设某决策问题的决策收益表为,试按折衷准则确定其决策方案。,解:若取乐观系数,例5 设某决策问题的决策收益表为,例5 设某决策问题的决策收益表为,四、等可能准则,等可能准则又称机会均等法或称拉普拉斯(Laplace)准则,它 是19世纪数学家 Laplace 提出的。他认为:当决策者面对着n 种自然状态可能发生时,如果没有充分理由说明某一自然状 态会比其他自然状态有更多的发生机会时,只能认为它们发 生的概率是相等的,都等于1/n。,计算公式如下,例5 设某决策问题的决策收益表为,试按等可能准则确定其决策方案。,解:按等可能准则此一问题的

4、每种状态发生的概率为,因,有两个最大期望益损值方案,哪一个更优?,考虑它们的界差:,界差越小,方案越优。,因,故方案1为最优方案。,五、遗憾准则,遗憾准则又称最小最大沙万奇(Savage)遗憾准则或后悔准 则。,当决策者在决策之后,若实际情况出现时并不理想,决策者 有后悔之意,而实际出现状态可能达到的最大值与决策者得 到的收益值之差越大,决策者的后悔程度越大。因此可用每 一状态所能达到的最大值(称作该状态的理想值)与其他方 案(在同一状态下)的收益值之差定义该状态的后悔值向 量。对每一状态作出后悔值向量,就构成后悔值矩阵。对后 悔值矩阵的每一行及对应每个方案求初其最大值,再在这些 最大值中求出

5、最小值所对应的方案,即为最优方案。,计算公式如下,最优方案为,先取每一列中最大值,用这一最大之减去此列的各个元素。,再取结果的最大值。,例5 设某决策问题的决策收益表为,试按遗憾准则确定其决策方案。,解:先计算后悔值矩阵:,后悔值矩阵,最优方案为1或4。,一般来讲,被选中多的方案应予以优先考虑。,第四节 效用函数方法,一、效用概念的引入,前面介绍风险型决策方法时,提到可根据期望益损值(最大或 最小)作为选择最优方案的原则,但这样做并不一定合理。请 看下面的例子:,例6设有两个决策问题: 问题1:方案A1:稳获100元; 方案B1: 用掷硬币的方法,掷出正面获得250元,掷 出反面获得0元。,问

6、题2:方案A2:稳获10000元; 方案B2: 用掷硬币的方法,直到掷出正面为止,记所 掷次数为N,则当正面出现时,可获2N元.,当你遇到这两类问题时,如何决策?大部分会选择 A1 和 A2。 但不妨计算一下其期望值:,方案B1的收益为随机变量Y1。 则其期望收益为:,设方案B2的收益为随机变量Y2。Ai=“第i次掷出正面” ,则第n 次掷出正面的概率为:,相互独立,设掷出正面前掷出反面的次数为随机变量X,则有分布列:,则方案2的平均收益为:,于是,根据期望收益最大原则,应选择B1和B2,但这一结果 很难令实际决策者接受。此乃研究效用函数的初衷。,例7(赌一把)一个正常的人,遇到“赌一把”的机

7、会。情况 如下面的树,问此人如何决策?,正常人,B,赌,不赌,45元,掷出正面,P=0.5,-10元,P=0.5,0,100元,掷出反面,45元,对绝大部分人来说, 只要兜里有10元钱, 又不急用的话,就选 择“赌”。因此时“赌”的 平均收益为:,类似的问题,让一个被判刑十年且手头仅有10元钱的罪犯 做下面的决策:,罪犯,B,赌,释放,45元,掷出正面,P=0.5,-10元,P=0.5,-10元,100元,掷出反面,45元,此时罪犯可能要选 择交出10元钱,获 得释放。,以上例子说明:,同一货币量在不同场合下给决策者带来的主观上的满足程度不同,决策者在更多的场合下是根据不同结果对其需求欲望的满

8、足程度来进行决策的,不仅仅依据期望收益最大进行决策。 相同的期望益损值(以货币值为度量)的不同随机事件之 间其风险可能存在着很大的差异。即说明货币量的期望益损 值不能完全反映随机事件的风险程度。, 同一随机事件对不同的决策者的吸引力可能完全不同,因此可采用不同的决策。这与决策者个人的气质、冒险精神、经济状况、经验等等主观因素有很大的关系。 即使同一个人在不同情况下对同一随机事件也会采用 不同的态度。,当我们以期望益损值(以货币值为度量)作决策准则时,实 际已经假定期望益损值相等的各个随机事件是等价的,具有 相同的风险程度,且对不同的人具有相同的吸引力。但对有 些问题这个假定是不合适的。因此不能

9、采用货币度量的期望 益损值作决策准则,而用所谓“效用值”作决策准则。效用是一个属于主观范畴的概念,效用是因人、因事、因地而发生变化的。,效用与效用函数 为定量地描述决策者对风险的偏好和厌恶程度。用效用来衡量同一期望值在不同人主观上的价值(满意程度的衡量尺度)。 习惯上,效用最大为1,最小为0 一个决策者对不同期望值的效用值,构成了一条效用曲线U(X)。它描述了特定的期望损益值水平和与之相对应的满足程度之间的关系。 效用函数的确定 直接提问: 收入2万您是满意的,收入增加到多少,您会加倍满意? 心理试验法 首先确定甲、乙两个方案,询问决策者选择哪一个方案。 甲:以概率P得到a元,或以(1P)的概

10、率损失b元; 乙:无风险稳得c元;(acb) 如果决策者认为甲、乙两方案等价时有: p U(a)+(1- p) U(b) = U(c),a,b,c,p四个变量中,已知任意三个,向决策者提问第四个变量应取何值?如此反复回答,便可绘制出该决策者的效用曲线。 常用的提问:固定a,b,p(0.5)值,问决策者c取何值时甲、乙两方案等价。 0.5U(a)+0.5U(b)=U(X),例8:效用曲线的确定 0.5U(a)+0.5U(b)=U(C) 最大收益 a0=200,最小收益 b0100 根据约定:U(200)=1,U(-100)=0 第一次提问:C取多少时,稳拿c的方案与相同的可能性获得最大收益和最小

11、收益的方案是等价的? 若回答为C=0,则有U(0)=0.5 U(200)+ U(-100)= 1/2; 第二次提问:C取多少时,稳拿C的方案与相同的可能性获取200和0的方案是等价的。 若回答为C=80,则有U(80)= 0.5 U(200)+ U(0)= 3/4; 第三次提问:C取多少时,稳拿C的方案与相同的可能性获取100和0的方案是等价的。 若回答为C=-60,则有U(-60)= 0.5 U(0)+ U(100)= 1/4 根据以上五点用光滑曲线连起来,就得到他的效用曲线,效用曲线图,1,U(X),X,200,100,0,60,80,0.75,0.50,0.25,效用曲线的基本类型,1,

12、U(X),X,0,I,II,III,I 型:对损失的敏感性高于 对 收益的敏感性。属于保守型决策者 保守型:对实际收入的增加的反应 较为迟钝,认为实际收入的增加比例 小于效用值的增加比例。 II型:对收益的敏感性高于对 损失的敏感性。属于冒险型决策者 冒险型:对实际收入的增加的反应 较为敏感,认为实际收入的增加比例 大于效用值的增加比例。 。 III型:对收益的敏感性等同于对 损失的敏感性。按期望准则决策 中间型:认为其实际收入和 效用值的增长成正比关系。,某一决策者可能兼有三种基本类型,不同情景下表现不同, 当收入变化时,决策者对风险的态度也在发生变化。,小结: 1、不确定性决策方法。 2、

13、效用函数法。,效用值准则 方法与期望价值相同,只是用效用值替代损益值。计算得到每一方案的期望效用价值,取最大值对应的方案为最后的决策方案。,二、效用曲线的确定及分类,老王,B,二次抽奖,一次,500元,P=0.5,0元,P=0.5,500元,1000元,500元,为了讲清“效用”与“效 用值”的概念,看下例,例 老王参加某电视台综艺,节目而得奖。他有两种方式可选择:,一次获得500元奖金。,分别以概率 0.5 与 0.5的机会抽奖可获得1000元与0元。,试问老王该选择何种方式领奖?,事件 的期望益损值都是500元,但有人认为应选择,他认为 的“价值”比 大,有的相反。都是“主观价,值”。此时

14、他认为事件 的效用比事件 来的大。,如何来度量随机事件的效用(或说“价值”)?我们用“效用值” u来度量效用值的大小。“效用值”是一个“主观价值”,且是一个 相对大小的值。通常假定决策者最偏好、最倾向、最喜欢的事 情(方案)的效用为1,而最不偏好、最不倾向、最不喜欢的 事情(方案)的效用为0。,一般来说,若用r来表示期望收益值(这里收益值作广义理 解,不一定是货币量,也可以是某事件的结果),则r的效用,值用 来表示。因此有,那么,当 时如何计算呢?,一般用心理测试的方法来确定 ,具体做法是:反复向决策 者提出下面的问题:“如果事件 是以概率P得到收益为 , 以概率(1-P)得到收益为 ,事件

15、是以100%概率得到收 益为 你认为 取多大值时,事件 与事件 是 相当的(即认为效用值相等)?如果决策者经过思考后,认为 时 两事件效果是相当的,即有,当 , , 已知时,则 的效用值可求出。如当 则 则可求出,的效益值,再在已知效用值的三点,中的任意两点,再作出同样的问题来问决策者,则可在两点中 求出一点的效用值。如此继续,可得到在 及 中间的 一系列 的效用值 。再以 作横坐标, 作纵坐标可得 该决策者的效用曲线。举例如下。,例 设某决策者在股票交易所购买股票,现有两种选择:,选择股票01号,预计每手(100股)可能分别以概率 0.5获利200元,概率0.5 损失100元。,选择股票02

16、号,预计每手(100股)可能分别以概率 1.0获利25元。,试问该决策者应选择何种方式购买股票?,用心理测试法对该决策者提问: 对上述事件 ,问决策者愿意选择何种方式?,决策者,B,01号股票,02号股票,0.5,P=0.5,-100元,P=0.5,25元,200元,若决策者选择 ,则降 低 到20元,若还选择 则在降低 ,若降至0 元(即不赔不赚)时,,决策者犹豫不定,说明,此时随机事件 的效用值 与 相等。,决策者,01号股票,02号股票,0.5,P=0.5,-100元,P=0.5,0元,200元,求出 时的效益 值:,得到效用曲线的三点。,B1,B2,P=1.0,0.5,决策者,01号股票,02号股票,0.75,P=0.5,0元,

展开阅读全文
相关资源
正为您匹配相似的精品文档
相关搜索

最新文档


当前位置:首页 > 中学教育 > 教学课件 > 高中课件

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号