第3章-效用函数幻灯片

上传人:日度 文档编号:147922937 上传时间:2020-10-14 格式:PPT 页数:75 大小:1.04MB
返回 下载 相关 举报
第3章-效用函数幻灯片_第1页
第1页 / 共75页
第3章-效用函数幻灯片_第2页
第2页 / 共75页
第3章-效用函数幻灯片_第3页
第3页 / 共75页
第3章-效用函数幻灯片_第4页
第4页 / 共75页
第3章-效用函数幻灯片_第5页
第5页 / 共75页
点击查看更多>>
资源描述

《第3章-效用函数幻灯片》由会员分享,可在线阅读,更多相关《第3章-效用函数幻灯片(75页珍藏版)》请在金锄头文库上搜索。

1、1,第三章 效用函数,2,引言 决策的特点之一是后果的价值待定。为了用定量的方法研究决策问题,除了要用主观概率量化自然状态的不确定性以外,还需要量化后果的价值。在量化后果的价值时,会遇到两个主要问题: (1)后果本身是用语言表达的,可能没有任何合适的直接测量标度。 (2)即使有一个明确的标度(通常是钱)可以测量后果,按这个标度测得的量也可能并不反映后果对决策人的真正价值。,3,抽奖的期望值有1250元,大于礼品的确定性收入1000元,但是一定有一部分人会选择这确定的1000元收入。因为对他们而言,抽奖的期望值虽大,风险也大,实际价值还不如保险的1000元。而有的人则相反,认为礼品不如抽奖,因为

2、抽奖提供了获得2500元的机会。,例 决策人面临图中决策树所示的选择:,4,在商业经营中,经营者经常遇到类似的情况,要在(1)期望收益较低但是有保险;(2)期望收益较高风险也较大这两种行动中进行选择。,因此,在进行决策分析时,存在如何描述或表达后果对决策人的实际价值,以便反映决策人心目中对各种后果的偏好次序(preference order)的问题。 偏好次序是决策人的个性与价值观的反映,与决策人所处的社会地位、经济地位、文化素养、心理和生理(身体)状态等有关。,5,在决策理论中,后果对决策人的实际价值,即在有风险的情况下决策人对结果的偏好的量化是用效用(utility)来描述的。效用就是偏好

3、的量化,是数(实值函数)。,6,3.1理性行为公理,问题: 某公司拟推出一种新产品,经预测该产品在市场看好的情况下,可以获利10万;在市场前景较差时,将亏损1万元。市场看好和较差的概率分别为0.6和0.4,是否推出该新产品? 若另有一产品可稳获利2万元,推出哪种产品更好? 这是一个随机决策问题。,7,3.1理性行为公理,在随机决策中,决策系统(,A,F)中的决策方案均是在状态空间背景中加以比较,并按照某种规则,选出决策者最满意的行动方案。 在本章中,我们用事态体表示在随机性状态空间中的行动方案,方案的比较表示为事态体的比较,并引入效用的概念,用以衡量事态体(行动方案)的优劣。,8,3.1理性行

4、为公理,3.1.1事态体及其关系 1事态体的概念 定义3.1 具有两种或两种以上有限个可能结果的方案(或事情),称为事态体。 事态体中各可能结果出现的概率是已知的。 事态体即随机性状态空间中的行动方案。,9,1事态体的概念,设某事态体的n个可能结果为: o1, o2, , on 各结果出现的概率是相应为: p1, p2, , pn 则该事态体记为: T(p1, o1;p2, o2 ;pn, on) 特别当n 2时,称 T为简单事态体,此时 T(p, o1;1p, o2 ),10,1事态体的概念,事态体可以用树形图表示如下:,当n 2时:,p,11,事态体集合的性质,在凸线性组合下,是闭集。即:

5、 若T1,T2,则当01时,有 T1 (1)T2 两个事态体的凸线性组合仍是一个事态体。 T(0, o1;0, o2 ;1, oj ;0, on) 称T为退化事态体。 退化事态体仍属于事态体集合。,12,2事态体的比较,定义3.2 设o1,o2是事态体T的任意两个结果值,根据决策目标和决策者偏好,o1和o2有如下关系: 若偏好结果值o1,则称o1优于o2,记作o1o2;反之,称o1劣于o2,记作o1 o2。 若对结果值o1, o2无所偏好,则称o1无差异于o2,记作o1 o2。 若不偏好结果值o1,则称o1不优于o2,记作 o1o2 ;反之,称o1不劣于o2,记作o1 o2 。,13,2事态体

6、的比较,定义 3.3 设两个简单事态体 T1,T2具有相同的结果值 o1,o2,即 :T1(p1, o1;1p1, o2 ) T2(p2, o1;1p2, o2 ) 并假定o1o2,则: 若p1p2,称事态体T1无差异于T2,记作T1T2 。 若p1p2,称事态体T1优于T2,记作T1T2;反之,称事态体T1劣于T2,记作T1 T2。,14,2事态体的比较,定义 3.4 设两个简单事态体 T1,T2仅具有一个相同结果值,另一个结果值不相同,即 : T1(p1, o1;1p1, o0 ) T2(p2, o2;1p2, o0 ) 且o2 o1 o0, 若p1p2,则事态体T2优于T1,记作T2T1

7、 。 若T1T2 ,则必有p1p2 。,15,3.1理性行为公理,3.1.2理性行为公理 公理3.l(连通性,可比性) 事态体集合上事态体的优劣关系是连通的。即若T1,T2 则或者T1T2 ,或者T2T1 ,或者T1T2 ,三者必居其一。 表示任意两个事态体都是可以比较其优劣的!,16,3.1理性行为公理,3.1.2理性行为公理 公理3.2(传递性) 事态体集合上事态体的优劣关系是传递的。即若T1、T2 、T3,且T1T2 ,T2T3 ,则必有T1T3 。 表示任意多个事态体的优劣是可以排序的 (若有些事态体无差异,可排在同一位置。) 满足公理3.1和公理3.2的事态体集合称为全序集。,17,

8、3.1理性行为公理,3.1.2理性行为公理 公理3.3(复合保序性,替代性) 若T1,T2 ,Q,且0p1,则T1T2 当且仅当 pT1 (1p)Q pT2 (1p)Q 。 表示任意事态体的优劣关系是可以复合的,复合后的事态体保持原有的优劣关系不变。,18,3.1理性行为公理,3.1.2理性行为公理 公理3.4(相对有序性,连续性,偏好的有界性) 若T1,T2 ,T3,且T1T2 T3 则存在数 p,q,0pl,0q1,使得: pT1 (1p)T3 T2 qT1 (1q)T3 表示任意事态体都不是无限优,也不是无限劣。,19,3.1理性行为公理,3.1.3事态体的基本性质 性质3.1 设事态体

9、 T1(p, o1;1p, o0 ) T2(x, o2;1x, o0 ) 且 o1o0 , o2o0 ,若o2o1 则存在x=pp 使得 T1T2 称x为可调概率值。,20,3.1理性行为公理,3.1.3事态体的基本性质 性质3. 2(确定当量和无差异概率) 设事态体T(x, o1;1x, o2 )且o1o2 。则对于满足优劣关系o1o o2的任意结果值o,必存在xp(0pl),使得 T(p, o1;1p, o2 ) o 称结果值o为事态体T的确定当量,称p为o关于o1与o2的无差异概率。,21,3.1.3事态体的基本性质,性质3. 3 任一事态体无差异于一个简单事态体。 设有事态体T (p1

10、, o1;p2, o2 ;pn, on)则必存在一个简单事态体 T(p, o*;1p, o0 ) T 其中: o* maxo1, o2 , , on o0 mino1, o2 , , on 且:,这里,qj(j=1, 2, , n)为oj关于o*与o0的无差异概率。,22,3.1.3事态体的基本性质,根据性质3. 3 比较一般事态体之间的优劣关系,可以转化为比较简单事态体之间的优劣关系(将问题简化) 得到事态体之间两两的优劣或无差异关系后,再根据公理3.2(传递性)即可得到所讨论事态体的排序。,23,3.2 效用函数的定义和构造,设有决策系统(,A,F),在离散情况下,结果值可以表示为决策矩阵

11、:,24,3.2 效用函数的定义和构造,矩阵O的第i行表示第i个可行方案的n个可能结果值,即事态体 Ti(p1, oi1;p2, oi2 ;pn, oin) (i=1, 2, , m) 决策就是要对这 m个事态体进行排序。 由第一节中的性质3.3知,存在简单事态体T,使得 Ti(pi, o*;1pi, o0 ) Ti 问题又化为对这m个简单事态体Ti进行排序。,25,3.2 效用函数的定义和构造,Ti(pi, o*;1pi, o0 ) Ti 注意到这m个简单事态体Ti具有相同的结果值o*、 o0 ,根据定义3.3,其优劣关系可以由比较pi的大小决定。 根据性质3.3,qij是结果值oij关于o

12、*与o0的无差异概率。 其中:,问题:如何测定无差异概率?,o* ,o0 ,26,3.2 效用函数的定义和构造,3.2.1 效用和效用函数的概念 效用的概念 定义3.5 设决策问题的各可行方案有多种可能的结果值o,依据决策者的主观愿望和价值倾向,每个结果值对决策者均有不同的价值和作用。反映结果值o对决策者的价值和作用大小的量值称为效用。,27,3.2 效用函数的定义和构造,3.2.1 效用和效用函数的概念 效用函数的概念 效用函数(曲线):反映决策者的期望值与效用值的对应关系. 效用决策:将结果用效用值代替,以期望效用最大为决策准则.,28,3.2 效用函数的定义和构造,3.2.1 效用和效用

13、函数的概念 效用函数的概念 定义3.6 若在事态体集合上存在实值函数u,有: (1)对任意的T1、T2,T1T2 当且仅当u(T1) u(T2) (2)对任意的T1、T2,且01,有 uT1 (1)T2=u(T1)(1)u(T2) 则称u(T)为定义在上的效用函数。,29,3.2.1 效用和效用函数的概念,估计效用函数的方法 (1)标准效用测定法(概率当量法,VM法) 思路:对于给定的结果值,测定其效用值。 设有决策系统(,A,F),其结果值集合为: O(o1, o2 , , on) 记: o* maxo1, o2 , , on o0 mino1, o2 , , on 对于每一个结果值oj都存

14、在一个概率值pj,使得oj(pj , o*;1pj , o0) pj就可以作为结果值oj的效用值。,30,3.2.1 效用和效用函数的概念,(1)标准效用测定法(概率当量法,VM法) 步骤 设 u(o*)=1,u(o0)= 0; 建立简单事态体(x, o*;1-x, o0 ),其中x称为可调概率; 通过反复提问,不断改变可调概率值x,让决策者权衡比较,直至当x= pj时 oj(pj , o*;1pj , o0) 测得结果值oj的效用 u(oj)= pj = pj u(o*)(1pj )u(o0),31,3.2.1 效用和效用函数的概念,估计效用函数的方法 (2)确定当量法(修正的VM法) 思路

15、:对于给定的效用值,测定其结果值。 步骤 设 u(o*)=1,u(o0)= 0; 对于给定的效用值pj,构造简单事态体 (pj , o*;1pj , o0) 通过反复提问,不断改变结果值o ,让决策者权衡比较,直至当o= oj时 oj(pj , o*;1pj , o0) 得效用值pj对应的结果值为oj,即u(oj)= pj 。,32,3.2.2 效用函数的构造,介绍一种实用的效用函数的构造方法。 基本思路 对于决策问题的结果值集合,先用确定当量法找出一个基准效用值,即效用值等于0.5的结果值,称为确定当量o。其余效用值按照类似方法测定,或是按比例用线性内插的方法,用同一个标准计算得到。,33,

16、3.2.2 效用函数的构造,方法 设决策问题结果值集合为: O(o1, o2 , , on) 取o* maxo1, o2 , , on o0 mino1, o2 , , on 并令 u(o*)=1,u(o0)= 0; 构造简单事态体(0.5, o*; 0.5, o0),用确定当量法找到该事态体的确定当量o,使得: o(0.5, o*; 0.5, o0),34,3.2.2 效用函数的构造,方法 对结果值进行归一化处理,记归一化的结果值为x(oj),则: x*=x(o*)=1, x0=x(o0)= 0, 0 x(oj)1, 记确定当量o的归一化值为,也记为x0.5,35,得到经归一化变换后的效用曲线上的三个点:,(0, 0),( , 0.5),(1, 1),u,x,0,1,1,0.5,36,3.2.2 效用函数的构造,方法 在新区间0, 和, 1按同样方法插入点( x0.25, 0.25)和( x0.75, 0.75),保持比例关系,计算得:,37,效用曲线上新增两个点:,( 2, 0.25),(22, 0.75),u,x,0,1,1,

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 总结/报告

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号