第三章第三章 决策分析的概率基础决策分析的概率基础 决策树模型主要用于分析解决不确定环境下的决 决策树模型主要用于分析解决不确定环境下的决策问题,而期望值决策准则中概率的知识是非常重要策问题,而期望值决策准则中概率的知识是非常重要的本章将对概率论的基础及一些基本计算作一简单的本章将对概率论的基础及一些基本计算作一简单介绍 数数 据据 模模 型型 决决 策策13.1 随机事件及概率随机事件及概率事件事件——实验或观察的结果实验或观察的结果随机实验随机实验——在实验完成之前,仅仅知道可能的所有结果,但在实验完成之前,仅仅知道可能的所有结果,但不能准确知道哪一结果将会出现不能准确知道哪一结果将会出现随机事件随机事件——随机实验的结果,通常用随机实验的结果,通常用A,,B,,C,,…表示样本点(基本事件)样本点(基本事件)——随机实验的最简单的结果(基本结果)随机实验的最简单的结果(基本结果),它须满足一个重要特性,它须满足一个重要特性——互斥性互斥性样本空间样本空间——随机实验的全体样本点的集合,它须满足一个重随机实验的全体样本点的集合,它须满足一个重要特性要特性——完备性完备性。
数数 据据 模模 型型 决决 策策2概率概率—— 随机事件发生(出现)的可能性大小的一个度量! 随机事件发生(出现)的可能性大小的一个度量!随机事件随机事件A的概率的概率P((A))—— 数数 据据 模模 型型 决决 策策P((A))=事件事件A所含的样本点数所含的样本点数样本点空间所含的样本点数样本点空间所含的样本点数3基本概率定理基本概率定理第一定理第一定理—— 任意事件发生的概率都是一个位于任意事件发生的概率都是一个位于0与与1之间的数一个事之间的数一个事件发生的概率大小,其直观含义是该事件发生的可能性的大小件发生的概率大小,其直观含义是该事件发生的可能性的大小概率为概率为1的事件称为的事件称为必然事件必然事件记为记为 ,概率为,概率为0的事件称为的事件称为不可不可能事件能事件记为记为 第二定理第二定理—— 如果如果 A 和和 B 是两个互斥事件(是两个互斥事件(A∩B = ),则有:),则有:P((A 或或 B))= P((A))+ P((B)) 数数 据据 模模 型型 决决 策策43.2 条件概率及贝叶斯定理条件概率及贝叶斯定理案例案例—— 某日用化工公司开发了一种新的化妆产品,正在考虑是否某日用化工公司开发了一种新的化妆产品,正在考虑是否生产并推向市场。
经营管理人员面临若干选择:生产并推向市场经营管理人员面临若干选择:1、主观认为新产品也许缺乏销路,故不打算投入生产主观认为新产品也许缺乏销路,故不打算投入生产2、不做市场调查,直接投入生产这样,它将受市场不确定、不做市场调查,直接投入生产这样,它将受市场不确定因素的影响如果市场对该产品看好,则可以赚取因素的影响如果市场对该产品看好,则可以赚取1000万纯利万纯利润;但若市场不太看好,公司将亏损润;但若市场不太看好,公司将亏损450万市场看好或不太万市场看好或不太看好的主观概率分别是看好的主观概率分别是0.3与与0.73、先委托咨询公司做市场调查,调查需求前景是、先委托咨询公司做市场调查,调查需求前景是“好好”还是还是“差差”,然后再做决定,调查费用为,然后再做决定,调查费用为50万 数数 据据 模模 型型 决决 策策53.2 条件概率及贝叶斯定理条件概率及贝叶斯定理案例案例—— 但是,任何一种市场调查方法一般都有可能误判市场的真但是,任何一种市场调查方法一般都有可能误判市场的真实情况,即市场本不看好,但调查结果表明看好;或市场本看实情况,即市场本不看好,但调查结果表明看好;或市场本看好,而调查结果表明不看好。
根据该咨询公司过去的情况,如好,而调查结果表明不看好根据该咨询公司过去的情况,如果市场不好,调查结果好的可能性是果市场不好,调查结果好的可能性是0.1;如果市场好,调查结;如果市场好,调查结果不好的可能性是果不好的可能性是0.15我们应该从调查结果作出如何的决策我们应该从调查结果作出如何的决策呢?呢? 数数 据据 模模 型型 决决 策策6第三定理第三定理—— 如果如果 A 和和 B 是任意两个事件,且是任意两个事件,且P((B)>)>0,则有:,则有: 数数 据据 模模 型型 决决 策策P((A | B))=P((A 和和B))P((B))或等价形式:或等价形式: P((A 和和B))= P((A|B))×P((B))7第四定理第四定理—— 如果如果A和和B是相互独立的两个事件,则有:是相互独立的两个事件,则有:P((A | B))= P((A))推论推论—— 如果如果A和和B是相互独立的两个事件,则有:是相互独立的两个事件,则有:P((A 和和B))= P((A))× P((B)) 数数 据据 模模 型型 决决 策策8全概率公式全概率公式——例例——某次世界女排赛中,中、日、美、古巴四队取得半决赛权,某次世界女排赛中,中、日、美、古巴四队取得半决赛权,对阵形势如下:据以往战绩,假定中国胜日本的概率为对阵形势如下:据以往战绩,假定中国胜日本的概率为0.9,胜美国,胜美国的概率为的概率为0.4,而日本胜美国的概率为,而日本胜美国的概率为0.5,分析中国在这次比赛中夺,分析中国在这次比赛中夺得冠军的概率有多大?得冠军的概率有多大? 数数 据据 模模 型型 决决 策策中国队中国队古巴队古巴队日本队日本队美国队美国队中国队中国队胜队胜队冠军冠军9全概率公式全概率公式——设:设:B = { 中国得冠军中国得冠军} ,,A1 = {日胜美日胜美} ,,A2 = { 美胜日美胜日} 则因为则因为 A1∪∪A2 = ,, A1∩A2 = 所以所以 B = B = B(( A1∪∪A2 ))= BA1∪∪BA2 P((B))= P(( BA1∪∪BA2 ))= P(( BA1))+ P((BA2 ))又因为又因为 P(( BA1))= P((A1))P(( B | A1 )) P(( BA2))= P((A2))P(( B | A2 ))所以所以 P((B))= P((A1))P(( B | A1 ))+ P((A2))P(( B | A2 )) = 0.5×0.9 + 0.5×0.4 = 0.65 数数 据据 模模 型型 决决 策策10全概率公式全概率公式——从上面的例子归纳得全概率公式:从上面的例子归纳得全概率公式: 假如样本(结局)空间可以表示为有限(假如样本(结局)空间可以表示为有限(k)个)个互斥互斥事件事件的集合全体之和,即:的集合全体之和,即: =A1+A2+…+Ak,我们将,我们将A1 ,,A2 ,,…,,Ak,称为,称为样本空间的一个剖分,样本空间的一个剖分,B为一个给定的事件,则:为一个给定的事件,则: P((B))= P((A1))P((B | A1))+ P((A2))P((B | A1)) + … + P(( Ak ))P((B | Ak )) 数数 据据 模模 型型 决决 策策11回到前面的案例回到前面的案例 G——新产品的市场好新产品的市场好 W——新产品的市场差新产品的市场差 Q——调查表明市场好调查表明市场好 N——调查表明市场差调查表明市场差则有:则有: Q|W——市场差,但调查表明市场好市场差,但调查表明市场好 N|G ——市场好,但调查表明市场差市场好,但调查表明市场差根据已知有:根据已知有:P(( Q|W ))= 0.1 ;; P(( N|G ))= 0.15 数数 据据 模模 型型 决决 策策12贝叶斯概率定理贝叶斯概率定理 假如样本(结局)空间可以表示为有限(假如样本(结局)空间可以表示为有限(k)个)个互斥互斥事件事件的集合全体之和,即:的集合全体之和,即: =A1+A2+…+Ak,,B为一个给定的事件,为一个给定的事件,则在给定则在给定B的条件下,任何一个事件的条件下,任何一个事件Aj((j=1,,2,,…,,k)发生)发生的概率:的概率: P((Aj | B))= 数数 据据 模模 型型 决决 策策P((B | Aj ))P((Aj))∑P((B | Ai ))P((Ai))13计算结果计算结果 p1= P((Q))= 0.325 p2= P((N))= 0.675 p3= P((G|Q))= 0.785 p4= P((W|Q))= 0.215 p5= P((G|N))= 0.067 p6= P((W|N))= 0.933 将此将此6个概率代入决策树中,计算求解决策树,最后得到个概率代入决策树中,计算求解决策树,最后得到化工公司的最优策略:化工公司的最优策略:关于新产品,先做市场调查,若调查结关于新产品,先做市场调查,若调查结果表明市场好则生产新产品,若调查结果表明市场差则不生产果表明市场好则生产新产品,若调查结果表明市场差则不生产新产品。
新产品 数数 据据 模模 型型 决决 策策143.3 离散型随机变量及其分布离散型随机变量及其分布 随机变量:取值带有某种可能性的变量随机变量:取值带有某种可能性的变量 数数 据据 模模 型型 决决 策策Xx1 ,, x2 ,, … ,, xn ,,…pp1 ,, p2 ,, … ,, pn ,,… 常见离散型分布:常见离散型分布:1、贝努力(、贝努力(Bernoulli)分布(两点分布))分布(两点分布)2、二项分布、二项分布3、几何分布、几何分布4、普阿松(、普阿松(Poisson)分布)分布153.4 概率分布的数字特征概率分布的数字特征数学期望数学期望Expected Value(期望值)(期望值) 如果离散型随机变量如果离散型随机变量X以概率以概率pi取值取值xi((i=1,,2,,…),则),则X的期望值定义为:的期望值定义为: x = E((X))= ∑ xi pi 数学期望是反映随机变量取值的一个非常重要的数字特征,数学期望是反映随机变量取值的一个非常重要的数字特征,它反映的是随机变量取值的它反映的是随机变量取值的位置特征位置特征,即随机变量就其,即随机变量就其“平均平均而言而言”取值在何处。
取值在何处 数数 据据 模模 型型 决决 策策16方差方差Variance 2 如果离散型随机变量如果离散型随机变量X以概率以概率pi取值取值xi((i=1,,2,,…),则),则X的方差定义为:的方差定义为: x2 = Var((X))= ∑((xi - ))2 pi 方差是反映随机变量取值的另一个非常重要的数字特征,方差是反映随机变量取值的另一个非常重要的数字特征,它反映的是随机变量取值的它反映的是随机变量取值的变异特征(离散特征)变异特征(离散特征),即随机变,即随机变量就其量就其“平均而言平均而言”取值偏离其期望值的程度的大小取值偏离其期望值的程度的大小标准差标准差Standard deviation x = Var((X)) 数数 据据 模模 型型 决决 策策173.5 随机变量之和随机变量之和1、协方差与相关系数、协方差与相关系数 在管理科学中,我们常常都会发现随机变量之间并不总是在管理科学中,我们常常都会发现随机变量之间并不总是保持相互独立地。
如果你希望作股市投资决策的话,会发现上保持相互独立地如果你希望作股市投资决策的话,会发现上证指数与深圳成分指数并不独立,而实际情况是绝大多数情况证指数与深圳成分指数并不独立,而实际情况是绝大多数情况下上证指数上升时,成分指数也有一定程度的增加,这是因为下上证指数上升时,成分指数也有一定程度的增加,这是因为它们之间存在着某种相互关系,而这种关系常常是它们之间存在着某种相互关系,而这种关系常常是“正向正向”的,的,即即基本基本保持相同的升降趋势,通常称之为保持相同的升降趋势,通常称之为“正相关正相关”也许你还会发现股市指数与银行利率这两个随机变量之间是还会发现股市指数与银行利率这两个随机变量之间是“反向反向”的,即的,即“负相关负相关”的 数数 据据 模模 型型 决决 策策18两个随机变量之间的相关性两个随机变量之间的相关性下面我们来看一个例子下面我们来看一个例子 在一个旅游风景区的某商店出售的商品中的两种:太阳镜在一个旅游风景区的某商店出售的商品中的两种:太阳镜和雨伞X——太阳镜每天的销售量,太阳镜每天的销售量,Y——雨伞每天的销售量。
雨伞每天的销售量根据过去的销售数据知道一天中,太阳镜和雨伞的销售量以及根据过去的销售数据知道一天中,太阳镜和雨伞的销售量以及其概率分布如下表:其概率分布如下表: 数数 据据 模模 型型 决决 策策X35788130162935145246Y411001342221261123p0.10 0.15 0.05 0.01 0.20 0.05 0.10 0.10 0.10 0.0519两个随机变量之间的相关性两个随机变量之间的相关性 根据以上数据资料绘制的散布点图根据以上数据资料绘制的散布点图 数数 据据 模模 型型 决决 策策XY x y20协方差协方差Covariance xy 如果离散型随机变量如果离散型随机变量X与与Y分别有期望值分别有期望值 x 与与 y ,则,则X与与Y之间的协方差定义为:之间的协方差定义为:Cov((X,,Y))= xy = ∑∑ ((xi - x)) ((yi - y)) pij 协方差与方差的关系与区别协方差与方差的关系与区别 方差反映的是单个随机变量的离散程度,而协方差反映的方差反映的是单个随机变量的离散程度,而协方差反映的是两个随机变量之间的离散程度。
协方差是方差概念的推广是两个随机变量之间的离散程度协方差是方差概念的推广相关系数相关系数Coefficient of Correlation rCorr((X,,Y))= r = Cov(( ))= 数数 据据 模模 型型 决决 策策X - x ,,Y - y x y Cov((X,,Y)) x y21两个随机变量之间的相关与独立两个随机变量之间的相关与独立 关于随机变量之间的相关与独立,有一点是我们必须牢记关于随机变量之间的相关与独立,有一点是我们必须牢记的:的: 若两个随机变量相互独立若两个随机变量相互独立 不相关;不相关; 若两个随机变量若两个随机变量不相关不相关 相互独立相互独立 数数 据据 模模 型型 决决 策策222、联合概率分布,边缘分布、联合概率分布,边缘分布 两个离散型随机变量的概率分布称为联合概率分布,表示两个离散型随机变量的概率分布称为联合概率分布,表示如下:如下: 数数 据据 模模 型型 决决 策策23随机变量之和的数字特征随机变量之和的数字特征若随机变量若随机变量 Z = X + Y ,则有:,则有: E((Z))= E((X+Y))= ∑∑((xi + yj))pij = x + y Var((Z))= Var((X+Y))= ∑∑((xi + yj))2 pij = x2 + x2 + 2 xy 若随机变量若随机变量 Z = aX + bY ,则有:,则有: E(( aX + bY ))= a x + b y Var(( aX + bY ))= a2 x2 + b2 x2 + 2ab xy = a2 x2 + b2 x2 + 2ab x y r 数数 据据 模模 型型 决决 策策243、简单组合投资的风险分析、简单组合投资的风险分析案例案例—— 有人有一笔资金,准备投资于两个方面,电影院与电视机有人有一笔资金,准备投资于两个方面,电影院与电视机厂。
已知投资电影院和电视机厂的厂已知投资电影院和电视机厂的平均平均年回报率是相同的,都年回报率是相同的,都是是10% ,但是其回报率的标准差却不同,分别为,但是其回报率的标准差却不同,分别为 0.08 和和 0.04 此外,如果电视机厂的效益好时,卖出的电视机多,这势必此外,如果电视机厂的效益好时,卖出的电视机多,这势必影响电影业因此,这两个行业存在着影响电影业因此,这两个行业存在着“负相关性负相关性”,分析知,分析知其相关系数为其相关系数为 – 0.75 问题是我们应该如何对这两个方面进问题是我们应该如何对这两个方面进行行组合投资组合投资,即投资于各个方面的资金比例应为多少?才能使,即投资于各个方面的资金比例应为多少?才能使得总风险最小,即总年回报(收益)的方差最小得总风险最小,即总年回报(收益)的方差最小 数数 据据 模模 型型 决决 策策253、简单组合投资的风险分析、简单组合投资的风险分析案例分析案例分析——我们以总投资金额我们以总投资金额 1 元进行分析元进行分析 假定投资人应该拿出比例假定投资人应该拿出比例 a 投资于电影院,则他投资于电投资于电影院,则他投资于电视机厂的比例就是(视机厂的比例就是(1 – a )。
设:设:X——电影院的年回报(收益)电影院的年回报(收益) Y——电视机的年回报(收益)电视机的年回报(收益) 则:则:Z = aX + ((1- a ))Y E((X))= 1.10 ,, E((Y))= 1.10 E((Z))= 1.10 x = 0.08,, y = 0.04,,r = - 0.75 Var((Z))= z2 = 0.0064a2+0.0016((1- a))2- 0.0048a((1- a )) 数数 据据 模模 型型 决决 策策26第四章第四章 连续型概率分布连续型概率分布4.1 连续型随机变量连续型随机变量 连续型随机变量的特点连续型随机变量的特点1、在某个区间(或整个数轴)上连续取值,、在某个区间(或整个数轴)上连续取值,2、取值落入某个区间存在概率,而取某点值的概率为、取值落入某个区间存在概率,而取某点值的概率为 0,,3、用概率密度函数、用概率密度函数 f((u)来描述取值在某点附近的密集程度。
来描述取值在某点附近的密集程度4、概率分布函数、概率分布函数F((t)为密度函数在区间()为密度函数在区间(0,,t 上的积分,上的积分,即表示随机变量即表示随机变量 X 落入落入((0,,t 上的概率:上的概率: 数数 据据 模模 型型 决决 策策F((t))= P((X ≤ t ))=∫ f((u))dut0274.2 若干连续型概率密度函数若干连续型概率密度函数1、均匀分布模型(、均匀分布模型(uniform distribution model)) 随机变量随机变量 X 等可能地取有限区间(等可能地取有限区间(a,,b)中的任何一个值,)中的任何一个值,则称则称 X 服从区间(服从区间(a,,b)上的均匀分布通常记为:)上的均匀分布通常记为:X ~~U[ a,,b ]其密度函数为:其密度函数为: 数数 据据 模模 型型 决决 策策 1b - a 0a ≤ t ≤ b其它其它f((t))=E((X))= a+b 2 Var((X))= ((b – a))2 12 282、指数分布模型(、指数分布模型(exponential distribution model)) 指数分布是指数分布是Poisson分布的另一种描述形式,是排队系统分布的另一种描述形式,是排队系统中及其常见的一种分布,其密度函数和分布函数为:中及其常见的一种分布,其密度函数和分布函数为: 数数 据据 模模 型型 决决 策策 e - t t ≥ 0 (( >> 0))0 t << 0 f((t))=1- e - t t ≥ 0 (( >> 0))0 t << 0 F((t))=E((X))= 1/ Var((X))= 1/ 2 293、正态分布模型(、正态分布模型(normal distribution model)) 这种分布是概率统计的理论与应用中最重要的一种分布。
这种分布是概率统计的理论与应用中最重要的一种分布事实上,在各种应用中如此频繁的遇到它,以至于人们才将其事实上,在各种应用中如此频繁的遇到它,以至于人们才将其称为称为“normal”正态分布自从正态分布自从16世纪起,它就一直在概率中世纪起,它就一直在概率中扮演着一个重要的角色扮演着一个重要的角色 正态分布由两个参数,它的数学期望正态分布由两个参数,它的数学期望 与方差与方差 2 完全确完全确定其形状定其形状——钟形密度函数曲线钟形密度函数曲线 随机变量随机变量 X 服从正态分布表示为:服从正态分布表示为:X ~~ N(( ,, )) 数数 据据 模模 型型 决决 策策30正态分布正态分布密度函数密度函数曲线曲线 数数 据据 模模 型型 决决 策策31正态分布密度函数曲线的重要特征正态分布密度函数曲线的重要特征1、钟形密度函数曲线的最高点在分布的均值、钟形密度函数曲线的最高点在分布的均值 处,处,2、、钟形密度函数曲线关于分布的均值钟形密度函数曲线关于分布的均值 对称,对称,3、相同的方差,不同的、相同的方差,不同的均值,反映出曲线的位置不同,均值,反映出曲线的位置不同,4、不同的、不同的方差,相同的方差,相同的均值,反映出曲线的陡峭程度不同。
均值,反映出曲线的陡峭程度不同 数数 据据 模模 型型 决决 策策32正态正态分布函数分布函数曲线曲线 数数 据据 模模 型型 决决 策策33正态分布的一个重要结论:正态分布的一个重要结论: 对于对于 X ~~ N(( ,, )有:)有:P(( - ≤ X ≤ + ))≈ 68 %P(( - 2 ≤ X ≤ + 2 ))≈ 95 %P(( - 3 ≤ X ≤ + 3 ))≈ 99 % 数数 据据 模模 型型 决决 策策 - - 2 - 3 - - 2 - 3 344.3 中心极限定理中心极限定理 正态分布在概率统计的应用和理论中占有极其重要地位的正态分布在概率统计的应用和理论中占有极其重要地位的另一个原因是由于另一个原因是由于“中心极限中心极限”定理,数学家为得到这一结果,定理,数学家为得到这一结果,整整奋斗了两百年,多少数学家在这两百年中围绕整整奋斗了两百年,多少数学家在这两百年中围绕“中心中心”这这一理论的研究则成为了这一定理的名称一理论的研究则成为了这一定理的名称——中心极限定理中心极限定理。
在在此,我们一提这些数学家:此,我们一提这些数学家: 德莫哇佛(德莫哇佛(De Moivre)) 拉普拉斯(拉普拉斯(Laplace)) 林德贝格(林德贝格(Lindeberg)) 勒维(勒维(Levy)) 数数 据据 模模 型型 决决 策策35简要概述简要概述中心极限定理中心极限定理 假定假定 X1,,X2,,…,,Xn 是相互独立且具有相同概率分布的是相互独立且具有相同概率分布的随机变量,称其为随机变量,称其为“ 独立同分布独立同分布”((i.i.d.——independent and identically distributed )的随机变量,设:)的随机变量,设: E(( Xi ))= ((i = 1,,2,,…,,n )) SD(( Xi ))= ((i = 1,,2,,…,,n ))则则当当n足够大足够大时时 Sn = ∑ Xi 近似服从近似服从正态分布,即正态分布,即 数数 据据 模模 型型 决决 策策inSn ~~ N(( n ,, n ))36中心极限定理中心极限定理的图形直观解释的图形直观解释 设设 Xi —— 掷第掷第 i 颗骰子所出现的点数,则有颗骰子所出现的点数,则有 数数 据据 模模 型型 决决 策策Xi123456p1/61/61/61/61/61/6如果我们如果我们掷掷 n 颗骰子,且令颗骰子,且令 Sn —— n 颗骰子的点数之和,颗骰子的点数之和,则有则有 Sn = X1 + X2 + … + Xn 37中心极限定理中心极限定理的图形直观解释的图形直观解释 Sn = X1 + X2 + … + Xnn = 1 时,时, 的分布如下图所示的分布如下图所示 数数 据据 模模 型型 决决 策策38中心极限定理中心极限定理的图形直观解释的图形直观解释 Sn = X1 + X2 + … + Xnn = 2 时,时, 的分布如下图所示的分布如下图所示 数数 据据 模模 型型 决决 策策39中心极限定理中心极限定理的图形直观解释的图形直观解释 Sn = X1 + X2 + … + Xnn = 3 时,时, 的分布如下图所示的分布如下图所示 数数 据据 模模 型型 决决 策策40。