数据决策模型

上传人:n**** 文档编号:88920581 上传时间:2019-05-13 格式:PPT 页数:35 大小:159KB
返回 下载 相关 举报
数据决策模型_第1页
第1页 / 共35页
数据决策模型_第2页
第2页 / 共35页
数据决策模型_第3页
第3页 / 共35页
数据决策模型_第4页
第4页 / 共35页
数据决策模型_第5页
第5页 / 共35页
点击查看更多>>
资源描述

《数据决策模型》由会员分享,可在线阅读,更多相关《数据决策模型(35页珍藏版)》请在金锄头文库上搜索。

1、5/13/2019,数据、模型和决策,1,第3章 连续概率分布及其应用,数据、模型和决策,5/13/2019,数据、模型和决策,2,本章目录,3.1 连续随机变量 3.2 概率密度函数 3.3 累积分布函数 3.4 正态分布 3.5 计算正态分布的概率 3.6 正态分布随机变量的和 3.7 中心极限定理,5/13/2019,数据、模型和决策,3,3.1 连续随机变量,随机变量的例子 一家钢铁厂生产的钢板的宽度 车站上为一列火车卸货的时间 随机选择的一群人的身高 波士顿地区下一个4月份的降雨量 明天中午华盛顿特区的温度 问题 如何描述连续型随机变量的分布?,5/13/2019,数据、模型和决策,

2、4,3.2 概率密度函数,一个连续型随机变量 X 的分布密度函数具有以下特征: 整个分布密度函数曲线下面的区域的面积为1; X 位于任何两个给定数值 a 和 b 之间的概率等于曲线下面从a 到 b 之间区域的面积。,5/13/2019,数据、模型和决策,5,P(aX b),随机变量 X 的概率密度函数 f(t),3.2 概率密度函数,5/13/2019,数据、模型和决策,6,均匀分布: 如果随机变量 X 可以等可能地取到a 和 b (这里 ba) 之间的任何数值,那么我们称 X 服从a 到 b的均匀分布,记为 XUa,b. 因此,它的分布密度函数为,3.2 概率密度函数,5/13/2019,数

3、据、模型和决策,7,均匀分布,0 a b t,h,f(t),服从均匀分布的随机变量 X的概率密度函数,5/13/2019,数据、模型和决策,8,3.3 累积分布函数,对给定的实数 t,连续型随机变量 X 的累积分布函数F(t)的定义是,累积分布函数的两个性质: 0 F(t) 1, F(t) 是 t 的单调增函数。,5/13/2019,数据、模型和决策,9,假设X是一个连续型随机变量,具有累积分布函数 F(t),于是有 1. 2. 3. 我们可以将符号 “” 和 “” 在任何和 X 有关的概率表达式中互换。,3.3 累积分布函数,5/13/2019,数据、模型和决策,10,均匀分布的累积分布函数

4、,假设 X 为服从a到b的均匀分布的随机变量,于是,F(t),1.0 0.8 0.6 0.4 0.2 0.0,a b t,5/13/2019,数据、模型和决策,11,假定 X 为一个连续型随机变量,分布密度函数为 f(t),于是,X 的均值、方差和标准差分别为,连续型随机变量的整体性度量指标,3.3 累积分布函数,5/13/2019,数据、模型和决策,12,3.4 正态分布,正态分布之所以获得这样的称呼,是因为它的确是一个经常出现的分布,是一个在非常多不同的应用中经常出现的一种概率分布模式。 正态分布的作用:正态分布在现代统计分析中具有非常重要的作用。,5/13/2019,数据、模型和决策,1

5、3,正态分布的概率密度函数的 图形正是人们熟悉的钟型曲线。,0,f(t),t,3.4 正态分布,5/13/2019,数据、模型和决策,14,下面是三个正态分布随机变量X, Y, 和 W 的图形,它们具有不同的均值,但有相同的标准差。,0,f(t),X Y W,整体性度量指标对分布密度函数曲线形状的影响,3.4 正态分布,5/13/2019,数据、模型和决策,15,0,f(t),W X Y,3.4 正态分布,下面是三个正态分布随机变量X, Y, 和 W 的图形,它们具有相同的均值,但有不同的标准差。,整体性度量指标对分布密度函数曲线形状的影响,5/13/2019,数据、模型和决策,16,正态分布

6、的概率密度函数,如果 X 是服从均值为 和标准差为 的正态分布的随机变量,那么 X 的概率分布密度函数为,3.4 正态分布,5/13/2019,数据、模型和决策,17,例子3.4 Valley Textile 公司每月收入率的分布(p.125) 例子3.5 Simco Foods公司在不同地区销售收入的分布 (p.126) 例子3.6 一家快餐店每天中餐销售收入的分布 (p.128) 例子3.7 全职工作的女职工的收入 (p.129),例子,3.4 正态分布,5/13/2019,数据、模型和决策,18,3.5 计算正态分布的概率,如果 X 服从正态分布,且具有均值 和标准差 , 我们将记成 X

7、 N(, ) 如果 Z 服从是一个均值为 =0 和标准差为 =1 的正态分布,则称随机变量 Z 服从标准正态分布,记成 ZN(0,1) Z 的累积分布函数为 F(z)=P(Z z) 标准正态分布表见附表A.1 找出以下标准正态分布的概率: F(1.96)=P(Z 1.96) = ? F(1.28)=P(Z 1.28) = ?,5/13/2019,数据、模型和决策,19,如果 X 为正态分布随机变量,均值为 标准差为 , 那么如下定义的随机变量 Z 服从标准正态分布:,正态分布的标准化,3.5 计算正态分布的概率,证明:,5/13/2019,数据、模型和决策,20,其中 Z 是服从标准正态分布的

8、随机变量。,如果 X 为正态分布随机变量,具有均值 和标准差 , 则,例子 假设 X 为一个正态分布随机变量,均值为 3.2,标准差为1.3, 则,3.5 计算正态分布的概率,5/13/2019,数据、模型和决策,21,例子 - 练习 3.4 KLEERCO 为汽车制造商提供引擎罩下的排放控制抽气机。如果一个抽气机在汽车行驶50000英里前出现故障,根据联邦排放方面的规定,要为车主免费更换新的抽气机。公司目前生产的抽气机的平均寿命是61000英里,标准差为9000英里。抽气机在出现故障前汽车行驶的英里数服从正态分布。,基于目前抽气机的设计,公司不得不免费为车主更换抽气机的百分比是多少? 公司生

9、产的抽气机正好在行驶了50000英里时出现故障的概率时多少? 公司生产的抽气机在汽车行驶的英里数在42000英里到57000英里之间出现故障的概率时多少? 如果随机地选取一个抽气机是有故障的概率为80,那么该汽车已经行驶的里程应该是多少?,3.5 计算正态分布的概率,5/13/2019,数据、模型和决策,22,设 X 表示抽气机发生故障前汽车已经行驶的里程数,(a) P(更换新抽气机) = P ( X 50000) = P (Z (5000061000)/9000) = P ( Z 1.22) = 0.1112 (b) P(抽气机恰好在行驶50000英里时出现故障) = P( X = 5000

10、0) = 0 (c) P(抽气机在行驶了42000英里到57000英里之间出故障) = P (42000 X 57000) = P( 2.11 Z 0.44) = 0.3300 0.0174 = 0.3126 (d) 我们希望找到 x 使得 P (X x) =0.80。根据标准正态分布表,由 P (Z z)=0.80 可知 z = 0.845。因此 x = 61000+0.845(9000)=68605 英里。,3.5 计算正态分布的概率,基于目前抽气机的设计,公司不得不免费为车主更换抽气机的百分比是多少? 公司生产的抽气机正好在行驶了50000英里时出现故障的概率时多少? 公司生产的抽气机在

11、汽车行驶的英里数在42000英里到57000英里之间出现故障的概率时多少? 如果随机地选取一个抽气机是有故障的概率为80,那么该汽车已经行驶的里程应该是多少?,5/13/2019,数据、模型和决策,23,例子 3.8 - 处理一张保单的时间,保单的处理程序 核保:评估和分类 厘定费率:定价,X: 核保一张保单需要的时间, X =150 分钟,X=30 分钟 Y: 给一张保单定价需要的时间,Y =75 分钟,Y =25 分钟,核保一张保单的时间不超过120分钟的概率是多少? 定价一张保单的时间超过25分钟的概率是多少? 核保时间的95%的分位点是多少?,3.5 计算正态分布的概率,5/13/20

12、19,数据、模型和决策,24,X: 核保一张保单需要的时间, X =150 分钟,X=30 分钟 Y: 给一张保单定价需要的时间,Y =75 分钟,Y =25 分钟,核保一张保单的时间不超过120分钟的概率是多少?,定价一张保单的时间超过25分钟的概率是多少?,3.5 计算正态分布的概率,5/13/2019,数据、模型和决策,25,核保时间的95%的分位点是多少?,我们希望确定 x 的数值,使得 P(X x)=0.95。由于,并根据表 A.1,我们知道 P(Z 1.65) = 0.95,因此,x=1.65X + X =1.65(30)+150=199.5 分钟,P(X 199.5) = 0.9

13、5,3.5 计算正态分布的概率,X: 核保一张保单需要的时间, X =150 分钟,X=30 分钟 Y: 给一张保单定价需要的时间,Y =75 分钟,Y =25 分钟,5/13/2019,数据、模型和决策,26,如果 X 为正态分布随机变量,具有均值 和标准差 , 则 P( X +) = 0.6826 P( 2 X +2) = 0.9544 P( 3 X +3) = 0.9974,如果 X 为正态分布随机变量,具有均值 和标准差 , 则 P( 1.65 X +1.65) = 0.90 P( 1.96 X +1.96) = 0.95 P( 2.81 X +2.81) = 0.995,3.5 计算

14、正态分布的概率,5/13/2019,数据、模型和决策,27,3.6 正态分布随机变量的和,假设 X 和 Y 正态分布随机变量,均值分别为 X 和 Y ,标准差分别为 X 和 Y 。假设 a、b 和 c 为3个给定的常数,定义以下随机变量 U=aX+bY+c 则 U 服从正态分布,U的均值、方差和标准差为:,5/13/2019,数据、模型和决策,28,例子 3.9 -处理一张保单的时间,签发一张保单的时间不超过180分钟的概率是多少? 签发一张保单的时间的95%的分位点是多少? 一个承保师在一天8小时内能处理完3张保单的概率是多少?,设 U=X+Y 为处理一张保单需要的总时间,于是 U = X

15、+ Y = 150+75=225 2U = 2X+ 2Y +2XYCORR(X,Y) =302+252+2(30)(25)(0.37)=2080 U =45.61 分钟,3.6 正态分布随机变量的和,X: 核保一张保单需要的时间, X =150 分钟,X=30 分钟 Y: 给一张保单定价需要的时间,Y =75 分钟,Y =25 分钟,5/13/2019,数据、模型和决策,29,签发一张保单的时间不超过180分钟的概率是多少?,签发一张保单的时间的95%的分位点是多少?,因为 P(Z 1.65) = 0.95,我们有,3.6 正态分布随机变量的和,例子 3.9 -处理一张保单的时间,5/13/2019,数据、模型和决策,30,一个承保师在一天8小时(480 分钟)内能处理完3张保单的概率是多少?,设U1, U2 和 U3 分别表示处理3张保单所需要的时间。我们已经知道 E(Ui)=225 以及 SD(Ui)=45.61 ,其中 i=1,2,3。 令 V= U1+U2 +U3 为处理完3张保单所需要的总时间。,3.6 正态分布随机变量的和,例子 3.9 -处理一张保单的时间,5/13/2019,数据、模型和决策,31,3.7 中心极限定理,假设 X1, X2, Xn 为独立同分布的

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 高等教育 > 其它相关文档

电脑版 |金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号