§2.2 连续型连续型随机变量及其分布随机变量及其分布 1. 1. 连续型随机变量连续型随机变量连续型随机变量连续型随机变量 2. 2. 均匀分布均匀分布均匀分布均匀分布3. 3. 指数分布指数分布指数分布指数分布4. 4. 正态分布正态分布正态分布正态分布1 1在前面我们学习一类离散型随机变量,主要特点是它仅取有限或可数个值仅取有限或可数个值,并且取每个值的概率大于0. 但在实际问题中,我们时常需要考虑另外一类随机变量. 如:(1)随机地向区间[0,1]上投点,其落点的位置,可在[0,1]上取值;(2)日光灯泡的使用寿命可在[0, +∞)上取值等.更为重要的是,它们取每个给定值的可能性均为取每个给定值的可能性均为0. 这时,我们该怎样刻画这些随机变量呢?1. 连续型随机变量连续型随机变量2 2定义定义 设随机变量X的分布函数为F(x) ,若存在非负可积函数f (x) ,使得对于任意实数 x,都有 则称X为连续型随机变量, 称 f (x) 为X的概率密度函数(Probability Density Function),简称概率密度或密度函数. 3 3由定义可知,连续型随机变量X的分布函数F(x) 在x点的函数值等于其概率密度函数f (x) 在区间(-∞, x] 上的积分,故同时,密度函数f (x)反映了概率在 x点附近的“密集程度”,所以用密度函数描述连续型随机变量的概率分布与离散型随机变量用分布列描述,在某种意义上有相似之处。
4 4一个连续型随机变量的分布由它的密度函数所决定,F(x)的值在几何上可以表达为 t 轴以上曲线 y = f (t)以下直线 t = x以左部分的面积.5 5类似于离散型随机变量,连续型随机变量X的概率密度函数f (x)具有如下基本性质:反过来,若已知一个函数f (x)满足上述性质(1)和(2),则一定是某连续型随机变量X的概率密度函数.6 6另外,对连续型随机变量X的分布,还具有如下性质: 1. 对于任意实数 2.即X落在区间的概率为密度函数 y=f (x)与直线 x=a, x=b及 x 轴所围面积.7 73.连续型随机变量X取任一确定值a的概率为0从而即,在计算连续型随机变量X落在某一区间的概率时,可不必区分是开区间、闭区间还是半开半闭区间8 8概率为零的事件未必是不可能事件;注意注意概率为1的事件也不一定是必然事件事件A是不可能事件事件A是必然事件9 9 (1) 0≤F(x)≤1, -∞<x<+∞, (2) F(x)是 x 的单调不减函数; (3)连续型随机变量的其它若干结论1010例例: 设随机变量X的密度函数为求分布函数F(x).1111解解:f (x)的图形如图 1212从而得其图像为1313例例: 设随机变量X的密度函数为(1) 确定常数A(2) 计算概率解解 由密度函数性质1414例例: : 某批晶体管的使用寿命X(以小时计)具有密度函数任取其中5只,求:(1) 使用最初150小时内,无一晶体管损坏的概率.(2) 使用最初150小时内,至多有一只晶体管损坏的概率.1515解解 任一晶体管使用寿命超过150小时的概率为设Y为任取的5只晶体管中使用寿命超过150小时的晶体管数,则Y~故有1616练习练习1: 试确定常数a,使为某个随机变量X的概率密度,且计算事件{1.5a)=1-F(a); P(X=a)=F(a)-F(a-0)4. P(X∈A)=5. F(x)有可列个间断点, 且右连续5. F(x)连续, 且P(X=a) = 01919几种常见的连续型随机变量的分布几种常见的连续型随机变量的分布均匀分布指数分布正态分布20202. 均匀分布均匀分布定义定义:若连续型随机变量X的概率密度为则称X在区间 [a,b]上服从均匀分布.记为X~U[a,b]分布函数为 2121密度函数f (x)与分布函数F(x)的图形如图和图所示2222意义意义:: 0 a bxX“等可能”地取区间[a,b]中的值,这里的“等可能”理解为:X落在区间[a,b]中任意等长度的子区间内的可能性是相同的。
或者说X落在子区间内的概率只依赖于子区间的长度而与子区间的位置无关即X取值在[a,b]上是均匀的2323 0 a bx [ ] c d 若X在[a,b]上服从均匀分布,对区间内的任一个区间[c,d],有2424例例2 102电车每5分钟发一班,在任一时刻某一乘客到了车站. 求乘客候车时间不超过2分钟的概率.解解1:设随机变量X为候车时间,则X~U[0,5]均匀分布,故解解2 ((几何概率)0252525例例 设随机变量X服从[-1,2]区间上的均匀分布,求X的分布函数.解解如图:-12-213F(1)xf (x)(1) x < -1时, (2)-1≤x <2时, (3)2≤x时, 分布函数为分布函数为2626分布函数为3. 指数分布指数分布定义定义 若连续型随机变量X的概率密度为其中λ>0,则称X服从参数为λ的指数分布.2727指数分布的密度函数f (x)与分布函数F(x)的图形如图和图所示λ2828注注: 在应用中,寿命问题常看作近似服从指数分布. 如灯泡的寿命、动物的寿命、的通话时间等等都近似服从指数分布. 其中λ表示平均寿命的倒数.2929指数分布的无记忆性设随机变量X服从参数为λ指数分布,设s >0 , t >0,则3030即假如X表示寿命的大小,则上式表示:如果已知寿命长于s年,则再存活t年的概率与年龄s无关. 指数分布是唯一具有“无记忆性”性质的连续型分布.3131例例 设随机变量X具有概率密度试确定常数k,并求解解 由解得k=3. 于是X的概率密度为3232例例 假设某元件的寿命服从参数λ的指数分布,求它使用1000小时后还没有坏的概率. 解解 设ξ为该元件的寿命,则33334. 正态分布正态分布 正态分布最早是德莫弗()在1733研究二项分布的极限分布形式时提出的,在当时没有引起学术界的重视。
后来,高斯()在1809年,拉普拉斯()在1812年分别重新提出,所以正态分布又称为高斯分布或高斯-拉普拉斯分布.3434 正态分布是概率论中最重要的分布之一. 例如,测量的误差、一批产品的质量指标、人体的身高或体重、农作物的单位面积产量、炮弹弹着点的分布、气象中的月平均气温、湿度、降水量等都服从或近似服从正态分布. 另外,正态分布又具有许多良好的性质,许多分布可用正态分布来近似,它能描述相互独立的多个微小因素的综合效果,在数理统计中解决实际问题时用得最多的就是正态分布或与正态分布有关.3535则称随机变量X服从参数 的正态分布. 记为定义定义 若连续型随机变量X的概率密度函数为服从正态分布的随机变量又称为正态变量3636正态分布密度函数f (x)的性质与图形定义域为(-,+);对称性:关于 x= 对称;单调性:在区间(- ,)单调上升, 在区间(,+)单调下降;极值:3737凹凸性:凸弧(-,+), 凹弧(-,-)∪(+,+)渐进线:y = 0.拐点:y-+x图像:383812当σ固定而μ值改变时,曲线沿着x轴平移,形状不变. 故μ称为位置参数.3939当μ 固定而σ变小时,曲线变得陡峭,即分布越集中于μ 的附近;反之, σ变大时,曲线变得平缓,即分布越分散. 故σ称为离散参数.4040正态分布的分布函数F(x)1 x4141特别地,当 即 N(0,1) 分布称为标准正态分布,其概率密度函数为标准正态分布标准正态分布4242标准正态分布的概率密度函数图像如图所示:4343服从标准正态分布的随机变量落在区间内的概率的计算:4444由于积分 不能用常规方法计算,我们把分布函数Φ(x)的值编制成“标准正态分布表”.(1) 当 x >0时,由标准正态分布表可以查出函数Φ(x)的数值(2) 已知b求a使Φ(a)=b,反过来查标准正态分布表可得a的值. 如Φ(a,查表得a=1.96.(3) 当 x<0时,利用标准正态分布密度函数图形的对称性可得4545一般地,若X~N(0,1),则 (1) P(X=a) = 0; (2) P(X≤a) = P(Xa) = P(X≥a) = 1-Φ(a); (4) P(a1/2 所以,a>0 反查表得 故而Φ(b)=0.0495<1/2所以,b<0-b>0,反查表得 Φ(1.65)=0.9505,即 -故 5252若则故53530.9974F(x)5454可见, 服从正态分布 的随机变量X,虽然理论上可以取任意实数值,但实际上它的取值落在区间 内的概率约为68.26 %;落在区间 内的概率约为95.44 %;落在区间 内的概率99.74%. 因此,服从正态分布 的随机变量X落在区间 之外的概率约0.26%,还不到千分之三,这是一个小概率事件,在实际问题中认为它几乎是不可能发生的,这就是著名的“ 3σ”原则.它在实际中常用来作为质量控制的依据.5555例例 设X~N(μ,σ2),,P(X≤5.9)=0.758. 求μ及σ.解解反查表得:反查表得:联立解方程组得5656标准正态分布的双侧分位数设X~N(0,1),满足则称 为标准正态分布的双侧分位数或5757阴影部分面积为5858即或5959(2) 设 X~N(2,22),Y=a X+b~N(0,1). 求a,b.所以 a=1/2 b= -1(1)设X~N(μ,σ2),P(X≤-5)=0.045,P(X≤3)=0.618. 求μ及σ课堂练习课堂练习:μ= 1.76σ= 4解:(1)(2)6060。